Tải bản đầy đủ (.pdf) (32 trang)

bài giảng nhập môn tin sinh học của thầy Đặng Đức Long

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.45 MB, 32 trang )

Draft version - Confidential


Giáo trình Nmôn tin sinh 


80
  
 5.1.
ADN 5.1.1.
ADN  
 Hình 5.1.

Hình 5.1ADN 


ADN 
ADN 5.1.
Draft version - Confidential


Giáo trình Nmôn tin sinh 


81

1
2
3
4
5


6
i
T
G
A
C
G
T
Tinh tinh
T
G
A
C
T
T
Kh t
C
G
A
C
T

Kh nâu
G
A
C
G


5.1: ADN  


ADN 
dài. ADN  và Tinh tinh nuclêôtít, chui ADN ca Kh t
cha 5 nuclêôtít và chui ADN ca Khi nâu ch còn cha 4 nuclêôtít. Tóm li, quá
trình tin hóa s làm cho các chung khác nhau c v ni dung
 dài.
Sp 5.1.2.
Sp hàng hai chui  và  ho chúng ta bit mi quan h gia hai chui 
và .   khác nhau, chúng ta  
hành ADN 
ADN. 


nuclêôtít
ADN 
ADN sau:
1. 

2. Các nuclêôtít 
nuclêôtít 
3. i nào 


4.  
5.2 ADN 
ADN 


Draft version - Confidential



Giáo trình Nmôn tin sinh 


82

1
2
3
4
5
6
i
T
G
A
C
G
T
Tinh tinh
T
G
A
C
T
T
Kh t
C
G
A

C

T
Kh nâu

G
A
C
G

5.2ADN h t
và Kh nâu. Ta thy có các bii  v trí 1, 5 và 6.

, chúng ta d dàng nhn thy 
n (5.3 minh
).


1
2
3
4
5
6
i
T
G
A
C
G

T
Tinh tinh
T
G
A
C
T
T
Kh t
C
G
A
C

T
Kh nâu
G
A
C
G









i

T
G
A
C
G
T
Tinh tinh
T
G
A
C
T
T
Kh t

C
G
A
C
T
Kh nâu

G
A
C
G

5.3ADN

 5.1.3.

ng ta s tìm hiu cách nh m ging nhau ca m
chui sp hàng. 
nuclêôtítnuclêôtít
Gi 






là tp n chui ADN



; 





nuclêôtítADN 


Gi 












 ng,            .    












s.

Draft version - Confidential


Giáo trình Nmôn tin sinh 


83
m ging nhau 




ca mp hàng  
    t c các cp chu       
pairs)





 









5.1

t







, và

c tính c th :



















5.2

 theo 5.1 
dng , c th là:













5.3










sau:
















5.4

Ví d: Vi ma trn m ging nhau  :
 



nuclêôtít ;
 







nuclêôtít ;
 nuclêôtít ;
tnh ADN 
 5.4
  hàng
-


1
2
3

4
5
6

i
T
G
A
C
G
T

Draft version - Confidential


Giáo trình Nmôn tin sinh 


84
Tinh tinh
T
G
A
C
T
T

Kh t
C
G

A
C

T

Kh nâu

G
A
C
G








-6
10
10
10
-6
0
18









i
T
G
A
C
G
T

Tinh tinh
T
G
A
C
T
T

Kh t
C
G
A
C

T

Kh nâu
G

A
C
G









-2
3
3
3
-9
0
-2








i
T
G

A
C
G
T

Tinh tinh
T
G
A
C
T
T

Kh t

C
G
A
C
T

Kh nâu

G
A
C
G









-6
3
3
3
-2
0
-2
5.4ADN


i 5.1.4.
      chui       
bt ( sp)
bt cp 
             
sp hàng
bt cp là: , 5.5 

 (xem 5.5).

Draft version - Confidential


Giáo trình Nmôn tin sinh 



85

XY =
AAAATTTT
TTTTGGGG
XYZ =
AAAATTTT
TTTTGGGG
AAAAGGGG
XZ =
AAAATTTT
AAAAGGGG
YZ =
AAAAGGGG
TTTTGGGG
5.5


 
sp hàng
   3 bt cp ,       5.6     

, . 



XY =
AAAATTTT
TTTTGGGG

XYZ = ?
XZ =
AAAATTTT
GGGGAAAA
YZ =
TTTTGGGG
GGGGAAAA
5.6: Ba bt cp  



Draft version - Confidential


Giáo trình Nmôn tin sinh 


86
 5.2.


 

asp hàng 























i.
ng  
5.1 bao :
  
ba 
ba là 0.

 

ba chui, nghim ta bài toán vi ba
chui tin t 




và 

c xây dng trên nghim t

 Nghim ca bài toán vi ba chui tin t 






 ài toán vi ba chui tin t 






 Nghim ca bài toán vi ba chui tin t 






 Nghim ca bài toán vi ba chui tin t 







 Nghim ca bài toán vi ba chui tin t 






 Nghim ca bài toán vi ba chui tin t 






 Nghim ca bài toán vi ba chui tin t 







  
 d liu vào.

Draft version - Confidential



Giáo trình Nmôn tin sinh 


87
Thut  ba chui ADN
D liu vào: Ba chui ADN 











; Ma
trn m  th hin m  ging nhau gia các kí t thuc tp kí t 

Yêu cu: Sp hàng ba chui  và   tm ging nhau là ln nht.
D liu ra: Ba chui ,  và  là kt qu ca vic sp hàng.
ng: Gi
 





: Chui tin t gm i nuclêôtít u tiên ca ;

 





: Chui tin t gm j nuclêôtít u tiên ca .
 





: Chui tin t gm v nuclêôtít u tiên ca .
 









 
ba






.




s
 ba 







Ta thba nuclêôtít 





:
 








 






 




 


 




 


 


nh 



















   

 








  

 









  

 






 

 






   

 









 

 








 

 









5.5



t







 



 



m ging nhau khi sp 3 kí t
Draft version - Confidential


Giáo trình Nmôn tin sinh 


88
 vào cùng mt ct trên ba chui sp hàng.


 










.

 



,






theo 5.5.

   s là nghim tt nht ca bài toán cho ba chui
. ng  thc hin chèn các d chui 
 c ba chui sp hàng , và  
5.1: Thut toán quy hong gii quy
 ADN.


  

5.7.

1
2
3
4
5
6

T
G
A
C
G
T

T
G
A
C
T
T

C
G
A
C


T



0
6
6
6
-5
6
5.7ADN  
 . Tm ging nhau là 19.

 phc tp ca thut toán quy hong cho bài toán sp hàng ba chui
là 

    .

 chui là O(



) vi 





Draft version - Confidential



Giáo trình Nmôn tin sinh 


89
n Ngôi sao 5.3.

ng ta  
.
 Ngôi sao  

vào
 so v

 cho mc
  vi các chui khác là ln nht. 






         )   





 








  






5.6

t








Th5.2.
Thut toán Ngôi sao (Star)
D liu vào: Tp 







n chui ADN
Yêu cu: S   vi tng
 ln nht.
D liu ra: chui 








là chui 




       theo   5.6    
 gi s chui trung tâm















Gi 




là  

).

 c 2: Lt sp hàng các chui 




. Vii 

vào  c thc hi
 Bt cp chui 

 chuc sp hàng 


Draft version - Confidential



Giáo trình Nmôn tin sinh 


90
3.1 c bt cp




.
 i 



thuc
  c sp hàng mi 



 cha  chui. Quy tc
chèn   các chu     




Nu mt du c chèn mi vào chui trung tâm 

khi bt cp vi



, thì    c       ng trên chui




.

 .
5.2








5.8ma trn  
 



nuclêôtít .
 








nuclêôtít .
 nuclêôtít .


1
2
3
4
5
6
7
8




A
A
T
T
T
T
T
T
104




T
T
T
T
T
T
G
G
80



G
G
A
A
T
T
T
T
80
5.8ADN 






Thuc ti



 








 








 








 là:


 











 








 












 








 










  










Draft version - Confidential


Giáo trình Nmôn tin sinh 


91



 Sp hàng các chui
 Sp hàng



 

1
2
3
4
5
6
7
8
9
10




A
A
T
T
T
T
T
T







T
T
T
T
T
T
G
G

 






1
2
3
4
5
6
7
8
9
10
11
12





A
A
T
T
T
T
T
T






G
G
A
A
T
T
T
T















trên).









5.9.

1
2
3
4
5
6
7
8
9
10
11
12





A
A
T
T
T
T

T
T









T
T
T
T
T
T
G
G



G
G
A
A
T
T
T
T





5.9









 



 

  phc t             
O(

 ), v  phc tp cc 2 là  



 





.
án Ngôi sao là 





 










.
Draft version - Confidential


Giáo trình Nmôn tin sinh 


92
  (aggressive alignment) 5.4.
 5.4.1.





 



 Hình 5.2






Hình 5.25


 . Gi 












.

 :




.

Draft version - Confidential


Giáo trình Nmôn tin sinh 


93
 












.


 
B



hai  5.4.2.



     





  





   


















, 



 :



















.

:
 




















 
 




nuclêôtít .
 







nuclêôtít .
 

nuclêôtít 
.


















1
2
3
4
5
6
7







G
G
A
T
T
G
T
G
G
A
A
G
G












A
A
G
G
T
T

A

G
G
T


Draft version - Confidential


Giáo trình Nmôn tin sinh 



94




:
 








 








 









 















 sau:









































 5.4.3.
p hàng 





 











.








.
 




; trong ví d trên là sp hàng hai chui 



:

1
2
3
4
5
6
7
8



G
G
A
A
G
G








A
A
G
G
T
T

 sp hàng



 các












 



 

.
 


 

.






1
2
3
4
5
6
7
8



G
G
A
T

T
G
T




G
G
A
A
G
G







A
A
G
G
T
T






A

G
G
T

 5.4.4.

5.3. 5.10.

Draft version - Confidential


Giáo trình Nmôn tin sinh 


95
Thut toán sn
D liu vào: Tp 






n chui ADN
Yêu cu: S  
t.
D liu ra: 







t

là chui 


c sp hàng.

 : t 










 n 
 hui.

     





.

 




i 

cha tt c các chui cp hàng 










.

 

5.3

Xét ví d tp bn chui 











:
 





















Quá trình sc minh h


1
2
3
4
5
6
7
8





G
G
A
T
T
G
T







G
G
A
A
G
G







A
A
G
G
T
T







A
G
G
T


































G
G
A
T
T
G
T

G
G
A
A
G
G


Draft version - Confidential


Giáo trình Nmôn tin sinh 


96


























A
A
G
G
T
T










A

G
G
T













Cui cùng, b



















G
G
A
T
T
G
T

G
G
A
A
G
G





A
A
G
G
T
T


A

G
G
T

5.10: M

 phc tp ca thut toán sn là 








n 

. 
 


  5.5.
ghi 
ng là 
 

 
  u ClustalW, và
 lip.
  5.5.1.
 
  prôtêin hay   ADN        

 
1. ; t
.
Draft version - Confidential


Giáo trình Nmôn tin sinh 


97
2. Các dòng tip theo s cha thông tin v i sp hàng. Mi
sc chi ra thành nhiu khi d liu. Mi khi d liu có cu trúc
:
  dòng cha  
thông tin   . Các thông tin 
sau:
 .
 .

 ); dài

 Các kí nuclêôtít
  
có trong file.
 nuclêôtít 

 

  ADN/axít amin
 
       nuclêôtít hay axít a     
IUPAC
 
 

  (identical)nuclêôtít/axít amin 
.
  (conserved substitutions):          axít
amin -.
 -conserved substitutions): 
axít amin 

Hình 5.3 


Draft version - Confidential


Giáo trình Nmôn tin sinh 



98

Hình 5.3

 lip 5.5.2.
ng 
prôtêin ADN

hân loài. nh dng d lic mô t

1. u cha hai s  ng chup hàng
 dài cp hàng.
2.     
 
 chèn thêm các  trng
các 

3.              
leaved).

Draft version - Confidential


Giáo trình Nmôn tin sinh 


99
Hình 5.4  

  .          
(interlequential)



Hình 5.4: 
 5.5.3.
 
c 
 Emboss
 Maf
 Mega
 Metafasta
 Nexus
 Pfam
 Stockholm.
Draft version - Confidential


Giáo trình Nmôn tin sinh 


100
 dùng
 Hình 5.5 

 

Hình 5.5
  5.6.

 
  Muscle.
 5.6.1.
    ClustalW     Thompson  
 [4],  
. ClustalW
  ClustalW


phân
Hình 5.6.
Draft version - Confidential


Giáo trình Nmôn tin sinh 


101

Hình 5.6



(Hình 5.7) 

Draft version - Confidential


Giáo trình Nmôn tin sinh 



102

Hình 5.7

ClustalW trên EBI
h sau:
 .
 C         
Hình 5.8.
   

Draft version - Confidential


Giáo trình Nmôn tin sinh 


103

Hình 5.8 ADN.

le 5.6.2.
 Muscle 
 [5]. Muscle 


 
  
(xem Hình 5.9) 


 Muscle nhanh 
Hình 5.9).
Draft version - Confidential


Giáo trình Nmôn tin sinh 


104
  
 trong Hình 5.9) 
Hình 5.9



Hình 5.9

Hình 5.10
www.drive5.com/muscle


×