Phân tích so sánh
các h gen ệ
Vi c so sánh h gen gi a các loài đ ngệ ệ ữ ộ
v t khác nhau là c s tr c ti p đ đánhậ ơ ở ự ế ể
giá s bi n đ i v c u trúc gen và trìnhự ế ổ ề ấ
t c a chúng xu t hi n trong quá trìnhự ủ ấ ệ
ti n hóa. Vi c so sánh các h gen nhế ệ ệ ư
v y đ ng th i cùng giúp kh ng đ nhậ ồ ờ ẳ ị
ch c ch n h n v các vùng gen mã hóaắ ắ ơ ề
protein trong m t h gen c a loài nào đó.ộ ệ ủ
Ví d nh các exon c a các gen đ ngụ ư ủ ồ
ti n hóa có m c đ b o th cao h nế ứ ộ ả ủ ơ
nhi u so v i các intron. Vi c so sánh hề ớ ệ ệ
gen ng i và chu t đã tìm th y nhi uườ ộ ấ ề
exon có tính b o th cao. Vi c so sánhả ủ ệ
gi a các h gen cũng đ ng th i giúp xácữ ệ ồ ờ
đ nh các trình t exon ng n (hay tìm th yị ự ắ ấ
ph n đ u 5’ c a gen và vùng promoterở ầ ầ ủ
li) v n th ng b sót khi xác đ nh b ngố ườ ị ị ằ
ph n m m máy tính. M t trong nh ngầ ề ộ ữ
khám phá n i b t c a phép phân tích soổ ậ ủ
sánh các h gen là vi c tìm ra s phệ ệ ự ổ
bi n c a tính b o th liên k t gi a cácế ủ ả ủ ế ữ
gen trên cùng NST. ng i và chu t,Ở ườ ộ
s b o th c a tính liên k t gi a các genự ả ủ ủ ế ữ
trên cùng NST là r t ph bi n. Trongấ ổ ế
nhi u tr ng h p, tính b o th nàyề ườ ợ ả ủ
đ c tìm th y c các loài r t xa nhauượ ấ ở ả ấ
trong quá trình ti n hóa, ví d nh loàiế ụ ư ở
cá b d t có t tiên chung v i các loàiể ẹ ổ ớ
đ ng v t có vú t 400 tri u năm tr cộ ậ ừ ệ ướ
đây. Hi n t ng ph bi n c a s b oệ ượ ổ ế ủ ự ả
th trong tính liên k t c a nhi u gen choủ ế ủ ề
th y có nhi u kh năng các gen “lángấ ề ả
gi ng” cùng dùng chung các trình t đi uề ự ề
hòa gen. M t đi u tra dùng ph n m mộ ề ầ ề
máy tính g n đây tìm th y trong m tầ ấ ộ
đo n NST có kích th c 100 - 200 kb ạ ướ ở
ru i d m Drosophila có 10 - 20 gen liênồ ấ
k t có hình th c đi u hòa s bi u hi nế ứ ề ự ể ệ
gi ng h t nhau. ru i d m có kho ngố ệ Ở ồ ấ ả
500 - 1000 đo n NST duy trì s liên k tạ ự ế
b o th này có th là do các gen liên k tả ủ ể ế
cùng ph thu c vào các trình t đi u hòaụ ộ ự ề
chung vùng NST đó.ở
Các trình t mã hóa protein không ch làự ỉ
các vùng c a h gen đ c gi i h n vủ ệ ượ ớ ạ ề
ch c năng. Các trình t đi u hòa (v tríứ ự ề ị
g n c a các y u t phiên mã và các y uắ ủ ế ố ế
t đi u hòa ho t đ ng gen, nh các y uố ề ạ ộ ư ế
t tăng c ng enhancer) th ng có tínhố ườ ườ
b o th cao. Các trình t này th ngả ủ ự ườ
đ c xác đ nh là các trình t không mãượ ị ự
hóa protein ng n và b o th . Ví d m tắ ả ủ ụ ộ
ch ng trình máy tính g i là VISTAươ ọ
(không ph i h đi u hành m i đây c aả ệ ề ớ ủ
Microsoft) khi phân tích h gen nhi uệ ở ề
loài khác nhau tìm th y s b o th tấ ự ả ủ ở ỉ
l 70% trong m t đo n trình t phân tíchệ ộ ạ ự
50 - 75 bp đ i v i m t s trình t ADNố ớ ộ ố ự
có vai trò đi u hòa. Hai loài cá b d t vàề ể ẹ
chu t cùng có kho ng 10.000 các đo nộ ả ạ
trình t không mã hóa ng n gi ng nhau,ự ắ ố
r t có th chúng là các trình t tăngấ ể ự
c ng đ c tr ng mô. Tuy v y, c haiườ ặ ư ậ ả
loài này, đ c bi t chu t, d ng nh cóặ ệ ở ộ ườ ư
nhi u trình t đi u hòa b b sót khi sề ự ề ị ỏ ử
d ng ph n m m máy tính đ phân tíchụ ầ ề ể
trình t gen. Ng i ta đã xác đ nh đ cự ườ ị ượ
loài đ ng v t b c th p Cionaở ộ ậ ậ ấ
intestialis có ch a kho ng 20.000 cácứ ả
trình t enhancer, và vì v y không có gìự ậ
là ng c nhiên n u ng i và chu t s cóạ ế ườ ộ ẽ
kho ng 50.000 - 100.000 các trình tả ự
enhancer trong h gen.ệ
Các ph ng pháp đ c s d ng đ xácươ ượ ử ụ ể
đ nh các trình t tăng c ng d a trênị ự ườ ự
vi c xác đ nh các v trí liên k t c a cácệ ị ị ế ủ
y u t ho t hóa ho c c ch phiên mã.ế ố ạ ặ ứ ế
Vi c xác đ nh đ c các trình t đi u hòaệ ị ượ ự ề
trong phân t ADN còn là thách th c l nử ứ ớ
h n so v i vi c xác đ nh đ c các trìnhơ ớ ệ ị ượ
t mã hóa protein b i các trình t đi uự ở ự ề
hòa không b h n ch b i các nguyên lýị ạ ế ở
c a mã di truy n. Vì v y, d ng nhủ ề ậ ườ ư
vi c ph i ph i h p nhi u ph ng phápệ ả ố ợ ề ươ
sinh tin h c và ch ng trình máy tính làọ ươ
c n thi t đ có th xác đ nh đ c cácầ ế ể ể ị ượ