B GIÁO DC VÀ ÀO TO
TRNG I HC M TP.HCM
KHÓA LUN TT NGHIP
Tên đ tài:
H TR NH DANH NM KÝ SINH CÔN TRÙNG DA TRÊN
PHÂN TÍCH PH H VÙNG GEN RPB1
KHOA CÔNG NGH SINH HC
CHUYÊN NGÀNH: VI SINH - SINH HC PHÂN T
GVHD: PGS. TS. Lê Huyn Ái Thúy
ThS. Lao c Thun
SVTH : Hunh Tho Trân
MSSV : 1053010833
Khóa : 2010-2014
Bình Dng, tháng 5 nm 2014
LI CM N
u tiên cho phép em đc gi li cm n chân thành và s tri ân sâu sc ti
cô Lê Huyn Ái Thúy, cô Trng Kim Phng và thy Lao c Thun. Thy, cô
không ch truyn đt nhng kin thc quý báu mà còn dy em nhng bài hc trong
cuc sng, giúp em hoàn thin nhân cách cng nh tri thc. c bit, thy cô đã cho
em c hi tìm thy đam mê tht s và đc làm vic ht mình cho nhng điu mình
yêu thích.
Vi lòng bit n sâu sc nht, em xin gi đn quý thy cô khoa Công ngh
sinh hc nói chung và các thy cô trong chuyên ngành vi sinh – sinh hc phân t
nói riêng đã truyn đt cho em vn kin thc quý báu.
Bên cnh đó, xin gi li cm n đn các bn và các em phòng thí nghim đã
luôn giúp đ và đng viên tôi trong sut quá trình thc hin đ tài.
Cui cùng, con xin gi li cm đn cha m, đã dy d, yêu thng, nuôi nng
con khôn ln nh ngày hôm nay. Gia đình là ch da tinh thn giúp con vt qua
nhng khó khn trong cuc sng.
Em xin chúc quý thy cô di dào sc khe, gt hái nhiu thành công.
Bình Dng, tháng 5 nm 2014
Hunh Tho Trân
MC LC
1.1. TNG QUAN V NM CORDYCEPS 3
1.1.1. c đim chung 3
1.1.2. Phân loi khoa hc 3
1.1.3. Ngun gc tên gi 4
1.1.4. Các hp cht có trong Cordyceps 4
1.1.5. ng dng 6
1.2. NGHIÊN CU NH DANH 8
1.2.1. nh danh bng đc đim hình thái và phân tích gii phu 8
1.2.2. Tng quan v gen rpb1 8
1.3. NGHIÊN CU PHÁT SINH LOÀI 10
1.3.1. Ph h phân t trong nghiên cu phát sinh loài: 10
1.3.2. Nhng bc c bn trong nghiên cu phát sinh loài: 10
1.4. TÌNH HÌNH NGHIÊN CU TRONG NC 14
1.5. THU THP C S D LIU 15
1.5.1.Mc đích 15
1.5.2. Khai thác và x lý thông tin 15
1.6. CÁC PHNG PHÁP SINH HC PHÂN T 16
1.6.1.K thut PCR (Polymerase Chain Reaction) 16
1.6.2. in di 17
1.6.3. Gii trình t 17
1.7. HIU CHNH TRÌNH T (proofreading): 18
2.1. VT LIU 20
2.1.1. B mu nm ký sinh côn trùng 20
2.1.2. Dng c -thit b-hóa cht 20
2.1.3. Danh mc các phn mm và trang web trc tuyn 22
2.2. PHNG PHÁP NGHIÊN CU 22
2.2.1. Kho sát in silico 22
2.2.2. Tin hành thc nghim 23
2.2.3. Hiu chnh và phân tích kt qu gii trình t 27
3.1. C S D LIU CC B VÀ KHO SÁT IN SILICO 28
3.1.1. C s d liu cc b 28
3.1.2. Kt qu đánh giá mi 31
3.2. KT QU THC NGHIM TRÊN MU NM KÝ SINH CÔN TRÙNG36
3.1.1. Tách chit DNA và ti u hóa quy trình 36
3.1.2. Phn ng khuch đi DNA và ti u hóa quy trình 37
3.1.3. Gii trình t và hiu chnh sau gii 40
3.1.4. Kt qu so sánh vi d liu Genbank 46
3.3. KT QU DNG CÂY PHÁT SINH LOÀI 47
4.1.KT LUN 57
4.2. NGH 57
DANH MC BNG
Bng 1.1. Các chc nng ca BLAST
Bng 2.1. Các mi s dng khuch đi gen rpb1
Bng 2.2. Các thành phn trong phn ng PCR
Bng 3.1. Ngun gc các trình t rpb1 dùng tham chiu
Bng 3.2. Trình t và các thông s đánh giá mi ca IDT khuch đi gen rpb1
Bng 3.3. Kt qu đo OD tách chit DNA theo phng pháp Phenol:chloroform
Bng 3.4. Kt qu đo OD các mu DL0038B, DL0075
Bng 3.5.Tng hp kt qu hiu ch
nh trình t các mu nm ký sinh côn trùng
Bng 3.6.Kt qu chiu dài trc và sau khi hiu chnh
Bng 3.7. Kt qu so sánh trình t rpb1đã hiu chnh t vi các trình t trên
GenBank
Bng 3.8. Tng hp kt qu đnh danh mu nm t d liu phân t
DANH MC HÌNH
Hình 1.1. Mô t chc nng vùng CTD ca gen rpb1
Hình 1.2. Cu trúc vùng gen rpb1
Hình 2.1. Các thông s thi lp chu k nhit phn ng PCR khuch đi gen rpb1
Hình 3.1. Mô t kt qu Annhyb khuch đi vùng gen rpb1
Hình 3.2. Kt qu BLAST cp mi CRBP1/RBP1Cr
Hình 3.3. Kt qu đin di hai mu nm DL0038B và DL0075 tách chit theo
phng pháp phenol:chloroform
Hình 3.4. Kt qu đin di hai mu nm DL0038B và DL0075 khuch đi gen rpb1
vi Ta=53
o
C
Hình 3.5. Kt qu đin di hai mu nm DL0038B và DL0075 khuch đi gen rpb1
vi Ta=46,3
o
C
Hình 3.6. Kt qu đin di sáu mu DL006, DL0015, DL0038B, DL0069, DL0075,
DL0077 đc thc hin bng quy trình ti u
Hình 3.7. Hiu chnh tín hiu đu mch xuôi mu DL0038B
Hình 3.8. Hiu chnh tín hiu vùng đu trên 2 mch-vùng s 3
Hình 3.9. Hiu chnh vùng gia hai mch rpb1
Hình 3.10. Hiu chnh vùng cui 2 mch-vùng 4
Hình 3.11. Hiu chnh trình t cui ca hai mch
Hình 3.12. Kt qu BLAST trình t mch xuôi đã hi
u chnh
Hình 3.13. Kim tra mc đ tng đng bng công c Dot plot
Hình 3.14. Cây ph h phân t thuc nhóm Clavicipitaceae clade A dng theo
phng pháp NJ - Neighbor joining
Hình 3.15. Cây ph h phân t thuc nhóm Clavicipitaceae clade B dng theo
phng pháp ML - Maximum likelihood
Hình 3.16. Cây ph h phân t thuc nhóm Clavicipitaceae clade C dng theo
phng pháp NJ - Neighbor joining
Hình 6.1. Kt qu BLAST trình t mu DL006 đã hiu chnh
Cây ph h đnh danh 6 mu dng bng phng pháp NJ
Hình 6.2. Kt qu BLAST trình t mu DL0015 đã hiu chnh
Hình 6.3. Kt qu BLAST trình t mu DL0038B đ
ã hiu chnh
Hình 6.4. Kt qu BLAST trình t mu DL0069 đã hiu chnh
Hình 6.5. Kt qu BLAST trình t mu DL0075 đã hiu chnh
Hình 6.6. Kt qu BLAST trình t mu DL0077 đã hiu chnh
Hình 6.7. Cây ph h đnh danh 6 mu dng bng phng pháp NJ
Hình 6.8.Cây Cây ph h đnh danh 6 mu dng bng phng pháp ML
Hình 6.9. Cây ph h đnh danh 6 mu dng bng phng pháp MP
Hình 6.10. Cây ph h phân t
dng bng phng pháp ML
Hình 6.11. Cây ph h phân t dng bng phng pháp MP
Danh mc nhng ch vit tt
ATP
: Adenosine triphosphate
BLAST
: Basic Local Alignment Search Tool
Bp
: base-pair
DNA
: deoxyribonucleotide triphosphate
LSU
: large subunit
ML
: maximum likelihood
MP
: maximum parsimony
NJ
: neighbor-joining
Nu
: nucleotide
rDNA
: ribosomal DNA
RNA
: ribosomal RNA
rRNA
: ribosomal RNA
SSU
: small subunit
TBE
: Tris, Borate, EDTA
T VN
1
Cordyceps là nm ký sinh côn trùng nh sâu bm, côn trùng cánh cng,
b xít, chun chun, ve su, kin, nhn Các loài nm thuc chi Cordyceps có
nhiu ng dng trong lnh vc y dc, vì nm có cha các hot cht có kh nng
điu hòa đáp ng min dch, c ch t bào ung th [35][22]; ci thin chc nng
phi, thn [48]. Hin nay trên th trng các sn phm t nm có giá tr v dc
tính khác nhau và mi loài li có giá tr cha tr riêng tng loi bnh. Do đó,
vic xác đnh loài trong chi này là rt cn thit. Tuy nhiên, vic đnh danh loài
nm Cordyceps là rt khó khn bi chúng có hình thc sinh sn hu tính
(teleomorph) và hình thc sinh sn vô tính (anamorph). Ngoài ra chúng còn
chu tác đng ca môi trng nên có th bin thành dng d hình thái khin các
nhà phân loi nhm ln. Do đó, cùng mt ging loài có các tên khác nhau. Ví
d, Metacordyceps taii là tên khác ca Metarhizium anisopliae hay Cordyecps
congfragosa còn tên gi khác là Lecanicillium lecanii [42]. Hin nay, s kt hp
gia sinh hc phân t và tin sinh hc đã góp phn tích cc trong vic gii quyt mt
cách hu hiu nhng vn đ khó khn trên. Ngoài ra s kt hp này còn giúp xác
đnh mt cách chính xác loài và h thng phát sinh loài ca nhóm nm này da vào
vic xây dng cây ph h trên các trình t có tính đc trng cho các chi và các loài
nm. in hình nh Sung và cs nghiên cu theo hng các gen thuc nhóm gen gi
nhà (house-keeping-genes) xây dng h thng phát sinh loài [42] hay các gen đc
s dng đ phân tích ph h phân t trong d án AFTOL (Assembling the Fungal
Tree of Life) [53]. Trong đó có gen rpb1 (rpb1 là vùng gen mã hóa protein RNA
polymerase II). Tiu phn 1 này cha các exon có đ bo tn có ý ngha trong tin
hóa và phân loi các loài nm. Xut phát t các vn đ trên đ tài: “H tr đnh
danh nm ký sinh côn trùng da trên phân tích ph h vùng gen rpb1” đc thc
hin. tài nghiên cu trên c s phân tích trình t gen rpb1 vi nhng mc tiêu và
phng pháp sau: (1) kho sát in silico - thu thp trình t to c s d li
u cc b
gen rpb1, đánh giá cp mi đ khuch đi gen rpb1 da theo các ch tiêu; (2) tin
hành thc nghim xây dng quy trình tách chit DNA t h si nm, ti u hóa chu
trình PCR đ khuch đi vùng gen mc tiêu, gii trình t, xây dng và so sánh các
cây ph h phân t t c s d liu trình t thu thp đc.
2
Hy vng vi nhng kt qu thu đc đ tài s cung cp thêm mt phng
pháp nhm h tr đnh danh nm ký sinh côn trùng.
PHN 1. TNG QUAN
3
1.1. TNG QUAN V NM CORDYCEPS
1.1.1. c đim chung
Cordyceps (thuc h Clavicipitaceae) là nm ký sinh côn trùng và đi din
là nm Cordyceps sinensis gây nhim trên sâu Hepialus armoricanus.
Vit Nam và Trung Quc, C.sinensis đc gi vi tên thông thng là
đông trùng h tho.
C.sinensis có gc gn vi đu ca sâu, có hình ging nh gy đánh khúc
quân cu, đu có dng hình chùy (ging Cordyceps xut phát t ting
Latinh, Cord = chùy, ceps = đu). Nm dng qu th có màu nâu đen hoc
màu đen, dài khong 4-11cm, trng lng khong 0,06g. Khi thành thc s
phát tán các bào t ra xung quanh khong vài cm, nu gp gió có th phát tán
cao hn. Nm ông trùng h tho ch đc phát hin vào mùa hè mt s cao
nguyên có đ cao t 3.500 m đn 5.000 m so vi mt bin; đó là các vùng Tây
Tng, T Xuyên, Cam Túc, Vân Nam [1].
1.1.2. Phân loi khoa hc
Cordyceps (Fr) Link sensu lato (s. l) hay Clavicipitaceae bao gm 400-500
loài [54]. Theo Kobayasi 1941, 1982 đã chia Cordyceps s. l thành 3 chi ph
(subgenera) và 7 nhóm nh (subsection) da vào đc đim hình thái gii phu
[23][24].
Tuy nhiên đn nm 2007 Sung và cs đã phân tích ph h phân t da vào by
gen gi nhà, tác gi đã tái phân chia Cordyceps s. l thành 4 chi (genera) –
Cordydyceps sensu stricto (s. s.), Metarcordyceps, Elaphocordyceps và
Ophiocordyceps. Bn chi này nm trong 3 h (families) – Clavicipitaceae,
Cordycipitaceae, Ophiocordycipitaceae [42]. Trong các h này ngoài các chi k
trên còn mt s chi khác nh: (1) Clavicipitaceae gm Hypocrella, Regiocrella và
Torrubiella; (2) Cordycipitaceae gm chi: Ascopolyporus, Hyperdermium,
Torrubiella,
4
1.1.3. Ngun gc tên gi
Nm 1878, nhà khoa hc Pier Andrea Saccarado đã công b nm này tên gi
là Cordyceps sinensis (Berk) Sacc [38]. Nm này ký sinh trên u trùng các loài
bm thuc chi Thitarodes. Thng d gp nht sâu non loài Thitarodes
baimaensis hoc Thitarodes armoricanus, ngoài ra còn 46 loài khác thuc chi
Thitarodes cng có th b Cordyceps sinensis ký sinh.
Vào cui mùa thu, các cht trên da ca sâu non tng tác vi các bào t nm
và to ra các si nm, các si nm đâm sâu vào u trùng, coi chúng là cht dinh
dng đ phát trin. n đu mùa hè n
m sau, nm phát sinh mnh và gây cht sâu,
sau đó chúng hình thành chi, phát trin chui ra khi mt đt, nhng gc vn dính
vào đu sâu. Do đó nhiu ngi gi là nm ông trùng h tho bi vì mùa đông
nm sng trong c th côn trùng, mùa hè thì nm phát trin ra ngoài c th ging
nh cây c [46]. Chính vì đc đim sinh trng này đã gây nhm ln v tên gi ca
chi nm này. Vào mùa đông vì đi
u kin khí hu khc nghit-nhit đ và m đ
không khí thp nm ký sinh dng h si, hình thc sinh sn vô tính (anamorph) vi
bào t dng đính. Vào mùa hè, điu kin môi trng thun li nhit đ, m đ cao
nm chuyn thành hình thc sinh sn hu tính (teleomorph) hình thành qu th. Do
đc đim hình thc sinh sn nêu trên nên mt s chi nm có h lng danh [6].
1.1.4. Các hp cht có trong Cordyceps
1.1.4.1. Nhng thành phn dinh dng chung
Cordyceps cha mt lot các hp cht dinh dng. Nó cha tt c các acid
amin, vitamin B
1
, B
2
, B
12
, E và K, mt lot các loi đng bao gm mono, di
và oligosaccharide và rt nhiu các polysaccharides, protein, sterol, nucleoside
và mt lot các yu t khác (K, Na, Ca, Mg, Fe, Cu, Mn, Zn, Pi, Se, Al, Si, Ni,
Sr, Ti, Cr, Ga, V và Zn) [18].
5
1.1.4.2. Các cht hot tính sinh hc chính
Cordycepin [3’-deoxyadenosine] và acid Cordycepic [d-manito] là nhng
hp cht ban đu đc tách chit t loài Cordyceps militaris. Cyclosporin là
cht c ch min dch tìm thy trong Cordyceps, đc s dng cho vic cy
ghép các b phn trên c th ngi, có ngun gc t các loài Cordyceps
subsessilis (dng vô tính: Tolypocaldium infalatum). Nhng hp cht c ch
min dch khác đc tìm thy trong mt loài liên quan mt thit
đn Cordyceps có tên là Isaria Sinclarii. Nhng thành phn khác đc tìm thy
bao gm saccharides, polyssaccharides có s đa dng và phc tp. Rt nhiu
nucleosides đã đc tìm thy trong Cordyceps, bao gm uridine, mt vài cu
trúc tiêu biu ca deoxyuridines, adenosine, 2’3’ dideoxyadenosine (đc đa
ra th trng khp th gii nh là cht antiretroviruses ban đu cho điu tr lây
nhim HIV di các tên nh Didannosine, Videx,…) [1].
1.1.4.3. Polysaccharides
Mt s các polysaccharides và các cht dn xut dng khác nh là acid
cordycepic [d-mannito] đã đc tìm thy và xác đnh hot tính dc lý. Nhng
polysaccharides này có hiu qu trong vic điu tit đng trong máu, chng di
cn và hiu qu chng ung th và tng cng min dch [35][22].
1.1.4.4. Proteins và các hp cht Nitragenous
Cordyceps cha protein, peptide và tt c các acid amin thit yu khác,
Cordyceps cha mt s dipeptide cyclic không ph bin bao gm cyclo -[Gly-
Pro], cyclo - [Leu-Pro], cyclo -[Ala-Leu], cyclo - [Ala-Val] và Cyclo - [Thr-
Leu]. Khi lng nh các polyamine bao gm 1,3 diamino propane, cadaverine,
spermidine, spermine và pustrescine đã đc nhn dng và nhn đnh chúng có
tác dng kháng sinh [18].
1.1.4.5. Sterols
Mt s hp cht loi sterol đã đc tìm thy trong Cordyceps gm
ergosterol, Delta - 3 ergosterol, ergosterol peroxide, 3-sitosterol, daucosterol và
6
campasterol Các hp cht này có liên quan ti sex-steroid chng ri lon tình
dc[45] nh hng đn ham mun và chc nng tình dc, tác đng ti h thng
hormon tình dc-trc hypothalomo-pituitary-adrenocortical hoc trc tip tác
đng lên c quan sinh dc [50].
1.1.4.6. Các thành phn cu to khác
28 acids béo đã đc bão hòa hay cha bão hòa và các cht dn xut ca
chúng đã đc tách chit t C. sinensis. Hp cht phân cc ca chit
xut Cordyceps bao gm rt nhiu hp cht hydrocarbon, alcohol và aldehyde.
Trong đó có cht hydrocarbon aromatic polycylic (PAH) đc sn xut bi
Cordyceps sinensis nh là cht chuyn hóa th cp.
1.1.5. ng dng
1.1.5.1. Y-dc
Các nghiên cu y hc và dc hc đã chng minh đc nm ông trùng h
tho Cordyceps có nhng tác dng sau: kìm hãm s phát trin ca t bào ung th
máu [26][36], ung th phi, ung th vú [19]. Nhiu nghiên cu cng đã chng
minh nm có hiu qu trong cha tr ri lon chc nng ca gan [33], s lão hoá,
các chng viêm [47]. Ngoài ra nm còn có tác dng kìm hãm s oxy hoá ca lipid,
lipoprotein và lipoprotein t trng thp [8]…
Vi nhng tác dng trên thì nm ông trùng h tho còn trc tip nh hng
đn mt s h thng quan trng trong c th .
H thng min dch
Cordyceps có tác dng điu tit min dch ca c th và ngn nga bnh.
ông trùng h tho giúp tng cng kh nng min dch bng cách tng t bào
lympho, các t bào git t nhiên, sn xut các interleukin, interferon và các
nhân t hoi t khi u [25][29]. Cordyceps còn đc s dng đ c ch min
dch c th là kim soát các ri lon t min dch và viêm khi xy ra tn thng
mô, cng nh đ ngn chn thi ghép sau khi cy ghép ni tng [44]. Ngoài ra
7
Cordyceps còn gây c ch và tác đng lên h min dch thông qua điu chnh min
dch bm sinh và đáp ng min [28][34].
H thng tun hoàn tim, não
Nm đông trùng h tho có tác dng làm giãn mch máu, làm tng lu lng
tun hoàn máu não và tim [21]. Mt khác, nm còn có kh nng điu chnh lipit
máu, làm gim lng cholesterol và lipoprotein, hn ch quá trình tin trin ca
tình trng x va đng mch [48].
H hô hp
Cordyceps có tác dng vi nhiu bnh v phi: hp ph qun, viêm ph qun,
lao, hen và phòng chng khí ph thng. Nm có tác dng chng viêm và đc tr vi
bnh hen ph qun, tng s lu thông không khí trong phi do đó gim nh các cn
hen [49].
H thng ni tit
Theo Chen và cs cho bit nm ông trùng h tho có tác dng làm tng
trng lng tuyn v thng thn và tng tng hp các hormon tuyn này, đng
thi nm có tác dng tng t nh hormon nam tính và làm tng trng lng tinh
hoàn cng nh các c quan sinh dc ph trên đng vt thc nghim. Ngoài ra nm
còn có tác dng chng ung th, chông viêm nhim, chng quá trình lão hoá và trn
tnh chng co git [10].
1.1.5.2. Kim soát sinh hc
Nm kí sinh côn trùng là thiên đch ph bin ca các loài chân khp trên khp
th gii và đc xem nh là các đi tng kim soát sinh hc [14][40]. Nhóm nm
này có s phân b rng, tính đa dng các loài nm côn trùng tùy thuc vào điu kin
môi trng, tính đa dng ca các loài côn trùng và tình trng ca ký ch [23].
Nhiu loài nm côn trùng đã đc ng dng rng rãi trong đu tranh sinh hc
kim soát dch hi, trong đó ph bi
n là các loài Beauveria bassiana, Metarhizium
anisopliae và Normurea rileyi. Trong đó Beauveria bassiana hay còn gi là nm
8
bch cng, ký sinh trên sâu bm và côn trùng cánh cng; Metarhizium anisopliae
hay nm lc cng chính là th vô tính ca Cordyceps brittlebankosoides[30]; còn
Normurea rileyi là nm bt gây bnh trên sâu đc thân, sâu cun lá, sâu keo và sâu
phao. Theo Taborsky (1992), ng dng đu tiên s dng Metarhizium anisopliae
cho đu tranh sinh hc đc thc hin vào nm 1888 bi Krassilstchik [43].
Ti Vit Nam, nhiu nghiên cu đã thành công trong vic s dng nm côn
trùng phòng tr các loi côn trùng và sâu hi cây trng, đin hình nh n
m
Metarhizium anisopliae và Beauveria bassiana đã đc ng dng trong phòng tr,
sâu hi đu tng và đu xanh [7],
ry mm và các loài sâu hi lúa [4].
1.2. NGHIÊN CU NH DANH
1.2.1. nh danh bng đc đim hình thái và phân tích gii phu
Trc đây, vic đnh danh và xây dng h thng hc các loài nm này ch yu
da trên phân tích hình thái gii phu nh cu trúc th sinh sn, dng bào t , hình
dng qu th, màu ca cht nn Nm 1982, Kobayashi trên c s x lý các thông
tin t vic phân tích 282 loài Cordyceps, 59 loài Torrubiella và 75 loài thuc v các
chi lân cn khác đã xây dng nên khóa đnh loi cho nhóm Cordyceps và
Torrubiella [24]. Khóa đnh loi này đn nay vn
đc xem là hu hiu nht đ
đnh danh nhóm nm này theo phng pháp c đin.
Vic phân loi nm mt cách chính xác là mt công vic khó khn. Nhng
phân tích hình thái qu th và côn trùng ch mà nm ký sinh không th đa ra kt
lun chính xác v loài. Nm tuy có cu trúc đn gin nhng li có thành phn loài
vô cùng phong phú. Mt khó khn khác là đc đim lng danh ca chúng. Ví d
nh Tolypocladium inflatum đã đc Hodge và cs ch
ng minh đây là mt th vô
tính ca C. subsessilis.
Do đó, nghiên cu v mt phân t kt hp tin sinh hc là xu hng mi giúp
h tr đnh danh chính xác hn, c th trong phm vi đ tài là tp trung phân tích,
so sánh các trình t DNA ca các vùng gen rpb1.
1.2.2. Tng quan v gen rpb1
9
Rpb1 (largest subunit of RNA polymerase II – tiu đn v ln nht ca
RNApolymerase II) là vùng gen mã hóa cho tiu phn ln nht ca protein RNA
polymerase II. ây là enzyme xúc tác quá trình sao mã RNA t DNA Eukaryote.
Gen này có cha vùng carbon đu cui là 52 vùng lp li heptapeptide có chc
nng quan trng trong s hot đng ca enzyme RNA polymerase. Vùng lp li
này còn đc gi là CTD (C-terminal domain) gm các acid amin lp li giàu
Serin (Tyrosine-Serine-Proline-Threonine-Serine-Proline-). Ser 5 là v trí
phosphoryl hóa bi hot đng kinase ca TFIIH, kích hot enzyme RNA
polymerase II chuyn dch qua promotor và phiên mã.
Hình 1.1. Mô t chc nng ca vùng CTD ca gen rpb1 [16]
Rpb1 có trng lng phân t khong 220kDa, chiu dài khong 3Kbp có cha các
vùng exon có đ bo tn cao đc th hin trong hình 2 (vùng tô đen là các exon) [51].
Hình 1.2. Cu trúc vùng gen rpb1 [52]
Gen rpb1 thng đc s dng trong nghiên cu phân tích ph h sinh vt
nhân thc nh thc vt, đng vt, nm. a s gen rpb1 các loài ch có mt bn
sao ch tr mt vài loài thc vt và loài Trypanosome cha gen paralogous [37].
Mt s công trình nghiên cu s dng gen rpb1 đ h tr cho vic nghiên
cu phát sinh ph h:
10
Croan và cs đã s dng gen rpb1 đ vic nghiên cu mi quan h hàng gia
các loài nm Leishmania. Tác gi đã so sánh trình t gen gia DNA và RNA
polymerase[12]. Hn th có th s dng rpb1 đ phân tích phát sinh loài mc sâu
hn. Theo Hirt và cs đã s dng trình t gen rpb1 đ chng minh Microsporidia
(sinh vt hoi sinh hoc kí sinh) có quan h gn vi gii nm [17]. Tác gi
Matheny và cs đã s dng vùng gen rpb1;
rpb1 kt hp rpb2 so sánh vi vùng gen
mã hóa cho ribosome-nLSU đ ci thin và m rng phân tích cây phát sinh loài
nm [31][32]. Do đó vic s dng gen rpb1 làm c s phân t đ tin hành nghiên
cu phát sinh loài và dng cây ph h phân t đ h tr đnh danh nm ký sinh côn
trùng là hp lý.
1.3. NGHIÊN CU PHÁT SINH LOÀI
1.3.1. Ph h phân t trong nghiên cu phát sinh loài:
Ph h phân t là nghiên cu v mi quan h tin hóa ca tp hp các trình t
gen, da vào phân tích s khác bit di truyn phân t (DNA, RNA, protein). Kt
qu phân tích phân t đc th hin qua mt cây ph h. Dng cây ph h phân t
là mt quá trình phc tp bi thc t là không th xây dng mt cây đúng nht. Tp
hp d liu phát sinh loài có th bao gm hàng trm loài khác nhau, m
t trong s đó
có th đã thay đi t l đt bin dn đn nh hng tin hóa. Do đó, hin nay có rt
nhiu mô hình tin hóa khác nhau, các phng pháp phân tích phát sinh chng loài,
dò tìm cây tin hóa ti thích cho mt phân tích phát sinh loài [21].
1.3.2. Nhng bc c bn trong nghiên cu phát sinh loài:
1.3.2.1. Chn la marker phân t và sp xp b d liu
Tùy theo mc đích dng cây ph h phân t mà xác đnh protein hay trình t
DNA s là d liu đc chn. Tip theo là phi thu thp các trình t này đ to ra
mt c s d liu cc b. Hin nay, nh có các công c trc tuyn min phí đã giúp
cho công vic này tr nên đn gin hn. Các trình t quan tâm có th ly t trang
NCBI hay các công c tìm kim tng đng khác. Khi đánh giá các trình t l
y
trong BLAST, cn chú ý ti s đim (score) và giá tr E (E-value). Mt đim s cao
11
ch ra mc đ tng đng gia các trình t vi chui trình t truy vn, giá tr E-
value biu th xác sut các trình t tng đng, giá tr E càng nh chng t đ đc
hiu càng cao [21].
1.3.2.2. c và hiu chnh trình t
Do các phân tích phát sinh chng loài da trên nhng s khác bit khi quan
sát các trình t đc so sánh thng hàng. Do đó li trình t s có th đa đn mt
cây tin hóa không chính xác. c bit vi trng hp vùng DNA có đ bo tn cao
và nhà phân tích chn mô hình tin hóa phc tp thì li trình t s cho ra kt qu có
đ sai khác rt ln. tránh trng hp li trình t do ch quan, ngi ta buc phi
đc trình t c
hai si đ vic hiu chnh sau đó đc đm bo tính khách quan hn.
1.3.2.3. Sp ct thng hàng các trình t
Vic sp ct thng hàng thng đc thc hin bng máy tính mt cách t
đng, có th dùng ClustalW đ thc hin công vic này. Tuy nhiên, vi nhng gen
hay vùng DNA kém bo tn thì quá trình sp xp thng hàng t đng rt d gây ra
li. Do đó vi gene hay vùng DNA có đ bin thiên cao cn đc trc tip thc
hin quá trình sp xp thng hàng bng mt. Vi nhng vùng không có kh nng
sp xp thng hàng thì cn phi loi b trc khi đa vào phân tích [21].
1.3.2.4. Chn la mô hình tin hóa
Trc khi chui d liu thc s đc tính toán và phân tích, chúng phi tri
qua quá trình kim tra dò tìm mô hình tin hóa thích hp. Các mô hình này da vào
quá trình đt bin ngu nhiên, chúng là kt qu thay đi trình t trong chui phân
t, mt s trong đó xy ra mt cách tình c hoc chn lc t nhiên. Cây phát sinh
loài đc gi đnh và tin hành thc hin thay th mt cách ngu nhiên
Mt vài mô hình tin hóa ngu nhiên ph bin gm ph
ng pháp phng pháp
Jukes - Cantor , phnng pháp Kimura, Hasegawa - Kishino - Yano (HKY),
Tamura Nei, General Time Reversible (GTR)
Mô hình tin hóa phc tp nht hin nay là mô hình có kh nng hi bin tng
quát theo thi gian (General time reverible model). Mô hình này thng to thành
12
dng ghép GTR+I+, kt hp bi các thông s sau: t l thông s ma trn (r(AC),
r(AG), r(AT), r(CG), r(CT), và r(GT) =1); tn sut base (A, C, G vi T =1–
(A+C+G)) và phân b gamma [21].
1.3.2.5.Phân tích s phát sinh chng loài
Vài phng pháp nhm suy lun cây phát sinh chng loài đã đc bit khá rõ hin
nay đu là nhng phng pháp kt hp thut toán dò tìm cây ti thích và mt nhóm
tiêu chun ti u chn trc. Tin trình thc hin ca nó là dò tìm nhng cây tin
hóa ti thích, sau đó nhng cây tin hóa này đc đánh giá di nhng tiêu chun
ti u chn trc đ cho ra mt cây tin hóa tt nht [27].
Dò tìm cây tin hóa ti thích
Phng pháp dò tìm cây tin hóa ti u là phng pháp kt hp thut toán dò
tìm cây ti thích nh thut toán phân nhánh và gii hn (branch- and- bound) và
thut toán t tìm tòi (heuristics) cùng vi mt nhóm tiêu chun ti u chn trc,
cây tin hóa tt nht là cây tin hóa tha mãn vi nhng tiêu chun đã đc chn
trc.
Tiêu chun ti u
Tiêu chun ti u là quá trình thit lp mô hình tt nht v lch s tin hóa da
vào nhng thông tin cha hoàn chnh ca d liu. Phng pháp s dng tiêu chun
ti u có 2 bc theo th t: u tiên là xác đnh mt tiêu chun có chc nng tính
đim cây. Bc hai là tìm mt cây thay th ng vi mt tiêu chun này ri t đó tìm
ra mt cây. Quá trình tt s cho ra nhi
u gii pháp thay th ti u.
Phng pháp Maximum parsimony (MP -hà tin ti đa)
Phng pháp tin hành đánh giá sai khác nucleotide ti tng v trí và thc hin
cho đim các cây có th. Cây tt nht là cây có tng s thay đi tin hóa (s thay th
nucleotide) ít nht. Phng pháp dò tìm cây theo thut tóan heuristics thng áp
dng cho phng pháp parsimony.
13
Phng pháp khong cách – distance method
Trong phng pháp này tng cp trình t mt s đc so sánh thng hàng cp
đôi và ng vi tng cp, khang cách di truyn có tính cng. Cây đc xây dng
bng cách tìm mt cp chui lân cn mà chúng gim thiu đ dài ca cây. Và đc
đim ca cây tin hóa dng bng phng pháp neighbor-joining là to ra mt cây
không gc.
ây là mt trong nhng phng pháp nhanh nht đ dò tìm cây tin hóa nên
nó thng đc s dng đ phân tích khi d liu ln vi nhiu taxa.
Phng pháp Maximum Likelihood
Nhóm phng pháp hp lý cc đi nhóm phng pháp này da trên mt hàm
toán hc tính toán xác sut kh nng mt cây tin hóa đc to thành t d liu đã
quan sát. Hàm này cho phép vic tích hp các quá trình tin hóa ca đc tính thành
mô hình xác sut. Phng pháp hp lý cc đi chn la cây tin hóa ti đa mà khi
quan sát các d liu di mt mô hình nào đó có xác xut ti đa.
Phân tích giá tr bootstrap
Phân tính bootstrap là mt phng pháp thng kê đ có đc s c tính v
các li sai sót khi dng cây. Phân tích bootstrap thng dùng đ kim tra đ tin cy
mt cây, c th là đánh giá đ tin cy ca s phân nhóm loài trên mt cây. Phân tích
này thng đc s dng đ kim tra các taxa đc nhóm thành cm nh th nào
da vào các trình t nucleotide hay acid amin làm mu ph [13].u đim ca
phng pháp bootstrap là nó có th áp dng cho tt c các ph
ng pháp dng cây c
bn.
14
1.4. TÌNH HÌNH NGHIÊN CU TRONG NC
Hin nay nc ta nghiên cu v nm Cordyceps đang trong giai đon mi
đt đc mt s kt qu. Vic nghiên cu mi ch mang tính cht điu tra, phát hin
và thu thp chúng trong điu kin Vit Nam.
Nm 2005, Phm Th Vng (Vin Bo v Thc vt) và Lng Vn Hà
(Vn quc gia Cúc Phng) cùng vi các nhà nm hc trng
i hc Quc gia
Kangwon, Hàn Quc tin hành điu tra nhóm nm ký sinh côn trùng ti vn quc
gia Cúc Phng. Nghiên cu s dng phng pháp so sánh hình thái gii phu đ
phân loi. Kt qu công b có các loài Cordyceps sp., C. nutans, C. pruinosa, C.
specocephala và Beauveria bassiana, Beauveria sp., Gibellalus sp., Paecilomyces
sp.[15].
Nm 2006, nhóm các nhà nghiên cu nm ký sinh côn trùng ca BIOTEC,
Thái Lan đã kt hp vi Vin Sinh hc Nhit đi kho sát nhóm nm này trong
vn quc gia Cát Tiên. Kt qu công b vào n
m 2007 cho bit h đã thu đc
tng cng 259 mu nm. S b đnh danh bng hình thái da trên h thng phân
loi mi cho thy có tng cng 41 loài đc ghi nhn thuc 17 chi bao gm
Akanthomyces, Aschersonia, Beauveria, Conoideocrella, Cordyceps, Gibellula,
Hirsutella, Hymenostilbe, Hypocrella, Isaria, Metarhizium, Moelleriella, Nomuraea,
Ophiocordyceps, Paecilomyces, Torrubiella và Verticillium. Tuy nhiên trong s này
ch ghi nhn có 1 loài thuc chi Cordyceps và 2 loài thuc chi Ophiocordyceps (Lê
Tn Hng & cs 2010)[2].
Nm 2009, Vin Khoa Hc Lâm Nghip Vit Nam và trng i hc Lâm
Nghip đã tin hành đi
u tra thu mu nm THT (Cordyceps nutans) ti khu bo
tn Tây Yên T - Sn ng - Bc Giang. Tác gi Phm Quang Thu đã thông báo
phát hin đc loài nm ông trùng h tho và đc giám đnh là loài Cordyceps
nutans. ây là loài nm đu tiên đc mô t và ghi nhn có phân b ti Vit Nam
[5].
15
Ti hi tho: “Khoa hc và công ngh phc v sn xut nông nghip, công
nghip cao ti tnh Lâm ng” (2013) có báo cáo ca Phm Quang Thu v nghiên
cu nuôi trng qu th ca ông trùng h tho [6] và ca Nguyn Mu Tun và
cng s v mt s kt qu nghiên cu nm ông trùng h tho tnh Lâm ng [3].
1.5. THU THP C S D LIU
1.5.1.Mc đích
Hin nay trên th gii có nhiu nhóm nghiên cu sinh hc hot đng trong
nhiu lnh vc khác nhau, nhu cu trao đi thông tin càng cn thit hn. Các c s
d liu trên th gii ra đi vi mc đích giúp các nhà sinh hc có điu kin trao đi
thông tin, qun lý, khai thác kho d liu sinh hc khng l. c bit vi nghiên cu
đnh danh và phân loi bng sinh hc phân t, nhu cu tham kho và chia s
thông
tin là mt trong nhng nhu cu cn thit.Các nghiên cu này cn tp hp lng d
liu mu ln, có đ tin cy. T đó mi có th thng kê chính xác, so sánh và đa ra
ra kt qu.
1.5.2. Khai thác và x lý thông tin
Hin nay có rt nhiu dng c s d liu thuc nhiu lnh vc vc sinh hc
khác nhau, trong đó d liu v sinh hc phân t luôn chim u th do tính đc thù
trong nghiên cu.
Trong nghiên cu sinh hc phân t, thng xuyên phi làm vic trên các đi
tng là nucleic acid (DNA) và protein. ây là các dng trình t sinh hc đc lu
ph bin trong các c s d liu sinh hc. Hin nay, các thông tin này đc lu tr
ch yu trong các c s d liu ln trên th gii nh h thng GenBank (NCBI,
USA), EMBL (European Molecular Biology Laboratory, UK), DDBJ (DNA
Database of Janpan, JP) và mt s h thng c s d liu khác trên th gii.
C s d liu NCBI
NCBI (National Center for Biotechnology Information) là tài nguyên quc gia
ca M v thông tin sinh hc phân t. NCBI to thành và lu tr nhng c s d