Tải bản đầy đủ (.pdf) (83 trang)

Hỗ trợ định danh nấm ký sinh côn trùng dựa trên phân tích phả hệ vùng gen RPB1

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.65 MB, 83 trang )

B GIÁO DC VÀ ÀO TO
TRNG I HC M TP.HCM


KHÓA LUN TT NGHIP

Tên đ tài:
H TR NH DANH NM KÝ SINH CÔN TRÙNG DA TRÊN
PHÂN TÍCH PH H VÙNG GEN RPB1



KHOA CÔNG NGH SINH HC
CHUYÊN NGÀNH: VI SINH - SINH HC PHÂN T




GVHD: PGS. TS. Lê Huyn Ái Thúy
ThS. Lao c Thun
SVTH : Hunh Tho Trân
MSSV : 1053010833
Khóa : 2010-2014


Bình Dng, tháng 5 nm 2014




LI CM N


u tiên cho phép em đc gi li cm n chân thành và s tri ân sâu sc ti
cô Lê Huyn Ái Thúy, cô Trng Kim Phng và thy Lao c Thun. Thy, cô
không ch truyn đt nhng kin thc quý báu mà còn dy em nhng bài hc trong
cuc sng, giúp em hoàn thin nhân cách cng nh tri thc. c bit, thy cô đã cho
em c hi tìm thy đam mê tht s và đc làm vic ht mình cho nhng điu mình
yêu thích.
Vi lòng bit n sâu sc nht, em xin gi đn quý thy cô  khoa Công ngh
sinh hc nói chung và các thy cô trong chuyên ngành vi sinh – sinh hc phân t
nói riêng đã truyn đt cho em vn kin thc quý báu.
Bên cnh đó, xin gi li cm n đn các bn và các em  phòng thí nghim đã
luôn giúp đ và đng viên tôi trong sut quá trình thc hin đ tài.
Cui cùng, con xin gi li cm đn cha m, đã dy d, yêu thng, nuôi nng
con khôn ln nh ngày hôm nay. Gia đình là ch da tinh thn giúp con vt qua
nhng khó khn trong cuc sng.
Em xin chúc quý thy cô di dào sc khe, gt hái nhiu thành công.
Bình Dng, tháng 5 nm 2014


Hunh Tho Trân

MC LC
1.1. TNG QUAN V NM CORDYCEPS 3
1.1.1. c đim chung 3
1.1.2. Phân loi khoa hc 3
1.1.3. Ngun gc tên gi 4
1.1.4. Các hp cht có trong Cordyceps 4
1.1.5. ng dng 6
1.2. NGHIÊN CU NH DANH 8
1.2.1. nh danh bng đc đim hình thái và phân tích gii phu 8
1.2.2. Tng quan v gen rpb1 8

1.3. NGHIÊN CU PHÁT SINH LOÀI 10
1.3.1. Ph h phân t trong nghiên cu phát sinh loài: 10
1.3.2. Nhng bc c bn trong nghiên cu phát sinh loài: 10
1.4. TÌNH HÌNH NGHIÊN CU TRONG NC 14
1.5. THU THP C S D LIU 15
1.5.1.Mc đích 15
1.5.2. Khai thác và x lý thông tin 15
1.6. CÁC PHNG PHÁP SINH HC PHÂN T 16
1.6.1.K thut PCR (Polymerase Chain Reaction) 16
1.6.2. in di 17
1.6.3. Gii trình t 17
1.7. HIU CHNH TRÌNH T (proofreading): 18
2.1. VT LIU 20
2.1.1. B mu nm ký sinh côn trùng 20
2.1.2. Dng c -thit b-hóa cht 20
2.1.3. Danh mc các phn mm và trang web trc tuyn 22
2.2. PHNG PHÁP NGHIÊN CU 22
2.2.1. Kho sát in silico 22
2.2.2. Tin hành thc nghim 23
2.2.3. Hiu chnh và phân tích kt qu gii trình t 27
3.1. C S D LIU CC B VÀ KHO SÁT IN SILICO 28
3.1.1. C s d liu cc b 28
3.1.2. Kt qu đánh giá mi 31
3.2. KT QU THC NGHIM TRÊN MU NM KÝ SINH CÔN TRÙNG36
3.1.1. Tách chit DNA và ti u hóa quy trình 36
3.1.2. Phn ng khuch đi DNA và ti u hóa quy trình 37
3.1.3. Gii trình t và hiu chnh sau gii 40
3.1.4. Kt qu so sánh vi d liu Genbank 46
3.3. KT QU DNG CÂY PHÁT SINH LOÀI 47
4.1.KT LUN 57

4.2.  NGH 57

DANH MC BNG
Bng 1.1. Các chc nng ca BLAST
Bng 2.1. Các mi s dng khuch đi gen rpb1
Bng 2.2. Các thành phn trong phn ng PCR
Bng 3.1. Ngun gc các trình t rpb1 dùng tham chiu
Bng 3.2. Trình t và các thông s đánh giá mi ca IDT khuch đi gen rpb1
Bng 3.3. Kt qu đo OD tách chit DNA theo phng pháp Phenol:chloroform
Bng 3.4. Kt qu đo OD các mu DL0038B, DL0075
Bng 3.5.Tng hp kt qu hiu ch
nh trình t các mu nm ký sinh côn trùng
Bng 3.6.Kt qu chiu dài trc và sau khi hiu chnh
Bng 3.7. Kt qu so sánh trình t rpb1đã hiu chnh t vi các trình t trên
GenBank
Bng 3.8. Tng hp kt qu đnh danh mu nm t d liu phân t


DANH MC HÌNH
Hình 1.1. Mô t chc nng vùng CTD ca gen rpb1
Hình 1.2. Cu trúc vùng gen rpb1
Hình 2.1. Các thông s thi lp chu k nhit phn ng PCR khuch đi gen rpb1
Hình 3.1. Mô t kt qu Annhyb khuch đi vùng gen rpb1
Hình 3.2. Kt qu BLAST cp mi CRBP1/RBP1Cr
Hình 3.3. Kt qu đin di hai mu nm DL0038B và DL0075 tách chit theo
phng pháp phenol:chloroform
Hình 3.4. Kt qu đin di hai mu nm DL0038B và DL0075 khuch đi gen rpb1
vi Ta=53
o
C

Hình 3.5. Kt qu đin di hai mu nm DL0038B và DL0075 khuch đi gen rpb1
vi Ta=46,3
o
C
Hình 3.6. Kt qu đin di sáu mu DL006, DL0015, DL0038B, DL0069, DL0075,
DL0077 đc thc hin bng quy trình ti u
Hình 3.7. Hiu chnh tín hiu  đu mch xuôi mu DL0038B
Hình 3.8. Hiu chnh tín hiu  vùng đu trên 2 mch-vùng s 3
Hình 3.9. Hiu chnh  vùng gia hai mch rpb1
Hình 3.10. Hiu chnh vùng cui 2 mch-vùng 4
Hình 3.11. Hiu chnh trình t cui ca hai mch
Hình 3.12. Kt qu BLAST trình t mch xuôi đã hi
u chnh
Hình 3.13. Kim tra mc đ tng đng bng công c Dot plot
Hình 3.14. Cây ph h phân t thuc nhóm Clavicipitaceae clade A dng theo
phng pháp NJ - Neighbor joining
Hình 3.15. Cây ph h phân t thuc nhóm Clavicipitaceae clade B dng theo
phng pháp ML - Maximum likelihood
Hình 3.16. Cây ph h phân t thuc nhóm Clavicipitaceae clade C dng theo
phng pháp NJ - Neighbor joining
Hình 6.1. Kt qu BLAST trình t mu DL006 đã hiu chnh
Cây ph h đnh danh 6 mu dng bng phng pháp NJ
Hình 6.2. Kt qu BLAST trình t mu DL0015 đã hiu chnh
Hình 6.3. Kt qu BLAST trình t mu DL0038B đ
ã hiu chnh
Hình 6.4. Kt qu BLAST trình t mu DL0069 đã hiu chnh
Hình 6.5. Kt qu BLAST trình t mu DL0075 đã hiu chnh
Hình 6.6. Kt qu BLAST trình t mu DL0077 đã hiu chnh
Hình 6.7. Cây ph h đnh danh 6 mu dng bng phng pháp NJ
Hình 6.8.Cây Cây ph h đnh danh 6 mu dng bng phng pháp ML

Hình 6.9. Cây ph h đnh danh 6 mu dng bng phng pháp MP
Hình 6.10. Cây ph h phân t
dng bng phng pháp ML
Hình 6.11. Cây ph h phân t dng bng phng pháp MP



Danh mc nhng ch vit tt

ATP
: Adenosine triphosphate
BLAST
: Basic Local Alignment Search Tool
Bp
: base-pair
DNA
: deoxyribonucleotide triphosphate
LSU
: large subunit
ML
: maximum likelihood
MP
: maximum parsimony
NJ
: neighbor-joining
Nu
: nucleotide
rDNA
: ribosomal DNA
RNA

: ribosomal RNA
rRNA
: ribosomal RNA
SSU
: small subunit
TBE
: Tris, Borate, EDTA








T VN 
1

Cordyceps là nm ký sinh  côn trùng nh sâu bm, côn trùng cánh cng,
b xít, chun chun, ve su, kin, nhn Các loài nm thuc chi Cordyceps có
nhiu ng dng trong lnh vc y dc, vì nm có cha các hot cht có kh nng
điu hòa đáp ng min dch, c ch t bào ung th [35][22]; ci thin chc nng
phi, thn [48]. Hin nay trên th trng các sn phm t nm có giá tr v dc
tính khác nhau và mi loài li có giá tr cha tr riêng tng loi bnh. Do đó,
vic xác đnh loài trong chi này là rt cn thit. Tuy nhiên, vic đnh danh loài
nm Cordyceps là rt khó khn bi chúng có hình thc sinh sn hu tính
(teleomorph) và hình thc sinh sn vô tính (anamorph). Ngoài ra chúng còn
chu tác đng ca môi trng nên có th bin thành dng d hình thái khin các
nhà phân loi nhm ln. Do đó, cùng mt ging loài có các tên khác nhau. Ví
d, Metacordyceps taii là tên khác ca Metarhizium anisopliae hay Cordyecps

congfragosa còn tên gi khác là Lecanicillium lecanii [42]. Hin nay, s kt hp
gia sinh hc phân t và tin sinh hc đã góp phn tích cc trong vic gii quyt mt
cách hu hiu nhng vn đ khó khn trên. Ngoài ra s kt hp này còn giúp xác
đnh mt cách chính xác loài và h thng phát sinh loài ca nhóm nm này da vào
vic xây dng cây ph h trên các trình t có tính đc trng cho các chi và các loài
nm. in hình nh Sung và cs nghiên cu theo hng các gen thuc nhóm gen gi

nhà (house-keeping-genes) xây dng h thng phát sinh loài [42] hay các gen đc
s dng đ phân tích ph h phân t trong d án AFTOL (Assembling the Fungal
Tree of Life) [53]. Trong đó có gen rpb1 (rpb1 là vùng gen mã hóa protein RNA
polymerase II). Tiu phn 1 này cha các exon có đ bo tn có ý ngha trong tin
hóa và phân loi các loài nm. Xut phát t các vn đ trên đ tài: “H tr đnh
danh nm ký sinh côn trùng da trên phân tích ph h vùng gen rpb1” đc thc
hin.  tài nghiên cu trên c s phân tích trình t gen rpb1 vi nhng mc tiêu và
phng pháp sau: (1) kho sát in silico - thu thp trình t to c s d li
u cc b
gen rpb1, đánh giá cp mi đ khuch đi gen rpb1 da theo các ch tiêu; (2) tin
hành thc nghim xây dng quy trình tách chit DNA t h si nm, ti u hóa chu
trình PCR đ khuch đi vùng gen mc tiêu, gii trình t, xây dng và so sánh các
cây ph h phân t t c s d liu trình t thu thp đc.
2

Hy vng vi nhng kt qu thu đc đ tài s cung cp thêm mt phng
pháp nhm h tr đnh danh nm ký sinh côn trùng.








PHN 1. TNG QUAN
3

1.1. TNG QUAN V NM CORDYCEPS
1.1.1. c đim chung
Cordyceps (thuc h Clavicipitaceae) là nm ký sinh  côn trùng và đi din
là nm Cordyceps sinensis gây nhim trên sâu Hepialus armoricanus.
 Vit Nam và Trung Quc, C.sinensis đc gi vi tên thông thng là
đông trùng h tho.
C.sinensis có gc gn vi đu ca sâu, có hình ging nh gy đánh khúc
quân cu, đu có dng hình chùy (ging Cordyceps xut phát t ting
Latinh, Cord = chùy, ceps = đu). Nm dng qu th có màu nâu đen hoc
màu đen, dài khong 4-11cm, trng lng khong 0,06g. Khi thành thc s
phát tán các bào t ra xung quanh khong vài cm, nu gp gió có th phát tán
cao hn. Nm ông trùng h tho ch đc phát hin vào mùa hè  mt s cao
nguyên có đ cao t 3.500 m đn 5.000 m so vi mt bin; đó là các vùng Tây
Tng, T Xuyên, Cam Túc, Vân Nam [1].
1.1.2. Phân loi khoa hc
Cordyceps (Fr) Link sensu lato (s. l) hay Clavicipitaceae bao gm 400-500
loài [54]. Theo Kobayasi 1941, 1982 đã chia Cordyceps s. l thành 3 chi ph
(subgenera) và 7 nhóm nh (subsection) da vào đc đim hình thái gii phu
[23][24].
Tuy nhiên đn nm 2007 Sung và cs đã phân tích ph h phân t da vào by
gen gi nhà, tác gi đã tái phân chia Cordyceps s. l thành 4 chi (genera) –
Cordydyceps sensu stricto (s. s.), Metarcordyceps, Elaphocordyceps và
Ophiocordyceps. Bn chi này nm trong 3 h (families) – Clavicipitaceae,
Cordycipitaceae, Ophiocordycipitaceae [42]. Trong các h này ngoài các chi k
trên còn mt s chi khác nh: (1) Clavicipitaceae gm Hypocrella, Regiocrella và
Torrubiella; (2) Cordycipitaceae gm chi: Ascopolyporus, Hyperdermium,

Torrubiella,
4


1.1.3. Ngun gc tên gi
Nm 1878, nhà khoa hc Pier Andrea Saccarado đã công b nm này tên gi
là Cordyceps sinensis (Berk) Sacc [38]. Nm này ký sinh trên u trùng các loài
bm thuc chi Thitarodes. Thng d gp nht  sâu non loài Thitarodes
baimaensis hoc Thitarodes armoricanus, ngoài ra còn 46 loài khác thuc chi
Thitarodes cng có th b Cordyceps sinensis ký sinh.
Vào cui mùa thu, các cht trên da ca sâu non tng tác vi các bào t nm
và to ra các si nm, các si nm đâm sâu vào u trùng, coi chúng là cht dinh
dng đ phát trin. n đu mùa hè n
m sau, nm phát sinh mnh và gây cht sâu,
sau đó chúng hình thành chi, phát trin chui ra khi mt đt, nhng gc vn dính
vào đu sâu. Do đó nhiu ngi gi là nm ông trùng h tho bi vì mùa đông
nm sng trong c th côn trùng, mùa hè thì nm phát trin ra ngoài c th ging
nh cây c [46]. Chính vì đc đim sinh trng này đã gây nhm ln v tên gi ca
chi nm này. Vào mùa đông vì đi
u kin khí hu khc nghit-nhit đ và m đ
không khí thp nm ký sinh dng h si, hình thc sinh sn vô tính (anamorph) vi
bào t dng đính. Vào mùa hè, điu kin môi trng thun li nhit đ, m đ cao
nm chuyn thành hình thc sinh sn hu tính (teleomorph) hình thành qu th. Do
đc đim hình thc sinh sn nêu trên nên  mt s chi nm có h lng danh [6].
1.1.4. Các hp cht có trong Cordyceps

1.1.4.1. Nhng thành phn dinh dng chung
Cordyceps cha mt lot các hp cht dinh dng. Nó cha tt c các acid
amin, vitamin B
1

, B
2
, B
12
, E và K, mt lot các loi đng bao gm mono, di
và oligosaccharide và rt nhiu các polysaccharides, protein, sterol, nucleoside
và mt lot các yu t khác (K, Na, Ca, Mg, Fe, Cu, Mn, Zn, Pi, Se, Al, Si, Ni,
Sr, Ti, Cr, Ga, V và Zn) [18].
5

1.1.4.2. Các cht hot tính sinh hc chính
Cordycepin [3’-deoxyadenosine] và acid Cordycepic [d-manito] là nhng
hp cht ban đu đc tách chit t loài Cordyceps militaris. Cyclosporin là
cht c ch min dch tìm thy trong Cordyceps, đc s dng cho vic cy
ghép các b phn trên c th ngi, có ngun gc t các loài Cordyceps
subsessilis (dng vô tính: Tolypocaldium infalatum). Nhng hp cht c ch
min dch khác đc tìm thy trong mt loài liên quan mt thit
đn Cordyceps có tên là Isaria Sinclarii. Nhng thành phn khác đc tìm thy
bao gm saccharides, polyssaccharides có s đa dng và phc tp. Rt nhiu
nucleosides đã đc tìm thy trong Cordyceps, bao gm uridine, mt vài cu
trúc tiêu biu ca deoxyuridines, adenosine, 2’3’ dideoxyadenosine (đc đa
ra th trng khp th gii nh là cht antiretroviruses ban đu cho điu tr lây
nhim HIV di các tên nh Didannosine, Videx,…) [1].
1.1.4.3. Polysaccharides
Mt s các polysaccharides và các cht dn xut dng khác nh là acid
cordycepic [d-mannito] đã đc tìm thy và xác đnh hot tính dc lý. Nhng
polysaccharides này có hiu qu trong vic điu tit đng trong máu, chng di
cn và hiu qu chng ung th và tng cng min dch [35][22].
1.1.4.4. Proteins và các hp cht Nitragenous
Cordyceps cha protein, peptide và tt c các acid amin thit yu khác,

Cordyceps cha mt s dipeptide cyclic không ph bin bao gm cyclo -[Gly-
Pro], cyclo - [Leu-Pro], cyclo -[Ala-Leu], cyclo - [Ala-Val] và Cyclo - [Thr-
Leu]. Khi lng nh các polyamine bao gm 1,3 diamino propane, cadaverine,
spermidine, spermine và pustrescine đã đc nhn dng và nhn đnh chúng có
tác dng kháng sinh [18].
1.1.4.5. Sterols
Mt s hp cht loi sterol đã đc tìm thy trong Cordyceps gm
ergosterol, Delta - 3 ergosterol, ergosterol peroxide, 3-sitosterol, daucosterol và
6

campasterol Các hp cht này có liên quan ti sex-steroid chng ri lon tình
dc[45] nh hng đn ham mun và chc nng tình dc, tác đng ti h thng
hormon tình dc-trc hypothalomo-pituitary-adrenocortical hoc trc tip tác
đng lên c quan sinh dc [50].
1.1.4.6. Các thành phn cu to khác
28 acids béo đã đc bão hòa hay cha bão hòa và các cht dn xut ca
chúng đã đc tách chit t C. sinensis. Hp cht phân cc ca chit
xut Cordyceps bao gm rt nhiu hp cht hydrocarbon, alcohol và aldehyde.
Trong đó có cht hydrocarbon aromatic polycylic (PAH) đc sn xut bi
Cordyceps sinensis nh là cht chuyn hóa th cp.
1.1.5. ng dng
1.1.5.1. Y-dc
Các nghiên cu y hc và dc hc đã chng minh đc nm ông trùng h
tho Cordyceps có nhng tác dng sau: kìm hãm s phát trin ca t bào ung th
máu [26][36], ung th phi, ung th vú [19]. Nhiu nghiên cu cng đã chng
minh nm có hiu qu trong cha tr ri lon chc nng ca gan [33], s lão hoá,
các chng viêm [47]. Ngoài ra nm còn có tác dng kìm hãm s oxy hoá ca lipid,
lipoprotein và lipoprotein t trng thp [8]…
Vi nhng tác dng trên thì nm ông trùng h tho còn trc tip nh hng
đn mt s h thng quan trng trong c th .

H thng min dch
Cordyceps có tác dng điu tit min dch ca c th và ngn nga bnh.
ông trùng h tho giúp tng cng kh nng min dch bng cách tng t bào
lympho, các t bào git t nhiên, sn xut các interleukin, interferon và các
nhân t hoi t khi u [25][29]. Cordyceps còn đc s dng đ c ch min
dch c th là kim soát các ri lon t min dch và viêm khi xy ra tn thng
mô, cng nh đ ngn chn thi ghép sau khi cy ghép ni tng [44]. Ngoài ra
7

Cordyceps còn gây c ch và tác đng lên h min dch thông qua điu chnh min
dch bm sinh và đáp ng min [28][34].
H thng tun hoàn tim, não
Nm đông trùng h tho có tác dng làm giãn mch máu, làm tng lu lng
tun hoàn máu  não và tim [21]. Mt khác, nm còn có kh nng điu chnh lipit
máu, làm gim lng cholesterol và lipoprotein, hn ch quá trình tin trin ca
tình trng x va đng mch [48].
H hô hp
Cordyceps có tác dng vi nhiu bnh v phi: hp ph qun, viêm ph qun,
lao, hen và phòng chng khí ph thng. Nm có tác dng chng viêm và đc tr vi
bnh hen ph qun, tng s lu thông không khí trong phi do đó gim nh các cn
hen [49].
H thng ni tit
Theo Chen và cs cho bit nm ông trùng h tho có tác dng làm tng
trng lng tuyn v thng thn và tng tng hp các hormon tuyn này, đng
thi nm có tác dng tng t nh hormon nam tính và làm tng trng lng tinh
hoàn cng nh các c quan sinh dc ph trên đng vt thc nghim. Ngoài ra nm
còn có tác dng chng ung th, chông viêm nhim, chng quá trình lão hoá và trn
tnh chng co git [10].
1.1.5.2. Kim soát sinh hc
Nm kí sinh côn trùng là thiên đch ph bin ca các loài chân khp trên khp

th gii và đc xem nh là các đi tng kim soát sinh hc [14][40]. Nhóm nm
này có s phân b rng, tính đa dng các loài nm côn trùng tùy thuc vào điu kin
môi trng, tính đa dng ca các loài côn trùng và tình trng ca ký ch [23].
Nhiu loài nm côn trùng đã đc ng dng rng rãi trong đu tranh sinh hc
kim soát dch hi, trong đó ph bi
n là các loài Beauveria bassiana, Metarhizium
anisopliae và Normurea rileyi. Trong đó Beauveria bassiana hay còn gi là nm
8

bch cng, ký sinh trên sâu bm và côn trùng cánh cng; Metarhizium anisopliae
hay nm lc cng chính là th vô tính ca Cordyceps brittlebankosoides[30]; còn
Normurea rileyi là nm bt gây bnh trên sâu đc thân, sâu cun lá, sâu keo và sâu
phao. Theo Taborsky (1992), ng dng đu tiên s dng Metarhizium anisopliae
cho đu tranh sinh hc đc thc hin vào nm 1888 bi Krassilstchik [43].
Ti Vit Nam, nhiu nghiên cu đã thành công trong vic s dng nm côn
trùng phòng tr các loi côn trùng và sâu hi cây trng, đin hình nh n
m
Metarhizium anisopliae và Beauveria bassiana đã đc ng dng trong phòng tr,
sâu hi đu tng và đu xanh [7],
ry mm và các loài sâu hi lúa [4].
1.2. NGHIÊN CU NH DANH
1.2.1. nh danh bng đc đim hình thái và phân tích gii phu
Trc đây, vic đnh danh và xây dng h thng hc các loài nm này ch yu
da trên phân tích hình thái gii phu nh cu trúc th sinh sn, dng bào t , hình
dng qu th, màu ca cht nn Nm 1982, Kobayashi trên c s x lý các thông
tin t vic phân tích 282 loài Cordyceps, 59 loài Torrubiella và 75 loài thuc v các
chi lân cn khác đã xây dng nên khóa đnh loi cho nhóm Cordyceps và
Torrubiella [24]. Khóa đnh loi này đn nay vn
đc xem là hu hiu nht đ
đnh danh nhóm nm này theo phng pháp c đin.

Vic phân loi nm mt cách chính xác là mt công vic khó khn. Nhng
phân tích hình thái qu th và côn trùng ch mà nm ký sinh không th đa ra kt
lun chính xác v loài. Nm tuy có cu trúc đn gin nhng li có thành phn loài
vô cùng phong phú. Mt khó khn khác là đc đim lng danh ca chúng. Ví d
nh Tolypocladium inflatum đã đc Hodge và cs ch
ng minh đây là mt th vô
tính ca C. subsessilis.
Do đó, nghiên cu v mt phân t kt hp tin sinh hc là xu hng mi giúp
h tr đnh danh chính xác hn, c th trong phm vi đ tài là tp trung phân tích,
so sánh các trình t DNA ca các vùng gen rpb1.

1.2.2. Tng quan v gen rpb1
9

Rpb1 (largest subunit of RNA polymerase II – tiu đn v ln nht ca
RNApolymerase II) là vùng gen mã hóa cho tiu phn ln nht ca protein RNA
polymerase II. ây là enzyme xúc tác quá trình sao mã RNA t DNA  Eukaryote.
Gen này có cha vùng carbon đu cui là 52 vùng lp li heptapeptide có chc
nng quan trng trong s hot đng ca enzyme RNA polymerase. Vùng lp li
này còn đc gi là CTD (C-terminal domain) gm các acid amin lp li giàu
Serin (Tyrosine-Serine-Proline-Threonine-Serine-Proline-). Ser 5 là v trí
phosphoryl hóa bi hot đng kinase ca TFIIH, kích hot enzyme RNA
polymerase II chuyn dch qua promotor và phiên mã.

Hình 1.1. Mô t chc nng ca vùng CTD ca gen rpb1 [16]
Rpb1 có trng lng phân t khong 220kDa, chiu dài khong 3Kbp có cha các
vùng exon có đ bo tn cao đc th hin trong hình 2 (vùng tô đen là các exon) [51].

Hình 1.2. Cu trúc vùng gen rpb1 [52]
Gen rpb1 thng đc s dng trong nghiên cu phân tích ph h  sinh vt

nhân thc nh thc vt, đng vt, nm. a s gen rpb1  các loài ch có mt bn
sao ch tr  mt vài loài thc vt và loài Trypanosome cha gen paralogous [37].
Mt s công trình nghiên cu s dng gen rpb1 đ h tr cho vic nghiên
cu phát sinh ph h:
10

Croan và cs đã s dng gen rpb1 đ vic nghiên cu mi quan h hàng gia
các loài nm Leishmania. Tác gi đã so sánh trình t gen gia DNA và RNA
polymerase[12]. Hn th có th s dng rpb1 đ phân tích phát sinh loài  mc sâu
hn. Theo Hirt và cs đã s dng trình t gen rpb1 đ chng minh Microsporidia
(sinh vt hoi sinh hoc kí sinh) có quan h gn vi gii nm [17]. Tác gi
Matheny và cs đã s dng vùng gen rpb1;
rpb1 kt hp rpb2 so sánh vi vùng gen
mã hóa cho ribosome-nLSU đ ci thin và m rng phân tích cây phát sinh loài 
nm [31][32]. Do đó vic s dng gen rpb1 làm c s phân t đ tin hành nghiên
cu phát sinh loài và dng cây ph h phân t đ h tr đnh danh nm ký sinh côn
trùng là hp lý.
1.3. NGHIÊN CU PHÁT SINH LOÀI
1.3.1. Ph h phân t trong nghiên cu phát sinh loài:
Ph h phân t là nghiên cu v mi quan h tin hóa ca tp hp các trình t
gen, da vào phân tích s khác bit di truyn phân t (DNA, RNA, protein). Kt
qu phân tích phân t đc th hin qua mt cây ph h. Dng cây ph h phân t
là mt quá trình phc tp bi thc t là không th xây dng mt cây đúng nht. Tp
hp d liu phát sinh loài có th bao gm hàng trm loài khác nhau, m
t trong s đó
có th đã thay đi t l đt bin dn đn nh hng tin hóa. Do đó, hin nay có rt
nhiu mô hình tin hóa khác nhau, các phng pháp phân tích phát sinh chng loài,
dò tìm cây tin hóa ti thích cho mt phân tích phát sinh loài [21].
1.3.2. Nhng bc c bn trong nghiên cu phát sinh loài:
1.3.2.1. Chn la marker phân t và sp xp b d liu

Tùy theo mc đích dng cây ph h phân t mà xác đnh protein hay trình t
DNA s là d liu đc chn. Tip theo là phi thu thp các trình t này đ to ra
mt c s d liu cc b. Hin nay, nh có các công c trc tuyn min phí đã giúp
cho công vic này tr nên đn gin hn. Các trình t quan tâm có th ly t trang
NCBI hay các công c tìm kim tng đng khác. Khi đánh giá các trình t l
y
trong BLAST, cn chú ý ti s đim (score) và giá tr E (E-value). Mt đim s cao
11

ch ra mc đ tng đng gia các trình t vi chui trình t truy vn, giá tr E-
value biu th xác sut các trình t tng đng, giá tr E càng nh chng t đ đc
hiu càng cao [21].
1.3.2.2. c và hiu chnh trình t
Do các phân tích phát sinh chng loài da trên nhng s khác bit khi quan
sát các trình t đc so sánh thng hàng. Do đó li trình t s có th đa đn mt
cây tin hóa không chính xác. c bit vi trng hp vùng DNA có đ bo tn cao
và nhà phân tích chn mô hình tin hóa phc tp thì li trình t s cho ra kt qu có
đ sai khác rt ln.  tránh trng hp li trình t do ch quan, ngi ta buc phi
đc trình t c
hai si đ vic hiu chnh sau đó đc đm bo tính khách quan hn.
1.3.2.3. Sp ct thng hàng các trình t
Vic sp ct thng hàng thng đc thc hin bng máy tính mt cách t
đng, có th dùng ClustalW đ thc hin công vic này. Tuy nhiên, vi nhng gen
hay vùng DNA kém bo tn thì quá trình sp xp thng hàng t đng rt d gây ra
li. Do đó vi gene hay vùng DNA có đ bin thiên cao cn đc trc tip thc
hin quá trình sp xp thng hàng bng mt. Vi nhng vùng không có kh nng
sp xp thng hàng thì cn phi loi b trc khi đa vào phân tích [21].
1.3.2.4. Chn la mô hình tin hóa
Trc khi chui d liu thc s đc tính toán và phân tích, chúng phi tri
qua quá trình kim tra dò tìm mô hình tin hóa thích hp. Các mô hình này da vào

quá trình đt bin ngu nhiên, chúng là kt qu thay đi trình t trong chui phân
t, mt s trong đó xy ra mt cách tình c hoc chn lc t nhiên. Cây phát sinh
loài đc gi đnh và tin hành thc hin thay th mt cách ngu nhiên
Mt vài mô hình tin hóa ngu nhiên ph bin gm ph
ng pháp phng pháp
Jukes - Cantor , phnng pháp Kimura, Hasegawa - Kishino - Yano (HKY),
Tamura Nei, General Time Reversible (GTR)
Mô hình tin hóa phc tp nht hin nay là mô hình có kh nng hi bin tng
quát theo thi gian (General time reverible model). Mô hình này thng to thành
12

dng ghép GTR+I+, kt hp bi các thông s sau: t l thông s ma trn (r(AC),
r(AG), r(AT), r(CG), r(CT), và r(GT) =1); tn sut base (A, C, G vi T =1–
(A+C+G)) và phân b gamma [21].
1.3.2.5.Phân tích s phát sinh chng loài
Vài phng pháp nhm suy lun cây phát sinh chng loài đã đc bit khá rõ hin
nay đu là nhng phng pháp kt hp thut toán dò tìm cây ti thích và mt nhóm
tiêu chun ti u chn trc. Tin trình thc hin ca nó là dò tìm nhng cây tin
hóa ti thích, sau đó nhng cây tin hóa này đc đánh giá di nhng tiêu chun
ti u chn trc đ cho ra mt cây tin hóa tt nht [27].
Dò tìm cây tin hóa ti thích
Phng pháp dò tìm cây tin hóa ti u là phng pháp kt hp thut toán dò
tìm cây ti thích nh thut toán phân nhánh và gii hn (branch- and- bound) và
thut toán t tìm tòi (heuristics) cùng vi mt nhóm tiêu chun ti u chn trc,
cây tin hóa tt nht là cây tin hóa tha mãn vi nhng tiêu chun đã đc chn
trc.

Tiêu chun ti u
Tiêu chun ti u là quá trình thit lp mô hình tt nht v lch s tin hóa da
vào nhng thông tin cha hoàn chnh ca d liu. Phng pháp s dng tiêu chun

ti u có 2 bc theo th t: u tiên là xác đnh mt tiêu chun có chc nng tính
đim cây. Bc hai là tìm mt cây thay th ng vi mt tiêu chun này ri t đó tìm
ra mt cây. Quá trình tt s cho ra nhi
u gii pháp thay th ti u.
Phng pháp Maximum parsimony (MP -hà tin ti đa)
Phng pháp tin hành đánh giá sai khác nucleotide ti tng v trí và thc hin
cho đim các cây có th. Cây tt nht là cây có tng s thay đi tin hóa (s thay th
nucleotide) ít nht. Phng pháp dò tìm cây theo thut tóan heuristics thng áp
dng cho phng pháp parsimony.

13

Phng pháp khong cách – distance method
Trong phng pháp này tng cp trình t mt s đc so sánh thng hàng cp
đôi và ng vi tng cp, khang cách di truyn có tính cng. Cây đc xây dng
bng cách tìm mt cp chui lân cn mà chúng gim thiu đ dài ca cây. Và đc
đim ca cây tin hóa dng bng phng pháp neighbor-joining là to ra mt cây
không gc.
ây là mt trong nhng phng pháp nhanh nht đ dò tìm cây tin hóa nên
nó thng đc s dng đ phân tích khi d liu ln vi nhiu taxa.
Phng pháp Maximum Likelihood
Nhóm phng pháp hp lý cc đi nhóm phng pháp này da trên mt hàm
toán hc tính toán xác sut kh nng mt cây tin hóa đc to thành t d liu đã
quan sát. Hàm này cho phép vic tích hp các quá trình tin hóa ca đc tính thành
mô hình xác sut. Phng pháp hp lý cc đi chn la cây tin hóa ti đa mà khi
quan sát các d liu di mt mô hình nào đó có xác xut ti đa.
Phân tích giá tr bootstrap
Phân tính bootstrap là mt phng pháp thng kê đ có đc s c tính v
các li sai sót khi dng cây. Phân tích bootstrap thng dùng đ kim tra đ tin cy
mt cây, c th là đánh giá đ tin cy ca s phân nhóm loài trên mt cây. Phân tích

này thng đc s dng đ kim tra các taxa đc nhóm thành cm nh th nào
da vào các trình t nucleotide hay acid amin làm mu ph [13].u đim ca
phng pháp bootstrap là nó có th áp dng cho tt c các ph
ng pháp dng cây c
bn.

14

1.4. TÌNH HÌNH NGHIÊN CU TRONG NC
Hin nay  nc ta nghiên cu v nm Cordyceps đang trong giai đon mi
đt đc mt s kt qu. Vic nghiên cu mi ch mang tính cht điu tra, phát hin
và thu thp chúng trong điu kin Vit Nam.
Nm 2005, Phm Th Vng (Vin Bo v Thc vt) và Lng Vn Hà
(Vn quc gia Cúc Phng) cùng vi các nhà nm hc trng 
i hc Quc gia
Kangwon, Hàn Quc tin hành điu tra nhóm nm ký sinh côn trùng ti vn quc
gia Cúc Phng. Nghiên cu s dng phng pháp so sánh hình thái gii phu đ
phân loi. Kt qu công b có các loài Cordyceps sp., C. nutans, C. pruinosa, C.
specocephala và Beauveria bassiana, Beauveria sp., Gibellalus sp., Paecilomyces
sp.[15].
Nm 2006, nhóm các nhà nghiên cu nm ký sinh côn trùng ca BIOTEC,
Thái Lan đã kt hp vi Vin Sinh hc Nhit đi kho sát nhóm nm này trong
vn quc gia Cát Tiên. Kt qu công b vào n
m 2007 cho bit h đã thu đc
tng cng 259 mu nm. S b đnh danh bng hình thái da trên h thng phân
loi mi cho thy có tng cng 41 loài đc ghi nhn thuc 17 chi bao gm
Akanthomyces, Aschersonia, Beauveria, Conoideocrella, Cordyceps, Gibellula,
Hirsutella, Hymenostilbe, Hypocrella, Isaria, Metarhizium, Moelleriella, Nomuraea,
Ophiocordyceps, Paecilomyces, Torrubiella và Verticillium. Tuy nhiên trong s này
ch ghi nhn có 1 loài thuc chi Cordyceps và 2 loài thuc chi Ophiocordyceps (Lê

Tn Hng & cs 2010)[2].
Nm 2009, Vin Khoa Hc Lâm Nghip Vit Nam và trng i hc Lâm
Nghip đã tin hành đi
u tra thu mu nm THT (Cordyceps nutans) ti khu bo
tn Tây Yên T - Sn ng - Bc Giang. Tác gi Phm Quang Thu đã thông báo
phát hin đc loài nm ông trùng h tho và đc giám đnh là loài Cordyceps
nutans. ây là loài nm đu tiên đc mô t và ghi nhn có phân b ti Vit Nam
[5].
15

Ti hi tho: “Khoa hc và công ngh phc v sn xut nông nghip, công
nghip cao ti tnh Lâm ng” (2013) có báo cáo ca Phm Quang Thu v nghiên
cu nuôi trng qu th ca ông trùng h tho [6] và ca Nguyn Mu Tun và
cng s v mt s kt qu nghiên cu nm ông trùng h tho  tnh Lâm ng [3].
1.5. THU THP C S D LIU
1.5.1.Mc đích
Hin nay trên th gii có nhiu nhóm nghiên cu sinh hc hot đng trong
nhiu lnh vc khác nhau, nhu cu trao đi thông tin càng cn thit hn. Các c s
d liu trên th gii ra đi vi mc đích giúp các nhà sinh hc có điu kin trao đi
thông tin, qun lý, khai thác kho d liu sinh hc khng l. c bit vi nghiên cu
đnh danh và phân loi bng sinh hc phân t, nhu cu tham kho và chia s
thông
tin là mt trong nhng nhu cu cn thit.Các nghiên cu này cn tp hp lng d
liu mu ln, có đ tin cy. T đó mi có th thng kê chính xác, so sánh và đa ra
ra kt qu.
1.5.2. Khai thác và x lý thông tin
Hin nay có rt nhiu dng c s d liu thuc nhiu lnh vc vc sinh hc
khác nhau, trong đó d liu v sinh hc phân t luôn chim u th do tính đc thù
trong nghiên cu.
Trong nghiên cu sinh hc phân t, thng xuyên phi làm vic trên các đi

tng là nucleic acid (DNA) và protein. ây là các dng trình t sinh hc đc lu
ph bin trong các c s d liu sinh hc. Hin nay, các thông tin này đc lu tr
ch yu trong các c s d liu ln trên th gii nh h thng GenBank (NCBI,
USA), EMBL (European Molecular Biology Laboratory, UK), DDBJ (DNA
Database of Janpan, JP) và mt s h thng c s d liu khác trên th gii.
C s d liu NCBI
NCBI (National Center for Biotechnology Information) là tài nguyên quc gia
ca M v thông tin sinh hc phân t. NCBI to thành và lu tr nhng c s d

×