Tải bản đầy đủ (.pdf) (92 trang)

Hỗ trợ định danh các mẫu nấm ký sinh côn trùng dựa trên phân tích phát sinh chủng loài các gen nrLSU và ATP6

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.52 MB, 92 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƢỜNG ĐẠI HỌC MỞ TP.HCM

BÁO CÁO KHÓA LUẬN TỐT NGHIỆP
Tên đề tài:

HỖ TRỢ ĐỊNH DANH CÁC MẪU NẤM KÝ
SINH CÔN TRÙNG DỰA TRÊN PHÂN
TÍCH PHÁT SINH CHỦNG LOÀI CÁC GEN
nrLSU VÀ ATP6

KHOA CÔNG NGHỆ SINH HỌC
CHUYÊN NGÀNH: VI SINH – SHPT

GVHD:
SVTH:
MSSV:
Khóa:

ThS. Lao Đức Thuận
CN. Vũ Tiến Luyện
Nguyễn Thị Bích Thảo
1153010755
2011-2015

Tp. Hồ Chí Minh, tháng 05 năm 2015.


LỜI CẢM ƠN
Lời đầu tiên, em xin chân thành gửi tới thầy Lao Đức Thuận và anh Vũ Tiến
Luyện - người luôn tận tình, kiên nhẫn và quan tâm hướng dẫn em trong suốt


quá trình làm đề tài để hoàn thành khóa luận tốt nghiệp. Người luôn tạo điều
kiện cho em học tập, trau dồi kiến thức và rút ra nhiều bài học trong khoảng thời
gian vừa qua.
Em xin cảm ơn các bạn cùng nhóm đề tài và tập thể trong phòng thí nghiệm sinh
học phân tử, trường Đại Học Mở TP. Hồ Chí Minh đã giúp đỡ, tạo điều kiện
trong suốt thời gian thực hiện đề tài.
Trên hết, con xin cảm ơn bố mẹ và gia đình đã luôn yêu thương và giúp đỡ con.
Bình Dương, ngày 05 tháng 05 năm 2015.


Danh mục bảng biểu
Bảng 2.1. Trình tự các mồi sử dụng trong phản ứng PCR.
Bảng 2.2. Chu kỳ nhiệt cho phản ứng PCR.
Bảng 3.1. Các đặc tính vật lý của mồi LR0R/LR5 và ATP6-C1A/ATP6-C2A.
Bảng 3.2. Thông tin trình tự tham chiếu dùng để xây dựng dữ liệu vùng trình tự
nrLSU và Atp6.
Bảng 3.3. Kết quả kiểm tra DNA bằng quang phổ kế khảo sát trên 3 mẫu nấm
ký sinh côn trùng được tách chiết theo phương pháp Phenol:Chloroform.
Bảng 3.4. Kết quả kiểm tra DNA bằng quang phổ kế khảo sát trên 3 mẫu nấm
ký sinh côn trùng được tách chiết theo phương pháp Phenol:Chloroform bổ
sung β-mercaptoethanol và CTAB.
Bảng 3.5. Hiệu chỉnh các nucleotide tại các vị trí (1) đến (10).
Bảng 3.6. Tổng hợp kết quả hiệu chỉnh trình tự các mẫu nấm ký sinh côn trùng.
Bảng 3.7. Kết quả chiều dài trình tự trước và sau hiệu chỉnh.
Bảng 3.8. Kết quả các thông số của mô hình tiến hóa tốt nhất.
Bảng 3.9. Tổng hợp kết quả định danh các mẫu nấm từ dữ liệu phân tử và hình
thái.


Danh mục hình ảnh

Hình 1.1. Cordyceps sinensis.
Hình 1.2. Cấu trúc của rDNA.
Hình 1.3. Vị trí các mồi khuếch đại gen nrLSU.
Hình 2.1. Hình thái giải phẫu nấm mẫu DL004.
Hình 2.2. Hình thái giải phẫu nấm mẫu DL0075.
Hình 2.3. Hình thái nấm mẫu DL0077.
Hình 3.1. Vị trí mồi xuôi ATP6-C1A được sắp gióng cột với các trình tự gen
Atp6.
Hình 3.2. Vị trí mồi ngược ATP6-C2A được sắp gióng cột với các trình tự gen
Atp6.
Hình 3.3. Kết quả sắp gióng cột của mồi xuôi LR0R với trình tự gen nrLSU.
Hình 3.4. Kết quả sắp gióng cột của mồi ngược LR5 với trình tự gen nrLSU.
Hình 3.5. Kết quả Annhyb cặp mồi ATP6-C1A và ATP6-C2A trên trình tự gen
Atp6.
Hình 3.6. Kết quả Annhyb cặp mồi LR0R và LR5 trên trình tự gen nrLSU.
Hình 3.7. Kết quả kiểm tra mồi ATP6-C1A/ATP6-C2A bằng BLAST trên
GenBank.
Hình 3.8. Kết quả kiểm tra mồi LR0R/LR5 bằng BLAST trên GenBank.
Hình 3.9. Kết quả điện di sản phẩm PCR của 3 mẫu DL004, DL0075, DL0077
với cặp mồi LR0R/LR5 được tách chiết theo phương pháp Phenol:Chloroform.
Hình 3.10. Kết quả điện di sản phẩm PCR của 3 mẫu DL004, DL0075, DL0077
với cặp mồi ATP6-C1A/ATP6-C2A được tách chiết theo phương pháp
Phenol:Chloroform.
Hình 3.11. Kết quả điện di sản phẩm PCR cặp mồi LR0R/LR5 theo phương
pháp Phenol:Chloroform có sử dụng β - mercaptoethanol và CTAB.


Hình 3.12. Kết quả điện di sản phẩm PCR cặp mồi ATP6-C1A/ATP6-C2A theo
phương pháp Phenol:Chloroform có sử dụng β - mercaptoethanol và CTAB.
Hình 3.13. Trình tự DNA của mạch xuôi và ngược chưa hiệu chỉnh của gen

Atp6 trên giao diện Chromas lite.
Hình 3.14. Mô tả sự sai khác mucleotide ở hai mạch xuôi và ngược gen Atp6.
Hình 3.15. Vị trí sai lệch của hai kết quả giải trình tự ở đầu mạch xuôi của Atp6.
Hình 3.16. Kết quả BLAST trình tự gen Atp6 mạch xuôi đã hiệu chỉnh.
Hình 3.17. Cây phả hệ phân tử gen nrLSU được xây dựng bằng phương pháp
Maximum Likelihood với bộ cơ sở dữ liệu. (Các con số hiển thị trên cây là giá
trị bootstrap của 1000 lần lặp lại lần lượt của các cây NJ/MP/ML).
Hình 3.18. Cây phả hệ phân tử gen Atp6 được xây dựng bằng phương pháp
Maximum Likelihood với bộ cơ sở dữ liệu. (Các con số hiển thị trên cây là giá
trị bootstrap của 1000 lần lặp lại lần lượt của các cây NJ/MP/ML).
Hình 3.19. Cây phả hệ phân tử gen nrLSU-Atp6 được xây dựng bằng phương
pháp Maximum Likelihood với bộ cơ sở dữ liệu. (Các con số hiển thị trên cây là
giá trị bootstrap của 1000 lần lặp lại, lần lượt của các cây NJ/MP/ML).


Danh mục những chữ viết tắt
ATP:

Adenosine triphosphate

BLAST:

Basic Local Alignment Search Tool

Bp:

Base-pair

Nu:


Nucleotide

DNA:

Deoxyribonucleotide triphosphate

RNA:

Ribonucleic acid

ITS:

Internal transcribed spacer

SSU:

Small subunit

LSU:

Large subunit

MP:

Maximum parsimony

ML:

Maximum likelihood


NJ:

Neighbor-joining

rDNA:

Ribosomal DNA

CTAB:

Cetyl Trimethylammonium Bromide


MỤC LỤC
ĐẶT VẤN ĐỀ ............................................................................................................1
PHẦN I: TỔNG QUAN
1.1.

NẤM KÝ SINH CÔN TRÙNG ..................................................................3

1.1.1.

Đặc điểm chung .....................................................................................3

1.1.2.

Sự phân bố và thành phần loài ............................................................4

1.1.3.


Ứng dụng của nấm Cordyceps ..............................................................4

1.2.

NGHIÊN CỨU ĐỊNH DANH VÀ PHÁT SINH LOÀI ............................5

1.2.1.

Đặc điểm nhận dạng và định danh ......................................................5

1.2.2.

Định danh phân tử ................................................................................7

1.2.3.

Gen MT-Atp6 (Mitochondrially encoded ATP synthase 6) .................7

1.2.4.

DNA ribosome và gen nrLSU (nuclear ribosomal large subunit) ....8

1.3.

TÁCH CHIẾT DNA VÀ KỸ THUẬT PCR ............................................11

1.3.1.

Tách chiết DNA ...................................................................................11


1.3.2.

Kỹ thuật PCR ......................................................................................12

1.3.3.

Giải trình tự .........................................................................................12

1.4.

TÌNH HÌNH NGHIÊN CỨU TRONG NƢỚC .......................................13

1.5.

PHẢ HỆ PHÂN TỬ[11] ..............................................................................15

PHẦN II: VẬT LIỆU VÀ PHƢƠNG PHÁP NGHIÊN CỨU
2.1.

VẬT LIỆU VÀ PHƢƠNG PHÁP NGHIÊN CỨU .................................20

2.1.1.

Phần mềm trong khảo sát in silico ....................................................20

2.1.2.

Vật liệu sử dụng trong thực nghiệm..................................................20

2.2.


TIẾN TRÌNH THÍ NGHIỆM ...................................................................23

2.2.1.

Khai thác và thu thập tài liệu ............................................................24


2.2.2.

Khảo sát in silico .................................................................................24

2.2.3.

Thực nghiệm ........................................................................................25

2.2.4.

Giải trình tự .........................................................................................28

2.2.5.

Hiệu chỉnh trình tự .............................................................................28

2.2.6.

Xây dựng cây phát sinh loài bằng phần mềm MEGA6.0................28

PHẦN III: KẾT QUẢ NGHIÊN CỨU VÀ THẢO LUẬN
3.1.


KẾT QUẢ ĐÁNH GIÁ MỒI ....................................................................30

3.2.

CƠ SỞ DỮ LIỆU CỤC BỘ TRÌNH TỰ nrLSU VÀ ATP6 NHÓM

NẤM KÝ SINH CÔN TRÙNG ...........................................................................38
3.3.

KẾT QUẢ THỰC NGHIỆM ....................................................................44

3.4.

KẾT QUẢ HIỆU CHỈNH TRÌNH TỰ ....................................................47

3.5.

KẾT QUẢ XÂY DỰNG CÂY PHÁT SINH LOÀI ................................52

PHẦN IV: KẾT LUẬN VÀ ĐỀ NGHỊ
4.1.

KẾT LUẬN ................................................................................................60

4.2.

ĐỀ NGHỊ ....................................................................................................60

TÀI LIỆU THAM KHẢO ......................................................................................61

PHỤ LỤC


ĐẶT VẤN ĐỀ
Nấm Cordyceps là nấm ký sinh trên côn trùng được biết đến và sử dụng phổ
biến trong các bài thuốc cổ truyền của Trung Quốc kể cả các nước Châu Á. Đại
diện tiêu biểu của chi này là Cordyceps sinensis, chứa các chất có hoạt tính cao
ứng dụng trong y dược như kháng khối u, đáp ứng miễn dịch, chống oxi hóa,
chống tăng đường huyết, hiệu quả bảo vệ thận, nâng cao hoạt động tình dục và
sinh sản,… Chi nấm Cordyceps có hơn 400 loài đã được phát hiện. Trong đó,
chúng được định danh chủ yếu bằng phương pháp truyền thống thông qua định
danh hình thái gồm các đặc tính: quả thể, sinh bào tử, hình thái sinh sản….
Tuy nhiên, việc định danh hình thái chi Cordyceps cũng còn gặp nhiều khó
khăn và hạn chế trong việc phân loại, vì chi Cordyceps có thành phần loài rất
phong phú. Đặc biệt, nhóm này tồn tại ở hình thức sinh sản vô tính và hữu tính.
Ngoài ra, kiểu hình chi Cordyceps bị ảnh hưởng bởi điều kiện môi trường khác
nhau tạo nên dị hình thái dễ nhầm lẫn cho các nhà nấm học khi phân loại. Trong
những năm gần đây, các tiến bộ của sinh học phân tử và ứng dụng tin sinh học,
đã đóng góp rất nhiều cho việc giải quyết những khó khăn trên. Chẳng hạn như
việc sử dụng các gen thuộc nhóm gen giữ nhà (house-keeping gen) để xây dựng
cây phát sinh loài đã mang lại hiệu quả (Sung et al., 2007).
Trong đó, gen nrLSU-rRNA mã hóa RNA 25S-28S của ribosome (tiểu phần lớn
của ribosome) có nhiều vùng bảo tồn và đa dạng. Ngoài ra, nrLSU-rRNA còn
bao gồm những vùng domain D1, D2, D3, gọi là vùng biến động (D-divergence
region) chứa nhiều thông tin duy truyền, có độ bảo tồn cao và có thể khuếch đại
bằng cặp mồi phổ quát do đó nó thích hợp cho nghiên cứu cấp độ loài thậm chí
còn vượt qua cả mức độ loài. Hơn nữa, nrLSU-rRNA được coi như là một chỉ
thị phân tử (marker) để phân loại và xác định tên loài trong một phạm vi rộng.
Cùng với gen Atp6 mã hóa cho enzym ATPase trong ty thể tiểu phần số 6 của
phức hợp F1-F0 ATPase. Mà ATPase là enzyme có vai trò quan trọng tham gia

vào quá trình tạo ATP từ ADP trong ty thể, với sự hiện diện của kênh gradient

Trang 1


proton qua màng, được tạo ra bởi tổ hợp vận chuyển điện tử của chuỗi hô hấp,
cung cấp năng lượng cho tế bào sử dụng. Vì vậy, kết hợp gen ribosome nrLSU
(Artjariyasripong et al., 2001, Sung et al., 2001, Stensrud et al., 2005) với gen
Atp6 sẽ giúp cải thiện khả năng phân nhánh của cây phát sinh loài (Sung et al.,
2007) dẫn đến tăng thêm mức độ chính xác trong việc định danh loài. Nên gen
nrLSU và Atp6 là gen mục tiêu được sử dụng trong nghiên cứu phát sinh loài để
tìm ra độ tương quan và mức độ di truyền giữa các loài. Xuất phát từ những vấn
đề trên tôi đề xuất đề tài: “Hỗ trợ định danh các mẫu nấm ký sinh côn trùng
dựa trên phân tích phát sinh chủng loài các gen nrLSU và Atp6”.

Trang 2


PHẦN I: TỔNG QUAN


1.1. NẤM KÝ SINH CÔN TRÙNG
1.1.1. Đặc điểm chung
Cordyceps là nấm ký sinh trên côn trùng thuộc ngành nấm túi Ascomycota, lớp
Pyrenomycetes, bộ Hypocreales, họ Clavicipitaceae[43]. Cordyceps sinensis
được biết đến nhiều nhất trên thế giới vì có giá trị dược liệu quý hiếm và độc
đáo, được phát hiện đầu tiên trong Đông y Trung Quốc hơn 50.000 năm
trước[34]. Cordyceps sp. ký sinh trên côn trùng, động vật chân đốt (arthropods)
và một số ít ký sinh trên nấm khác[29]. Đại diện, C. sinensis chủ yếu sống ký sinh
trên ấu trùng của các loài sâu thuộc họ sâu bướm thuộc chi Hepialus, thường gặp

nhất là ký sinh trên ấu trùng loài Hepialus biruensis chúng thường được gọi là
„Đông trùng hạ thảo‟[26]. C. sinensis xâm nhiễm vào sâu non và bắt đầu làm chết
ký chủ, sống ký sinh suốt mùa đông. Khi gặp điều kiện thích hợp vào mùa hè,
các sợi nấm mọc ra từ miệng của xác sâu non và phát tán bào tử. Quả thể nấm có
hình trụ, đỉnh túi dày, các bào tử có thể ngắt rời nhau[43].

Hình 1.1. Cordyceps sinensis[59].
Các nghiên cứu về nhóm nấm Cordyceps trong thời gian gần đây cho thấy
không chỉ riêng C. sinensis mới có tính chất như: kháng khối u, chống oxi hóa,
chống tăng đường huyết, hiệu quả bảo vệ thận, nâng cao hoạt động tình dục và
sinh sản, …[12]. Nhiều loài Cordyceps sp. được phát hiện có khả năng ứng dụng
trong y dược như C. Militaris, C. Cicadae, C. Ophioglossoides.... Một số các
đặc tính dược lý điển hình như khả năng điều hòa đáp ứng miễn dịch của C.
cicadae hay ức chế các tế bào khối u của C. Ophioglossoides, C. cicadae và
Trang 3


chống oxy hóa của C. Militaris,...[27]. Đặc biệt, một số loài Cordyceps còn được
ứng dụng trong kiểm soát sinh học điển hình chi nấm Beauveria và
Metarhizium[8].
Các thành phần có hoạt tính chính của C. sinensis thường có bản chất là các
nucleoside, cordycepin (3‟-deoxyadenosin), polysaccharide, protein, sterol...[26].
Các chất này thường được phân lập từ hệ sợi hay quả thể[26].
Ngoài ra, nó còn chứa các nguyên tố vi lượng như K, Na, Ca, Mg, Fe, Cu, Mn,
Zn, Pi, Se, Al, Si, Ni…[26].

1.1.2. Sự phân bố và thành phần loài
Cordyceps chủ yếu tìm thấy vào mùa hè và phát triển mạnh ở độ cao trên 3800
m trên mực nước biển cấp, trong lạnh, cây cỏ hoặc đồng cỏ núi cao trên dãy cao
nguyên Himalaya Tây Tạng và các tỉnh của Trung Quốc Tứ Xuyên, Cam Túc,

Hồ Bắc, Chiết Giang, Sơn Tây, Thanh Hải và Vân Nam[26].
Cordyceps là chi đa dạng nhất trong họ Clavicipitaceae, ước tính hơn 400 loài
đã được mô tả trên toàn thế giới[33]. Trong đó, khoảng 90 loài được phát hiện tại
Trung Quốc[50]. Chúng phân bố khắp thế giới ở tất cả các vùng trên mặt đất trừ
Nam Cực và sinh sôi nảy nở tốt chủ yếu ở vùng nhiệt đới và cận nhiệt đới, đặc
biệt là khu vực Đông và Đông Nam Á dẫn đến sự đa dạng loài tại đây[43].

1.1.3. Ứng dụng của nấm Cordyceps
1.1.3.1.

Ứng dụng trong y dược

Cordyceps có polysaccharides chiếm khoảng 3 - 8% tổng trọng lượng, chống
ung thư, điều trị bệnh tim và hỗ trợ cải thiện khả năng giải độc gan…[26]. Các
ergosterol và các đồng phân có hoạt tính kháng virus, điều hoà tim mạch, điều trị
bệnh thận[51]. Cùng với hợp chất cordycepin và beta - glucans trong quả thể có
tác dụng làm tăng trưởng chất ức chế chống lại tế bào ung thư. Chính vì vậy,
Cordyceps trong tương lai sẽ được ứng dụng trị liệu trong điều trị ung thư, như
là một loại thuốc hỗ trợ cho hóa trị liệu, xạ và cả trong điều trị ung thư truyền
thống[26].
Hơn nữa, Cordyceps có tác dụng tăng cường miễn dịch vì sản xuất và bảo vệ tế
bào T làm nâng cao hoạt tính đại thực bào và tế bào NK (natural killer cell-tế
Trang 4


bào bạch cầu có khả năng nhận dạng và tiêu diệt vi trùng), cải thiện các kháng
thể[34].
Cordyceps có khả năng điều trị rối loạn tình dục ở cả nam giới và nữ giới đã
được chứng minh qua nhiều nghiên cứu tại các nước chủ yếu là Trung Quốc.
Bởi vì trong quả thể của chúng có chứa hợp chất steroid có khả năng chống rối

loạn tình dục[1][26].
1.1.3.2.

Ứng dụng trong sinh học

Nấm Cordyceps sp. ngoài ứng dụng trong y dược còn được ứng dụng rộng rãi và
thành công trong kiểm soát sinh học. Bởi vì nấm Cordyceps mang đặc điểm là
ký sinh trên côn trùng nên Cordyceps trở thành thiên địch của các loài côn trùng
gây hại. Chính vì vậy nhiều loài đã được sử dụng rộng rãi trong kiểm soát sinh
học chống các loài sâu hại hay dịch bệnh. Tiêu biểu như loài nấm Beauveria
bassiana và Metarhizium, trong đó nấm Beauveria bassiana sử dụng như thuốc
trừ sâu vi sinh vật thay thế cho thuốc trừ sâu hóa học, bởi vì chúng có khả năng
gây độc cho ký chủ cao, tác dụng nhanh, có phổ ký chủ rộng và an toàn cho
người (McCoy, 1990)[45]. Hơn nữa, nấm Beauveria và Metarhizium dùng để
phòng trừ sâu hại cây trồng, cây rừng, đồng thời phát triển công nghệ, hoàn
thiện môi trường. Cụ thể, năm 2010 viện bảo vệ thực vật đã sản xuất và sử dụng
chế phẩm nấm Beauveria bassiana phòng trừ sâu róm hại thông và nấm
Metarhizium anisopliae trừ châu chấu hại ngô, mía, bọ cánh cứng hại dừa và
một số sâu hại rau khác,… mang lại hiệu quả cao[8].

1.2. NGHIÊN CỨU ĐỊNH DANH VÀ PHÁT SINH LOÀI
1.2.1. Đặc điểm nhận dạng và định danh
Trước đây, nấm ký sinh côn trùng chủ yếu được định danh dựa trên phân tích
đặc điểm hình thái: màu sắc, quả thể, sinh sản, bào tử. Trong đó, họ
Clavicipitaceae được nhận biết bởi các đặc điểm: thể túi dạng trụ, đỉnh túi dày
và các bào tử túi dạng sợi thường có thể ngắt rời thành nhiều bào tử thứ cấp[43].
Bên cạnh đó, năm 1982 Kobayasi đã tiến hành định danh nấm này dựa vào vật
chủ ký sinh của chúng, bởi vì giữa nấm này với vật chủ khi chúng chọn để ký
sinh có mối liên quan mật thiết với nhau[43].
Trang 5



Thông qua những đặc điểm về hình thái và vật chủ ký sinh, họ Clavicipitaceae
gồm nhóm:
Cordyceps, Hypocrella và Torrubiella: ký sinh trên động vật chân đốt và
nấm[43] [44].
Claviceps, Balansia và Epichloe: ở các loài cỏ cộng sinh[43] [44].
Elaphocordyceps bao gồm tất cả các loài sống ký sinh ở Elaphomyces hay
ký sinh trên nhộng ve sầu[43] [44].
Cordyceps s.s: thường có màu vàng nhạt, sáng, quả thể mềm (Cordyceps
militaris). Có chất nền dày mang sắc tố nhạt hoặc màu sáng rực rỡ, sợi nấm tổ
chức lỏng lẻo, bào tử hình trụ. Đặc biệt, loài của Cordyceps s.s sinh chủ yếu 3
loại bào tử bao gồm: Bào tử tách rời (C.militaris); Bào tử nguyên (C.cardinalis
và C.pseudomilitaris); Bào tử dạng Bola (C.bifusispora). Vật chủ ký sinh của
chúng trong môi trường dễ tiếp cận như lá cây, rêu hoặc các lớp đất trên cùng[43]
[44]

.
Metarcordyceps: quả thể nấm tươi có màu từ trắng (Metarcordyceps

youngmunensis), màu hoa cà, màu tím, màu xanh lá cây. Các mẫu nấm khô có
màu sẫm hơn hoặc màu đen (Metarcordyceps taii). Kết cấu của quả thể gồm hệ
sợi và ít cùi hơn chi Cordyceps s.s[43] [44].
Ophiocordyceps: sắc tố đậm được tìm thấy trong đất (Ophiocordyceps
sinensis) và trong gỗ mục (Ophiocordyceps variabilis). Hình thái quả thể đa
dạng tùy theo loài, có thể có hình chỉ, dẻo dai hay hình chùy, có hệ sợi…[43][44].
Tuy nhiên, việc định danh bằng hình thái vẫn gặp khó khăn do chi nấm này có
thành phần loài rất phong phú và hình dạng bị ảnh hưởng bởi điều kiện môi
trường. Những đặc điểm hình thái như màu sắc, hình dạng quả thể của từng cá
thể khác nhau trong cùng một loài cũng có những biến đổi lớn. Hơn nữa, chúng

tồn tại ở thể lưỡng danh là thể vô tính và hữu tính nên khó phân biệt, dẫn đến dễ
nhầm lẫn khi định danh qua hình thái. Vì vậy, định danh thông qua hình thái còn
gặp nhiều khó khăn và hạn chế[29][43].
Trong những năm gần đây, các tiến bộ của sinh học phân tử và ứng dụng phần
mềm tin sinh đã đóng góp rất nhiều cho việc giải quyết những khó khăn trong
Trang 6


việc định danh nấm ký sinh côn trùng[19]. Chẳng hạn như, dựa trên kết quả phân
tích cây phát sinh loài để suy luận mối quan hệ và lịch sử tiến hóa của các loài
nấm ký sinh côn trùng, cây phát sinh loài này được xây dựng chủ yếu dựa trên
bộ cơ sở dữ liệu gồm các vùng gen như: gen ITS (interrnal transcribed
spacer)[48], gen ribosome (SSU nrDNA, LSU nrDNA) hay các gen thuộc nhóm
gen giữ nhà (Atp6, Tef1, Rpb1, Rpb2,…) đã được ứng dụng rộng rãi[16][30][43].

1.2.2. Định danh phân tử
Định danh phân tử là xác định và phân loại thành phần loài ở mức độ phân tử
thông qua việc so sánh các trình tự nucleotide và acid amin của DNA, protein
hay RNA. Thực chất, của phương pháp định danh này dựa vào các đặc điểm của
kiểu gen thay vì sử dụng kiểu hình như trong phân loại hình thái học.
Hiện nay, định danh phân tử thông qua vùng gen giữ nhà “house-keeping gen”,
phân tích cây phát sinh loài kết hợp với giá trị bootstrap được nhiều nhà khoa
học đã và đang sử dụng hiệu quả trong việc định danh của các loài nấm thuộc
chi nấm ký sinh côn trùng và một số nấm khác cùng với loài sinh vật khác với
phạm vi rộng rãi[43][44]. Hơn nữa, định danh phân tử có vai trò quan trọng hỗ trợ
cho phương pháp định danh hình thái để giúp giải quyết những hạn chế trong
việc xây dựng hệ thống học và định danh các loài nấm về tính di truyền hay phát
sinh loài,…[19]. Hiện nay, các nhà nghiên cứu dựa vào việc xây dựng và phân
tích địa hình học của cây phát sinh loài, phân nhóm của cây và dựa vào giá trị
bootstrap để định danh, xác định các loài sinh vật quan tâm.


1.2.3. Gen MT-Atp6 (Mitochondrially encoded ATP synthase 6)
Gen Atp6 là gen thuộc nhóm gen giữ nhà. Gen giữ nhà “house-keeping gen” là
gen mã hóa cho các protein giữ vai trò quan trọng duy trì chức năng của tế bào
và bao gồm những gen có biểu hiện tương đối ở bất kỳ điều kiện nào[56].
Gen Atp6 mã hóa cho enzyme ATPase của ty thể tiểu phần số 6. ATPase là
enzyme giúp ty thể thực hiện quá trình tạo năng lượng từ ADP chuyển đổi thành
ATP với sự hiện diện của kênh gradient proton qua màng, được tạo ra bởi tổ hợp
vận chuyển điện tử của chuỗi hô hấp, cung cấp năng lượng cho tế bào hoạt
động[42][58]. Atp6 là tiểu đơn vị của phức hợp F1-F0 ATPase trong ty thể, được
Trang 7


tìm thấy hầu hết ở sinh vật nhân chuẩn. F1 có chứa các lõi xúc tác trên màng và
F0 nằm trong màng ty thể, có chứa các kênh proton màng, liên kết với nhau bởi
một thân cây trung ương và một cuống ngoại vi[27]. Tiểu đơn vị này là một thành
phần quan trọng của các kênh proton và đóng một vai trò trực tiếp trong việc di
chuyển của proton qua màng. Do gen Atp6 có chức năng quan trọng trên và gen
có kích thước nhỏ thuộc DNA ty thể nên được coi là đối tượng lý tưởng để khảo
sát sự biến đổi trong hệ gen phục vụ nghiên cứu về phân loại. Điển hình gen
Atp6 trong DNA ty thể của nấm men Saccharomyces cerevisiae có vị trí từ
28.487 bp đến 29.266 bp, chiều dài khoảng 779 bp[20].
Gần đây các nhà nghiên cứu nấm học như Spatafora et al., 2007, Sung et al.,
2007 đã tiến hành sử dụng các gen mã hóa cho protein có vai trò quan trọng
trong tế bào để bổ sung trong nghiên cứu phát sinh loài (Atp6, Rpb1, Rpb2, Tef1,
Tub...)[43][44].
Hơn nữa, các nghiên cứu đều dựa vào DNA vì chúng có ưu điểm là cho nhiều
thông tin hơn, trong khi acid amin có tính thoái hóa. Do DNA đột biến nhiều
hơn nhờ đó giúp chỉ ra mối quan hệ gần gũi giữa các loài tốt hơn dựa vào các
vùng biến động. Cụ thể, Zuckerkandl và Pauling nhận ra rằng trình tự chính của

acid nucleic chứa một nhguồn thông tin phong phú về lịch sử tiến hóa[35]. Vì
vậy, gen Atp6 giúp cải thiện được những hạn chế việc phân loại giữa chi và loài;
cho thấy kiến thức về các mối quan hệ tiến hóa của các loài trong cùng họ
Clavicipitaceae[43][44]. Một số nghiên cứu đã sử dụng gen Atp6 như: Atp6 dùng
kiểm tra mối quan hệ phát sinh loài giữa 27 đơn vị phân loại từ Boletales và 4
nhóm đối chứng (outgroup); phát hiện loài nấm mới Stachybotrys chartarum
dựa trên cây phát sinh loài đa gen; phân loại phát sinh loài của nấm Cordyceps
và Clavicipitaceous[16][30][41].

1.2.4. DNA ribosome và gen nrLSU (nuclear ribosomal large subunit)
Trong nghiên cứu định danh về sinh học phân tử, nhóm nấm ký sinh côn trùng
hay ở nhiều loài sinh vật khác thì việc lựa chọn trình tự DNA là vô cùng quan
trọng. Đòi hỏi trình tự DNA có độ bảo tồn cao trong cùng một loài và biến động
lớn giữa các loài khác nhau. Đặc biệt, trong định danh loài nấm ký sinh côn
Trang 8


trùng thì vùng gen mã hóa cho RNA ribosome được sử dụng phổ biến. RNA
ribosome là một trong hai thành phần chính của ribosome, được phiên mã từ
DNA ribosome. Các gen RNA ribosome khuếch đại mồi phổ quát, có tính bảo
tồn cao cho phép phân loại vượt mức độ loài[37].
Ribosome là một bộ máy phân tử lớn và phức tạp, có mặt trong tất cả tế bào
sống. Đảm nhiệm chức năng sinh tổng hợp protein của tế bào. Ribosome gồm
hai tiểu đơn vị, mỗi tiểu đơn vị gồm một hoặc nhiều phân tử RNA ribosome và
nhiều phân tử protein[54]. Hai tiểu đơn vị này chỉ kết hợp với nhau tạo ra một
ribosome hoạt động khi quá trình dịch mã trên mRNA bắt đầu.
Ở sinh vật nhân sơ, tiểu phần nhỏ (30S) của ribosome chứa 16S RNA, tiểu phần
lớn (50S) chứa 5S, 23S. Hai tiểu đơn vị nhỏ và lớn khi kết hợp với nhau sẽ tạo
ra một rãnh ở chỗ tiếp giáp của chúng để cho mRNA đi qua[54]. Sinh vật nhân
chuẩn, tiểu phần nhỏ (40S) của ribosome chứa 18S RNA, tiểu phần lớn (60S)

chứa 28S, 5.8S và 5S[54].

Hình 1.2. Cấu trúc của rDNA[52]

Trang 9


DNA ribosme là nhóm gen mã hóa cho rRNA ribosome. Đây là vùng gen bảo
tồn cao nên được xem là cơ sở chính xác để tìm ra sự tương đồng và các khác
biệt của các sinh vật cùng loài hay khác loài, cung cấp nhiều thông tin và có
nhiều bản sao nên đóng vai trò quan trọng trong các nghiên cứu quá trình tiến
hóa, phát sinh loài[24]. Ngoài ra, dựa vào vùng bảo tồn của gen rRNA có thể thiết
kế các cặp mồi phổ quát (universal primer) sử dụng khuếch đại trình tự của vùng
gen rDNA từ nhiều loài trong định danh sinh học phân tử[24].
rDNA bao gồm nhiều đơn vị lặp lại, mỗi đơn vị lặp lại bao gồm vùng ITS
(internal transcribed spacer), vùng 18S, 5.8S, 25-28S, 5S RNA và vùng IGS
(intergenic spacer). Cụ thể, một đơn vị lặp lại bao gồm vùng theo thứ tự IGS218S (SSU)-ITS1-5.8S-28S (LSU)-IGS1-5S-IGS2. Giữa các đơn vị lặp lại của
gen rDNA là một vùng không phiên mã (NTS)[24].
Trong đó, vùng 18S-28S là vùng phiên mã chính (Vilgalys, 2004), vùng 18S
hình thành tiểu đơn vị nhỏ (SSU), vùng 28S, 5,8S và 5S hình thành tiểu đơn vị
lớn (LSU) của ribosome RNA. Vùng 5,8S rRNA có cấu trúc và chức năng liên
quan chặt chẽ với tiểu đơn vị lớn của rRNA và có nguồn gốc từ một phần của
23S ở sinh vật nhân sơ[24]. Vùng 5S rDNA thường không có vị trí cố định, chỉ có
ở nhân, không có ở ty thể của một số loài nấm (Guarro, 1999).
Các rDNA 5,8S; 18S; 28S nằm xen kẽ với các vùng phiên mã bên trong (ITS1
và ITS2) và các vùng phiên mã bên ngoài (ETS). Vùng ETS (external
transcribed spacer) nằm ở đầu 5‟ của 18S và đầu 3‟ của 28S. Hơn nữa, vùng IGS
bao gồm phần ETS (external transcribed spacer) và phần không phiên mã NTS
(non-transcribed spacer). Vùng IGS (intergenic spacer) là vùng kém bảo tồn
nhất của rDNA[51].

Gen nrLSU mã hóa cho tiểu phần lớn của ribosome (25S-28S), có nhiều vùng
bảo tồn và đa dạng. Ngoài ra, nrLSU-rRNA còn bao gồm những vùng domain
D1, D2, D3, gọi là vùng phân kỳ (D-divergence region) được đánh số theo chiều
5‟ đến 3‟, chứa nhiều thông tin duy truyền, có độ bảo tồn cao và có thể khuếch
đại với cặp mồi phổ quát do đó nó thích hợp cho nghiên cứu cấp độ loài thậm
chí còn vượt qua cả mức độ loài[37][39][46]. Đồng thời, cấu trúc rDNA gồm nhiều
Trang 10


đơn vị lặp lại nên số bản sao của gen nrLSU rất nhiều. Hơn nữa, nrLSU chứa
các vùng bảo tồn, biến thiên có giá trị trong việc hỗ trợ định danh loài[39][43].
nrLSU-rRNA còn được coi như là một chỉ thị phân tử (marker) để phân loại và
xác định tên loài tốt hơn về mặt duy truyền trong một phạm vi rộng[37][39][41].
Vùng D1/D2 mã hóa cho tiểu phần lớn của ribosome được coi là tiềm năng ứng
dụng trong phân loại phần lớn các loài nấm kỵ khí[41]. Cặp mồi LR0R/LR5 là
cặp mồi phổ quát được biết đến nhiều nhất và được ứng dụng trong nhiều nghiên
cứu phả hệ phân tử định danh loài nấm ký sinh côn trùng và các loài sinh vật
khác trong những năm gần đây[44]. Cặp mồi này được thiết kế để khuếch đại
vùng D1/D2 và cho kết quả khuếch đại khoảng 800 - 1300 bp (Sonnenberg et
al., 2007). Gen nrLSU đã ứng dụng thành công trong nghiên cứu định danh ở
loài nấm ký sinh côn trùng hay các loài nấm khác như: sử dụng vùng D1/D2 của
tiểu đơn vị lớn nrLSU (28S) vùng rDNA trong phân loại ở cấp độ loài khác biệt
trong Orpinomyces spp.[41]…

Hình 1.3. Vị trí các mồi khuếch đại vùng gen nrLSU (tự vẽ)[57].

1.3. TÁCH CHIẾT DNA VÀ KỸ THUẬT PCR
1.3.1. Tách chiết DNA
DNA chứa thông tin di truyền, các nghiên cứu ứng dụng phương pháp sinh học
phân tử đều bắt đầu bằng việc thu nhận các acid nucleic tinh sạch để tiến hành

các thí nghiệm tiếp theo. Tùy thuộc vào loại DNA mà các nhà nghiên cứu lựa
chọn các phương pháp tách chiết khác nhau. Hơn nữa, mỗi quy trình tách chiết
DNA phải theo nguyên tắc[17]:

Trang 11


Phá màng tế bào; loại bỏ protein; tủa DNA. Để thu nhận DNA tinh sạch, cần
loại bỏ những thành phần tạp nhiễm, quan trọng nhất là protein. Sự tách chiết
dựa trên nguyên tắc hòa tan khác nhau của các phân tử khác nhau (acid nucleic/
protein) trong hai pha không hòa tan (phenol, chloroform/nước).
Để thực hiện được mục tiêu của đề tài, thì việc xây dựng quy trình tách chiết
hợp lý là vô cùng cần thiết.

1.3.2. Kỹ thuật PCR
Phản ứng PCR (Polymerase Chain Reaction) được phát minh bởi K. Mullis vào
năm 1985[9]. Nó là một kỹ thuật phổ biến trong sinh học phân tử nhằm khuếch
đại vùng DNA đặc hiệu bằng cách sử dụng DNA polymerase, mồi, dNTP, dung
dịch đệm, DNA mạch khuôn và MgCl2. Phản ứng được thực hiện trong máy chu
kỳ nhiệt với từng nhiệt độ thích hợp cho mỗi phản ứng[8]. Gồm nhiều chu kỳ, với
mỗi chu kỳ gồm các bước: biến tính (DNA biến tính thành mạch đơn nhiệt độ
khoảng 950C), bắt cặp mồi (khoảng 37 - 650C, nhiệt độ cần cho sự bắt cặp giữa
mồi với mạch khuôn là Ta, Ta< Tm khoảng 50C, Tm là nhiệt nóng chảy mồi) và
kéo dài (ở 720C)[7]. DNA được khuếch đại theo cấp số nhân. PCR đã được ứng
dụng nhiều và rộng rãi trong nghiên cứu y sinh học như: sao chép DNA để sắp
xếp, chuẩn đoán di truyền,… Hơn nữa, nó là một bước thí nghiệm quan trọng để
góp phần xây dựng cây phát sinh loài. Với mục tiêu của đề tài chúng tôi nhằm
mong muốn khuếch đại được vùng gen nrLSU và Atp6 của loài nấm ký sinh côn
trùng. Vì vậy, việc khuếch đại được vùng gen này rất quan trọng. Cũng chính vì
vậy mà kỹ thuật PCR này có ý nghĩa cách mạng trong sự phát triển sinh học

phân tử và kỹ thuật duy truyền[7][9][53].

1.3.3. Giải trình tự
Giải trình tự gen là phương pháp nhằm phát hiện thứ tự sắp xếp 4 loại nucleotide
A (adenine), T (Thymine), G (Guanine), C (Cytosine) trên phân tử DNA.
Phương pháp enzyme giải trình tự được Sanger et al., 1977 phát minh, trên
nguyên tắc dựa vào hoạt động của enzyme DNA polymerase để tổng hợp mạch
bổ sung của trình tự cần xác định. Phản ứng có sự tham gia của dNTP và ddNTP
thiếu nhóm 3‟OH. Các bước thực hiện: (1) các đoạn DNA cần xác định trình tự
Trang 12


được tạo dòng vào một vector, sau đó tách chiết và tinh khiết các vector từ vi
khuẩn để thành các vector tự do; (2) phản ứng được thực hiện trong 4 ống, mỗi
ống chứa: vector có gắn chèn đoạn DNA cần xác định trình tự, đoạn mồi bổ
sung đặc hiệu với trình tự của vector tại vị trí chèn đoạn DNA, enzyme DNA
polymerase, bốn loại dNTP và mỗi loại ddNTP (được đánh dấu bằng đồng vị
phóng xạ 35P hay 32S); (3) bắt đầu DNA polymerase sẽ kéo các dNTP vào tổng
hợp mạch đơn và sự tổng hợp này bị dừng lại tại vị trí mà ddNTP kéo vào thay
thế. Kết quả sẽ tạo những mạch DNA có chiều dài khác nhau 1 nucleotide tương
ứng với trình tự nucleotide trên đoạn DNA gốc. Sau khi điện di trên gel
polyacrylamide, các vạch điện di này được hiển thị bằng kỹ thuật phóng xạ tự
ghi[21].
Ngày nay, việc giải trình tự được thực hiện dễ dàng nhờ có sự hỗ trợ của máy
giải trình tự tự động. Máy giải trình tự hoạt động dựa theo nguyên lý của
phương pháp Sanger có cải biến. Trong đó các ddNTP không được đánh dấu
phóng xạ mà được đánh dấu bằng chất huỳnh quang có màu khác nhau cho mỗi
loại ddNTP.

1.4. TÌNH HÌNH NGHIÊN CỨU TRONG NƢỚC

Tại Việt Nam, nhiều nghiên cứu về thành phần loài nấm Cordyceps đã được
công bố, như năm 1996 và 2001 có 3 loài nấm thuộc chi Cordyceps đó là
Cordyceps sinensis, Cordyceps militaris và Cordyceps sabrolifera[8]. Cho đến
năm 2009, Viện khoa học Lâm Nghiệp Việt Nam và trường Đại Học Lâm
Nghiệp đã tiến hành điều tra và thu mẫu nấm Cordyceps là Cordyceps nutans
(Phạm Quang Thu, 2009). Đây là loài nấm đầu tiên được mô tả và ghi nhận tại
Việt Nam[6].
Năm 2010, nhóm nghiên cứu Lê Tuấn Hưng và cộng sự đã thu thập được 259
mẫu nấm ký sinh côn trùng, phân bố chủ yếu trên lá của những cây bụi, ký sinh
trên các ký chủ thuộc tám bộ côn trùng khác nhau tại vườn quốc gia Cát Tiên,
thông qua định danh sơ bộ về hình thái có tất cả 17 chi nấm côn trùng được ghi
nhận bao gồm Akanthomyces, Aschersonia, Beauveria, Conoideocrella,
Cordyceps,

Gibellula,

Hirsutella,

Hymenostilbe,

Hypocrella,

Isaria,
Trang 13


Metarhizium,

Moelleriella,


Nomuraea,

Ophiocordyceps,

Paecilomyces,

Torrubiella và Verticillium. Tất cả các chi ghi nhận được đều thuộc ngành
Ascomycota, bộ Hypocreales. Trong đó đa số các loài ghi nhận được ở trạng thái
vô tính, riêng loài hữu tính của Aschersonia là Hypocrella và Moelleriella là
những loài có ký chủ đặc hiệu là rệp sáp (bộ Homoptera) sống bám trên mặt
dưới lá cây[4].
Năm 2011, tại viện Công Nghệ Sinh Học, Trường Đại Học Cần Thơ đã phân lập
và định danh được 5 chủng nấm ký sinh côn trùng thuộc loài Metarhizium
anisopliae và Beauveria bassiana ở đồng bằng sông Cửu Long bằng phương
pháp PCR[3].
Một số nhóm nghiên cứu đã hợp tác với chuyên gia nước ngoài để điều tra nấm
Cordyceps tại các vườn quốc gia như Hoàng Liên, Tam Đảo, Cúc Phương, Cát
Tiên,… Cụ thể, năm 2009-2014, nhà nghiên cứu Đinh Minh Hiệp và Trương
Bình Nguyên và cộng sự đã thu thập 124 mẫu nấm ký sinh côn trùng thuộc
nhóm nấm Cordyceps tại Tây Nguyên cho kết quả 37 mẫu thuộc chi Cordyceps,
8 mẫu thuộc chi Ophiocordyceps, 15 mẫu thuộc Isaria, 7 mẫu thuộc chi
Metarhizium, 6 mẫu thuộc Beauveria, 4 mẫu thuộc Hirsutella, 2 mẫu thuộc chi
Torrubiella, 2 mẫu thuộc chi Gibellula, 1 mẫu thuộc chi Hypocrella, 1 mẫu
thuộc chi Akanthomyces, 1 mẫu thuộc chi Aschersonia và 1 mẫu thuộc chi
Hymenostibe thông qua định danh hình thái - giải phẫu và xây dựng bộ tiêu bản
mẫu vật được lưu tại Công ty Cổ Phần Nguyên Long (Lâm Đồng)[2]. Đồng thời,
nhóm nghiên cứu đã xây dựng được cơ sở dữ liệu cục bộ vùng gene ITS1-5, 8SITS2 nhóm nấm Cordyceps, dựa vào sự biến động của vùng gen ITS và kết hợp
với ứng dụng tin - sinh học đã định danh được 27 mẫu trong các mẫu nói trên[2].
Năm 2010, Lê và cs cũng đã thành công trong việc phát hiện loài nấm ký sinh
côn trùng Cordyceps neovolkiana tại núi Langbian - Đà Lạt là mẫu DL004,

thông qua kết hợp định danh hình thái học cùng với phân tích phát sinh loài dựa
trên vùng trình tự ITS rDNA[5].
Đến năm 2015, nhóm nghiên cứu Vu và cs đã thành công trong việc định danh 2
mẫu nấm DL0038A, DL0038B thu được từ núi Langbian, Đà Lạt là loài nấm ký
Trang 14


sinh côn trùng Cordyceps Takaomontana dựa vào xác định hình thái và phân
tích phát sinh loài của gen nrLSU với gen rpb1[47].

1.5. PHẢ HỆ PHÂN TỬ[11]
Phả hệ phân tử là nghiên cứu về lịch sử tiến hóa của các loài sinh vật. Thông
thường việc phân tích cây phát sinh loài dựa trên so sánh các trình tự nucleotide,
các cặp base hoặc acid amin trong một chuỗi trình tự, kết hợp với thuật toán máy
tính để suy ra mối quan hệ tiến hóa giữa các loài sinh vật, nó trở thành cơ sở cho
việc phân loại nói chung và phân tích tiến hóa nói riêng[17][23]. Một trong các
mục tiêu xây dựng cây phát sinh loài dựa trên các trình tự phân tử, là nhằm mô
tả lại lịch sử tiến hoá của các loài sinh vật theo thời gian, chúng có những đặc
tính khác nhau, nhưng cùng có mối quan hệ họ hàng với nhau và cùng hình
thành từ một tổ tiên chung trong quá khứ. Cụ thể, lịch sử tiến hóa được suy luận
từ việc phân tích cây phát sinh loài dựa trên sự phân nhánh (clade), mỗi nhánh
đại diện cho một nhóm loài có những đặc điểm hình thái hay gen tương đồng
nhau. Đồng thời, một cây phát sinh loài được xây dựng bởi bộ dữ liệu có thể
chứa hàng trăm loài khác nhau, mỗi loài trong số đó có thể thay đổi tỷ lệ đột
biến theo thời gian ảnh hưởng đến sự thay đổi của quá trình tiến hóa[17][33].
Hiện nay, các nhà nghiên cứu kết hợp giữa thuật giải máy tính với sự phát triển
khoa học công nghệ để xây dựng cây phát sinh loài chính xác nhất từ các dữ liệu
sinh học[23]. Một số phần mềm được sử dụng hiện nay: MEGA6, PHYLIP,
PAUP,… Hơn nữa, độ chính xác của quá trình suy luận này còn phụ thuộc rất
lớn vào cấu trúc và kích thước dữ liệu sử dụng cùng với việc chọn mô hình phù

hợp để đánh giá các đặt tính phân tử trên[33][46].
Để mô tả lại mối quan hệ của các loài qua cây phả hệ phân tử các nhà nghiên
cứu chủ yếu qua ba bước:
Sắp cột thẳng hàng (xây dựng mô hình dữ liệu và khai thác bộ dữ liệu của
cây phát sinh loài)
Xác định mô hình thay thế.
Xây dựng cây phát sinh loài.

Trang 15


Mỗi bước đều có vai trò quan trọng cho việc phân tích và cần xử lý phù hợp,
các bước này phải có liên kết để tạo ra một cây tốt.
Bước 1: Sắp cột thẳng hàng (xây dựng mô hình dữ liệu và xử lý bộ dữ liệu
của cây phát sinh loài)
Bước sắp cột thẳng hàng này là một trong những bước quan trọng nhất trong
phân tích phát sinh loài bởi vì nó tạo ra bộ dữ liệu để sử dụng cho mô hình của
sự tiến hóa. Bước đầu tiên là xác định bộ dữ liệu cục bộ bao gồm protein hay
các chuỗi trình tự DNA mục tiêu[17][21].
Bộ dữ liệu trình tự phát sinh loài thường bao gồm nhiều trình tự sắp xếp thẳng
hàng. Vị trí sắp xếp các trình tự đại diện cho việc kết luận trong phân tích phát
sinh loài, vì chứa các ký tự mà có thể dựa vào đặc tính của ký tự này để biết
mức độ tương đồng hoặc mối quan hệ giữa các loài. Phần mềm điển hình được
áp dụng cho quá trình sắp xếp gióng cột là Clustal W cho phép chỉnh sửa sắp
xếp thẳng hàng bằng mắt và xem xét đưa ra xây dựng cây. Clustal W sắp xếp
theo một tiêu chuẩn phát sinh loài là cây định hướng (guide tree), những cây
định hướng được tạo ra chủ yếu dựa trên cơ sở sắp xếp cặp đôi (pairwise) trình
tự ban đầu theo thuật toán phân nhóm và cây được định dạng ở tiêu chí cây
PHYLIP.
Phương pháp này sẽ cho phép xác định và xử lý những vùng trình tự không rõ

ràng và kiểm tra việc chèn hoặc xóa vùng indels (gap) để xây dựng cây phát
sinh loài.
Trong bước sắp xếp thẳng hàng chiều dài của trình tự sẽ không đồng nhất và bộ
dữ liệu phát sinh loài thường không giống nhau. Nguyên nhân dẫn đến sự
không đồng nhất về chiều dài là xuất hiện các vùng indels. Cách giải quyết
indels là tiến hành đồng bộ hóa chiều dài trình tự bằng cách loại bỏ phân tích tất
cả các vùng chứa “gap” (Swofford et al., 1996). Cách này có ưu điểm chọn mô
hình tiến hóa phù hợp nhất. Nhược điểm của phương pháp này là tín hiệu phát
sinh loài chứa trong vùng indels sẽ bị loại bỏ.
Bước 2: Xác định mô hình tiến hóa

Trang 16


×