Tải bản đầy đủ (.pdf) (79 trang)

Hỗ trợ định danh các mẫu nấm ký sinh côn trùng bằng phân tích phát sinh chủng loài dựa trên vùng gen nrLSU và rpb1

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.33 MB, 79 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƢỜNG ĐẠI HỌC MỞ TP.HCM

KHÓA LUẬN TỐT NGHIỆP

Tên đề tài:

HỖ TRỢ ĐỊNH DANH CÁC MẪU NẤM KÝ
SINH CÔN TRÙNG BẰNG PHÂN TÍCH
PHÁT SINH CHỦNG LOÀI DỰA TRÊN
VÙNG GEN nrLSU VÀ Rpb1

KHOA CÔNG NGHỆ SINH HỌC
CHUYÊN NGÀNH: VI SINH – SINH HỌC PHÂN TỬ

CBHD: ThS. Lao Đức Thuận
CN. Vũ Tiến Luyện
SVTH: Nguyễn Thị Thu Thảo
MSSV: 1153010761
Khóa: 2011 - 2015

Bình Dương, tháng 05 năm 2015


LỜI CẢM ƠN
Để hoàn thành đề tài này, ngoài sự cố gắng của bản thân còn có sự hướng dẫn của
thầy cô, anh chị và sự giúp đỡ của bạn bè.
Đầu tiên, em xin chân thành cảm ơn tất cả các thầy cô Khoa Công nghệ Sinh Học
Trường Đại học Mở Thành phố Hồ Chí Minh đã truyền đạt cho em những kiến thức
nền tảng nhất, em xin cảm ơn thầy Lao Đức Thuận, người đã trực tiếp hướng dẫn
em trong suốt quá trình thực hiện và hoàn thành chuyên đề khóa luận tốt nghiệp,


luôn bên cạnh định hướng, truyền đạt kinh nghiệm, động viên em hoàn thành đề tài.
Bên cạnh đó, em cũng xin cảm ơn anh Vũ Tiến Luyện đã luôn nhiệt tình giúp đỡ,
hướng dẫn, chia sẻ cho em nhiều kinh nghiệm giúp em thực hiện tốt đề tài.
Con cảm ơn mẹ và gia đình đã luôn bên con, tạo mọi điều kiện tốt nhất để con hoàn
thành việc học của mình.
Em xin chân thành cảm ơn những anh, chị và các bạn trong phòng thí nghiệm Sinh
học phân tử Trường Đại học Mở Thành phố Hồ Chí Minh đã luôn quan tâm, giúp
đỡ em trong quá trình làm đề tài.
Một lần nữa, em xin gửi đến tất cả các thầy cô, anh chị, bạn bè lời biết ơn và kính
chúc sức khỏe, may mắn, gặt hái nhiều thành công trong tương lai.

Bình Dương, Ngày 05 tháng 05 năm 2015
SINH VIÊN

Nguyễn Thị Thu Thảo


Danh mục các hình
Hình 1.1. Ophiocordyceps sinensis
Hình 1.2. Cấu trúc của rDNA và vùng gen nrLSU với cặp mồi LR0R/LR5
Hình 1.3. Cấu trúc vùng gen Rpb1
Hình 2.1. Hình thái giải phẫu mẫu nấm DL0038A
Hình 2.2. Hình thái giải phẫu mẫu nấm DL0038B
Hình 2.3. Hình thái giải phẫu nấm DL0069
Hình 2.4. Hình thái giải phẫu mẫu nấm DL0075
Hình 3.1. Kết quả kiểm tra cặp mồi LR0R/LR5 bằng BLAST (NCBI)
Hình 3.2. Kết quả kiểm tra cặp mồi CRPB1/RPB1Cr bằng BLAST (NCBI)
Hình 3.3. Mồi xuôi LR0R được sắp gióng cột với các trình tự nrLSU của các loài
trong chi Cordyceps
Hình 3.4. Mồi ngược LR5 được sắp gióng cột với các trình tự nrLSU của các loài

trong chi Cordyceps
Hình 3.5. Mồi xuôi CRPB1 được sắp gióng cột với các trình tự Rpb1 của các loài
trong chi Cordyceps
Hình 3.6. Mồi xuôi RPB1Cr được sắp gióng cột với các trình tự Rpb1 của các loài
trong chi Cordyceps
Hình 3.7. Sử dụng Annhyb để kiểm tra vị trí bắt cặp và kích thước sản phẩm với
Ophiocordyceps coccidiicola
Hình 3.8. Sử dụng Annhyb để kiểm tra vị trí bắt cặp và kích thước sản phẩm với
Cordyceps militaris
Hình 3.9. Kết quả điện di sản phẩm PCR gen nrLSU và Rpb1 tách chiết theo
phương pháp phenol:chloroform
Hình 3.10. Kết quả điện di sản phẩm PCR gen nrLSU và Rpb1 tách chiết theo
phương pháp phenol:chloroform bổ sung β-mercaptoethanol
Hình 3.11. Kết quả điện di sản phẩm PCR gen nrLSU và Rpb1 tách chiết theo
phương pháp phenol:chloroform bổ sung β-mercaptoethanol và CTAB
Hình 3.12. Mô tả sự sai khác nu ở hai mạch xuôi và ngược gen nrLSU ở đầu 3‟


Hình 3.13. Hiệu chỉnh vùng tín hiệu bị nhiễu ở một mạch của nrLSU
Hình 3.14. Thể hiện mức độ tương đồng của trình tự hai mạch
Hình 3.15. Vị trí sai lệch của hai kết quả giải trình tự ở đầu mạch xuôi của nrLSU
Hình 3.16. Mô tả sự sai khác nu ở hai mạch xuôi và ngược gen nrLSU ở đầu 5‟
Hình 3.17. Hình kết quả BLAST trình tự nrLSU mạch xuôi đã hiệu chỉnh
Hình 3.18. Kết quả xây dựng cây phát sinh loài dựa trên vùng gen nrLSU bằng
phương pháp Maximum Likelihood
Hình 3.19. Kết quả xây dựng cây phát sinh loài dựa trên vùng gen Rpb1 bằng
phương pháp Maximum Likelihood
Hình 3.20. Kết quả xây dựng cây phát sinh loài dựa trên vùng gen nrLSU kết hợp
với Rpb1 bằng phương pháp Maximum Likelihood



Danh mục các bảng
Bảng 2.1. Trình tự các mồi đánh giá trong đề tài
Bảng 2.2. Các thông số thiết lập cho chu kì nhiệt trong phản ứng PCR khuếch đại
vùng gen nrLSU và Rpb1
Bảng 3.1. Thông tin về trình tự và các thông số vật lí của cặp mồi được sử dụng để
khuếch đại vùng gen nrLSU và Rpb1
Bảng 3.2. Kết quả kiểm tra DNA bằng quang phổ kế khảo sát trên 4 mẫu nấm ký
sinh côn trùng được tách chiết theo phương pháp phenol:chlloroform
Bảng 3.3. Kết quả kiểm tra DNA bằng quang phổ kế khảo sát trên 4 mẫu nấm ký
sinh côn trùng được tách chiết theo phương pháp phenol:chlloroform có bổ sung βmercaptoethanol
Bảng 3.4. Kết quả kiểm tra DNA bằng quang phổ kế khảo sát trên 4 mẫu nấm ký
sinh côn trùng được tách chiết theo phương pháp phenol:chlloroform có bổ sung βmercaptoethanol và CTAB
Bảng 3.5. Hiệu chỉnh các nu tại các vị trí (1) đến (8)
Bảng 3.6. Tổng hợp kết quả hiệu chỉnh trình tự các mẫu nấm ký sinh côn trùng
Bảng 3.7. Kết quả chiều dài các trình tự trước và sau hiệu chỉnh
Bảng 3.8. Thông tin các trình tự được sử dụng để xây dựng cơ sở dữ liệu vùng gen
nrLSU, Rpb1 sau khi tinh chế
Bảng 3.9. Tổng hợp kết quả dò tìm mô hình tiến hóa bằng chức năng Find Best
DNA/Protein Models (ML) trong phần mềm MEGA 6.06 dựa trên bộ CSDL gen
nrLSU , Rpb1 và nrLSU_Rpb1
Bảng 3.10. Tổng hợp kết quả định danh các mẫu nấm từ dữ liệu phân tử và hình
thái


Mục lục
ĐẶT VẤN ĐỀ ............................................................................................................1
PHẦN 1.
1.1.


TỔNG QUAN TÀI LIỆU

Tổng quan về các loài nấm ký sinh công trùng ............................................3

1.1.1.

Đặc điểm chung và thành phần loài ...........................................................3

1.1.2.

Tiềm năng ứng dụng ..................................................................................4

1.2.

Nghiên cứu hỗ trợ định danh và phát sinh loài ............................................6

1.2.1.

Đặc điểm nhận dạng và định danh .............................................................6

1.2.2.

Trình tự nrLSU và Rpb1 trong định danh phân tử nấm .............................8

1.3.

Tình hình nghiên cứu trong nƣớc ................................................................11

1.4.


Kỹ thuật PCR và giải trình tự .....................................................................13

1.4.1.

Kỹ thuật PCR ...........................................................................................13

1.4.2.

Kỹ thuật giải trình tự ................................................................................14

1.5.

Nghiên cứu phát sinh loài .............................................................................14

PHẦN 2.

VẬT LIỆU VÀ PHƢƠNG PHÁP

2.1.

Bộ mẫu nấm ký sinh côn trùng ....................................................................21

2.2.

Dụng cụ - thiết bị - hóa chất .........................................................................23

2.2.1.

Dụng cụ ....................................................................................................23


2.2.2.

Thiết bị .....................................................................................................23

2.2.3.

Hóa chất....................................................................................................24

2.3.

Danh mục các phần mềm sử dụng...............................................................24

2.4.

Phƣơng pháp nghiên cứu .............................................................................25

2.4.1.

Khảo sát In silico ......................................................................................25

2.4.2.

Thực nghiệm ............................................................................................26

2.4.3.

Phân tích phát sinh loài ............................................................................30

PHẦN 3.
3.1.


KẾT QUẢ - BIỆN LUẬN

Kết quả đánh giá mồi ....................................................................................31

3.1.1.

Kết quả đánh giá mồi bằng IDT ...............................................................31


3.1.2.

Kiểm tra mồi bằng BLAST trên NCBI ....................................................33

3.1.3.

Kiểm tra mồi bằng sắp gióng cột với Clustal ...........................................35

3.1.4.

Kết quả kiểm tra Annhyb .........................................................................36

3.2.

Kết quả thực nghiệm.....................................................................................38

3.3.

Kết quả hiệu chỉnh trình tự..........................................................................42


3.5.

Xây dựng bộ cơ sở dữ liệu ............................................................................47

3.6.

Kết quả dựng cây phát sinh loài ..................................................................50

PHẦN 4.

KẾT LUẬN VÀ ĐỀ NGHỊ

4.1.

Kết luận ..........................................................................................................60

4.2.

Đề nghị ...........................................................................................................60

TÀI LIỆU THAM KHẢO ......................................................................................62


DANH SÁCH CHỮ VIẾT TẮT
Rpb1:

RNA polymerase binding 1

nrLSU:


nuclear ribosomal large subunit

DNA:

Deoxyribonucleic acid

RNA:

Ribonucleic acid

rDNA:

ribosomal deoxyribonucleic acid

rRNA:

ribosomal ribonucleic acid

PCR:

Polymerase Chain Reaction

BLAST:

Basic Local Alignment Search Tool

NCBI:

National Center for Biotechnology Information


IDT:

Integrated DNA Technologies

MP:

Maximum Marsimony

ML:

Maximum Likelihood

NJ:

Neighbor-Joining

bp:

base-pair

nu:

nucleotide


Khóa luận tốt nghiệp

ĐẶT VẤN ĐỀ
Cordyceps là một chi nấm ký sinh trên côn trùng thuộc ngành nấm túi Ascomycota,
với hơn 400 loài đã được mô tả. Trong đó, Cordyceps sinensis (Đông Trùng Hạ

Thảo) là loài được biết đến nhiều nhất và là một dược liệu đã được sử dụng từ lâu
trong y học cổ truyền của nhiều nước châu Á. Những nghiên cứu, đánh giá về
Cordyceps và các thành phần hóa học của chúng cho thấy nhiều ứng dụng điều trị
tiềm năng, điển hình như: khả năng ức chế các tế bào khối u, điều hòa hệ thống
miễn dịch, có tác dụng chống viêm và tác dụng tích cực đối với các bệnh tim mạch,
tiểu đường, cải thiện chức năng gan, thận, ...
Định danh các loài nấm ký sinh côn trùng là một vấn đề cấp thiết nhưng còn gặp
nhiều khó khăn và hạn chế trong công tác định danh dựa trên hình thái do chúng
được phân biệt với nhau dựa theo màu sắc và hình dạng quả thể, bào tử hay ký
chủ,... Bên cạnh đó, khả năng biến đổi cao theo điều kiện môi trường, vùng địa lý,
thành phần loài phong phú và sự biến đổi giữa thể vô tính (anamorph) và thể hữu
tính (teleomorph) cũng là những nguyên nhân dẫn đến nhiều mâu thuẫn trong thành
phần loài của chi nấm này. Để giải quyết những vấn đề trên, các kỹ thuật phân tử đã
được áp dụng để hỗ trợ công tác phân loại các loài nấm. Vùng gene mã hoá cho
RNA ribosome (DNA ribosome, rDNA) đã được sử dụng phổ biến để nghiên cứu
trong nhiều năm gần đây. rDNA là nhóm gene có nhiều bản sao, không mã hóa cho
bất kì protein nào và là vùng gen bảo tồn nên được xem là cơ sở chính xác để tìm ra
sự tương đồng hay khác biệt giữa các sinh vật cùng loài hay khác loài. Tuy nhiên,
cây phát sinh loài được xây dựng dựa trên dữ liệu của những vùng gen mã hóa
rRNA của ribosome vẫn chưa giải quyết được mối quan hệ ở cấp độ chi và loài.
House-keeping genes là những gen được biểu hiện thường xuyên ở mức tương đối
ổn định trong bất kì điều kiện nào, chúng mã hóa cho các protein giữ vai trò quan
trọng liên quan đến những chức năng cần thiết cho quá trình nuôi dưỡng và duy trì
tế bào. Nhờ vậy, trong định danh phân tử nấm housekeeeping genes đã được sử
dụng nhiều vì chúng là những vùng trình tự bảo tồn cao giúp ích cho việc so sánh và
phân tích mối quan hệ giữa các loài. Hiện nay, hướng nghiên cứu kết hợp nhiều gen
SVTH: Nguyễn Thị Thu Thảo

1



Khóa luận tốt nghiệp

gồm gen mã hóa rRNA của ribosome và gen mã hóa protein đang phổ biến và đem
lại nhiều kết quả giúp định danh tốt hơn.
Đông Trùng Hạ Thảo đã được sử dụng từ lâu, tuy nhiên, do sự khan hiếm và giá
cao, nhiều sản phẩm không rõ nguồn gốc được bày bán trên thị trường dẫn đến sự
cần thiết phải kiểm soát và thẩm định chất lượng. Do đó, việc hiểu biết đầy đủ về
thành phần loài sẽ tạo diều kiện cho việc khai thác, nuôi trồng nội địa nguồn dược
liệu quý này, đồng thời, góp phần làm giảm giá thành và kiểm soát chất lượng sản
phẩm. Hơn nữa, việc có được những thông tin khoa học đầy đủ và chính xác sẽ là
cơ sở cho các nghiên cứu ứng dụng sau này ở Việt Nam.
Trong giới hạn đề tài, chúng tôi sẽ tiếp cận vùng gen nrLSU kết hợp Rpb1 và xây
dựng cơ sơ dữ liệu cục bộ vùng gen này, tiến hành thực nghiệm xây dựng quy trình
tách chiết DNA từ hệ sợi nấm, quy trình PCR để khuếch đại vùng gen mục tiêu
nrLSU, Rpb1, giải trình tự, xây dựng và so sánh các cây phả hệ phân tử từ cơ sở dữ
liệu thu thập được. Quy trình này nhằm hỗ trợ định danh chính xác các loài nấm ký
sinh côn trùng, góp phần xây dựng một quy trình định danh nấm tin cậy, làm cơ sở
cho các nghiên cứu ứng dụng ở Việt Nam.

SVTH: Nguyễn Thị Thu Thảo

2


PHẦN 1. TỔNG QUAN
TÀI LIỆU


Khóa luận tốt nghiệp


1.1. TỔNG QUAN VỀ CÁC LOÀI NẤM KÝ SINH CÔNG
TRÙNG
2.1.1. Đặc điểm chung và thành phần loài
Cordyceps là một chi nấm ký sinh trên côn trùng thuộc họ Clavicipitaceae, bộ
Hypocreales, lớp Sordariomycetes, ngành nấm túi Ascomycota [47]. Trong đó,
Cordyceps sinensis là loài được biết đến sớm nhất với tên gọi Đông Trùng Hạ Thảo.
Đây là dạng ký sinh của Cordyceps sinensis trên trên các ấu trùng của các loài sâu
thuộc chi Hepialus. Phần lớn các loài trong chi Cordyceps được biết đến với những
giá trị y dược độc đáo và quý hiếm được sử dụng trong y học cổ truyền một số quốc
gia Đông Á như Trung Hoa hay Tây Tạng [24].
Phân loại khoa học:
Giới (Kingdom): Fungi
Phân giới (Subkingdom): Dikarya
Ngành (Phylum): Ascomycota
Phân ngành (Subphylum): Pezizomycotina
Lớp (Class): Sordariomycetes
Phân lớp (Subclass): Hypocreomycetidae
Bộ (Order): Hypocreales
Họ (Family): Clavicipitaceae
Chi (Genus): Cordyceps

Hình 1.1. Ophiocordyceps sinensis [62]

Trong tự nhiên, Cordyceps sinh sôi nảy nở tốt trong các khu rừng ôn đới và nhiệt
đới ẩm ướt. Chúng phải trải qua nhiều giai đoạn phát triển phức tạp để hoàn thành
chu kỳ sinh trưởng, từ giai đoạn sống trong đất tới sau khi lây nhiễm vào cơ thể ấu
trùng và chịu sự cạnh tranh với các vi khuẩn khác, thậm chí cả sự tham gia của
nhiều loài khác thuộc chi nấm Cordyceps. Ở giai đoạn đầu, bào tử nấm nhiễm vào
cơ thể sâu non, nhộng, sâu trưởng thành nằm dưới đất hoặc trên mặt đất. Trong suốt

mùa đông, những ấu trùng này sẽ ngủ đông, lượng dinh dưỡng tích trữ được đủ để
duy trì sự sống trong bốn tháng. Nấm ký sinh sẽ tấn công cơ thể các ấu trùng ngủ

SVTH: Nguyễn Thị Thu Thảo

3


Khóa luận tốt nghiệp

đông này và sử dụng các chất hữu cơ trong cơ thể côn trùng làm thức ăn, trong
nhiều trường hợp, nấm ký sinh còn tác động đến hành vi của vật chủ. Vào mùa
đông, nhiệt độ và ẩm độ không khí thấp, nấm ký sinh ở dạng hệ sợi, phát triển trên
toàn thân sâu để hút chất dinh dưỡng làm cho sâu chết. Đến mùa hè, nhiệt độ và ẩm
độ không khí cao, nấm chuyển sang giai đoạn sinh sản hữu tính, hình thành thể quả.
Do vậy, quả thể của Cordyceps thường được tìm thấy trên xác nhộng hoặc ấu trùng
của côn trùng sau một thời gian nhiễm nấm [25, 57].
Cordyceps là một chi nấm có thành phần loài phong phú với hơn 400 loài đã được
mô tả, phân bố chủ yếu ở Châu Á, đặc biệt là vùng Đông Á, ngoài ra còn có ở Châu
Úc và một số nước Châu Âu. Chúng thường được tìm thấy ở các cao nguyên ở độ
cao trên 4.000 - 5.000 m so với mặt nước biển như Himalaya, Tây Tạng, Tứ Xuyên,
Thanh Hải, Cam Túc, Vân Nam… [25, 47].

2.1.2. Tiềm năng ứng dụng
1.1.2.1.

Y dược

Trên thế giới, các nghiên cứu về Đông Trùng Hạ Thảo rất được các nhà khoa học
quan tâm, phần dược tính của thuốc đã được chứng minh là do các chất chiết xuất từ

nấm Cordyceps sinensis. Các phân tích hoá học cho thấy trong sinh khối của
Cordyceps sinensis có chứa nhiều thành phần dinh dưỡng như: các amino acid,
vitamin E, K, B1, B2, B12, C… Ngoài ra, chúng còn chứa nhiều đường (bao gồm
cả mono-, di-, oligosaccharide và nhiều phức hợp polysaccharide), protein, sterol,
nucleoside và các nguyên tố vi lượng như K, Na, Ca, Mg, Fe, Cu, Mn, Zn, Pi, Se,
Al, Si, Ni, Sr, Ti, Cr, Ga, V, và Zr [25]. Trong dịch nuôi cấy và sinh khối
Cordyceps sinensis có nhiều hoạt chất sinh học có giá trị dược liệu cao như
cordycepin, acid cordyceptic, adenosin, hydroxyethyl-adenosin, nhóm hoạt chất
Hydroxy-Etyl-Adenosin- Analogs (HEAA),… [25].
Cordycepin (3'-deoxyadenosine, C10H13N5O3) là một trong những hoạt chất sinh học
quan trọng nhất được tìm thấy ở các loài Cordyceps thể hiện tính kháng khuẩn,
chống ung thư, chống di căn, điều hòa miễn dịch [44]. Ngoài ra, cordycepin trong tế
bào có thể chuyển đổi thành 5'-mono-, di- và triphosphate ức chế sự hoạt động của
một số enzyme trong con đường sinh tổng hợp purine [38].
SVTH: Nguyễn Thị Thu Thảo

4


Khóa luận tốt nghiệp

Ngoài Cordyceps sinensis, nhiều loài khác trong chi Cordyceps cũng có tiềm năng
ứng dụng trong y dược rất lớn, tiêu biểu như Cordyceps militaris [41, 30],
Cordyceps pruinosa [31], Cordyceps cicadae [51],… Những nghiên cứu, đánh giá
về Cordyceps và các thành phần hóa học của chúng cho thấy nhiều ứng dụng điều
trị tiềm năng, điển hình là: khả năng ức chế các tế bào khối u [25, 19], điều hòa hệ
thống miễn dịch [54, 25] và tác dụng chống viêm [52, 33]. Ngoài ra, chúng còn có
tác dụng tích cực đối với các bệnh tim mạch, tiểu đường, cải thiện chức năng gan,
thận [25], thúc đẩy việc tiết ra các hormone tuyến thượng thận [50], giảm huyết áp
và sự căng cơ [20], điều hòa đường máu [34]…

Hiệu quả chống ung thư: khả năng ức chế sự phát triển của các khối u được phát
hiện ở nhiều loài của chi Cordyceps, các thành phần hoạt tính sinh học có tác động
chống ung thư chủ yếu là polysaccharide, sterols và adenosine. Trong đó, sterols và
adenosine là các chủ đề nghiên cứu đang rất được quan tâm về khả năng chống ung
thư [53].
Tác động điều hòa miễn dịch: các tác động chính của Cordyceps là đáp ứng tăng
sinh lymph, tế bào giết tự nhiên (NK), và kích thích tạo thành: ngưng kết tố thực vật
(PHA), interleukin-2 (IL-2), hoại tử tế bào ung thư (TNF- α) trên các tế bào đơn
nhân ở người do sự sản xuất của cytokines. Các tác động trị liệu như ngăn chặn
bệnh tự miễn, dị ứng cũng có liên quan đến tác động điều hòa miễn dịch [53].
Tác động bảo vệ gan: các thử nghiệm trên động vật và dữ liệu từ các phòng khám
cho thấy Cordyceps có tác dụng bảo vệ gan của bệnh nhân viêm gan A, viêm gan B
mạn tính, viêm gan C, xơ gan. Chúng làm tăng các tế bào hữu cơ có chức năng điều
hòa, tăng cường chức năng gan và ức chế xơ gan [53].
Trong những năm gần đây, Cordyceps trở thành nguồn nguyên liệu rất quan trọng
cho làm thuốc và thực phẩm chức năng. Hiện nay, sự phát triển của Cordyceps và
các chế phẩm của chúng chủ yếu tập trung vào ba hướng là thuốc ăn kiêng, thực
phẩm chức năng và phát triển dược tính. Hầu hết các hoạt chất sinh học chiết xuất
từ Cordyceps đều là các chất chống lão hóa, giúp điều hòa giấc ngủ và đã được cấp
phép như một nguồn thuốc mới bởi SFDA (Trung Quốc) [53].

SVTH: Nguyễn Thị Thu Thảo

5


Khóa luận tốt nghiệp

1.1.2.2.


Kiểm soát sinh học

Nấm ký sinh côn trùng là thiên địch phổ biến của các loài chân khớp và được xem
là các đối tượng kiểm soát sinh học [23, 42]. Nhiều loài nấm ký sinh côn trùng đã
được ứng dụng rộng rãi trong đấu tranh sinh học kiểm soát dịch hại, trong đó phổ
biến là các loài Beauveria bassiana, Metarhizium anisopliae và Normurea rileyi
[13, 5]. Trên thị trường hiện có sản phẩm thuốc trừ sâu sinh học Green Muscle được
làm từ nấm Metarhizium anisopliae var. acridum giúp thay thế thuốc trừ sâu hóa
học để kiểm soát châu chấu ở Châu Phi. Tại Việt Nam, nhiều nghiên cứu đã thành
công trong việc sử dụng nấm ký sinh côn trùng phòng trị các loại côn trùng và sâu
hại cây trồng, điển hình như nấm Metarhizium anisopliae và Beauveria bassiana đã
được ứng dụng trong phòng trừ mối nhà [4], sâu khoang hại cải xanh [14], sâu hại
đậu tương và đậu xanh [11], rầy mềm và các loài sâu hại lúa [6, 12].

1.2. NGHIÊN CỨU HỖ TRỢ ĐỊNH DANH VÀ PHÁT SINH
LOÀI
1.2.1. Đặc điểm nhận dạng và định danh
Trước đây, việc định danh và xây dựng hệ thống học các loài nấm ký sinh côn trùng
chủ yếu dựa trên phân tích hình thái. Năm 1982, Kobayashi đã xây dựng nên khóa
định danh cho nhóm Cordyceps và Torrubiella bao gồm 282 loài Cordyceps, 59 loài
Torrubiella và 75 loài thuộc về các chi lân cận khác. Đến nay, khóa phân loại này
vẫn được xem là hữu hiệu nhất trong việc định danh nhóm nấm này theo phương
pháp cổ điển [32].
Họ Clavicipitaceae được nhận biết qua các đặc điểm như: thể túi dạng trụ, đỉnh túi
dày và các túi bào tử dạng sợi thường có thể ngắt rời thành nhiều bào tử thứ cấp
[47]. Theo kết quả nghiên cứu của Sung và cộng sự (2007), hệ thống nhóm nấm
Cordyceps và Clavicipitaceae được phân loại lại thành ba họ đơn ngành:
Clavicipitaceae s.s. (Clavicipitaceae clade A), Cordycipitaceae (Clavicipitaceae
clade B) và Ophiocordycipitaceae (Clavicipitaceae clade C). Dựa theo sự phát sinh
loài này, Cordyceps sensu Kobayasi và Mains được chia thành bốn chi là Cordyceps

s. s., Elaphocordyceps, Metacordyceps và Ophiocordyceps. Hệ thống phân loại hiện

SVTH: Nguyễn Thị Thu Thảo

6


Khóa luận tốt nghiệp

tại của các loài nấm ký sinh côn trùng như sau: Clavicipitaceae gồm
Conoideocrella,

Hypocrella,

Metacordyceps,

Moelleriella,

Orbiocrella,

Regiocrella, Samuelsia, Shimizuomyces, Villosiclava; Cordycipitaceae gồm
Ascopolyporus, Cordyceps, Hyperdermium, Torrubiella và Ophiocordycipitaceae
gồm Cordyceps s.l., Elaphocordyceps, Ophiocordyceps [47, 58].
Một số đặc điểm định danh hình thái điển hình của các chi nấm ký sinh côn trùng
như Cordyceps s. s. có quả thể mềm, màu vàng nhạt hoặc màu sáng (điển hình là
Cordyceps militaris), ký sinh trên ấu trùng/nhộng Lepidoptera và Coleoptera, tìm
thấy trong các lớp lá mục, rêu hoặc tầng đất mặt; Elaphocordyceps ký sinh trên
nhộng ve sầu; Metacordyceps quả thể nấm có màu từ trắng (Metarcordyceps
youngmunensis) đến màu hoa cà, màu tím hoặc xanh lá cây, các mẫu nấm khô có
màu sẫm hơn hoặc màu đen (Metarcordyceps taii), chất nền xơ và không dày như

của chi Cordyceps s.s., ký chủ thường ở sâu trong đất; Ophiocordyceps có sắc tố
sẫm, thường tấn công sâu non, được tìm thấy trong đất (Ophiocordyceps sinensis)
hoặc gỗ mục (Ophiocordyceps variabilis), hình thái quả thể đa dạng tùy theo loài,
có thể dạng sợi, dẻo dai hoặc hình chùy, xơ [58].
Định danh các loài nấm ký sinh côn trùng, đặc biệt là chi nấm Cordyceps là một vấn
đề cấp thiết nhưng còn gặp nhiều khó khăn trong công tác định danh dựa trên hình
thái do chúng được phân biệt với nhau dựa theo màu sắc và hình dạng quả thể, bào
tử hay ký chủ,... [43, 47, 49]. Đồng thời, khả năng biến đổi cao theo điều kiện môi
trường, vùng địa lý, sự biến đổi giữa thể vô tính (anamorph) và thể hữu tính
(teleomorph) và thành phần loài phong phú cũng là những nguyên nhân dẫn đến
những mâu thuẫn trong thành phần loài của chi nấm này. Mặt khác, Đông Trùng Hạ
Thảo đã được sử dụng từ lâu, tuy nhiên, do sự khan hiếm và giá cao, nhiều sản
phẩm không rõ nguồn gốc được bày bán trên thị trường, dẫn đến sự cần thiết phải
kiểm soát và thẩm định chất lượng [16, 37]. Do đó, việc hiểu biết đầy đủ về thành
phần loài sẽ tạo điều kiện cho việc khai thác, nuôi trồng nội địa nguồn dược liệu
quý này, đồng thời, góp phần làm giảm giá thành và kiểm soát chất lượng sản phẩm.
Hơn nữa, việc có được những thông tin khoa học đầy đủ và chính xác sẽ là cơ sở

SVTH: Nguyễn Thị Thu Thảo

7


Khóa luận tốt nghiệp

cho các nghiên cứu ứng dụng sau này. Để giải quyết những vấn đề trên, các kỹ thuật
phân tử đã được áp dụng để hỗ trợ công tác phân loại các loài nấm [26].

1.2.2. Trình tự nrLSU và Rpb1 trong định danh phân tử nấm
Định danh phân tử là phương pháp phân loại sinh vật ở mức độ phân tử dựa trên cơ

sở so sánh trình tự nucleotide và axit amin của các phân tử DNA, RNA và Protein.
Trong nghiên cứu định danh phân tử, việc lựa chọn vùng trình tự DNA, RNA,
Protein để khảo sát giữa các loài là một bước quan trọng, trình tự này cần đảm bảo
tính bảo tồn cao trong cùng một loài nhưng biến động lớn giữa các loài khác nhau.
Hiện nay, định danh phân tử đang trở thành ngành khoa học mũi nhọn trong phân
loại học, bổ sung trong phân loại học truyền thống những phương pháp nghiên cứu
mới và giải quyết các vấn đề còn chưa sáng tỏ như tính đa dạng di truyền, phát sinh
loài, hỗ trợ định danh các loài mà định danh hình thái còn hạn chế.
1.2.2.1.

Vùng gen nrLSU (nuclear ribosomal large subunit)

Đối với các loài Cordyceps, vùng gen mã hoá cho RNA ribosome đã được sử dụng
phổ biến để nghiên cứu trong nhiều năm gần đây. rDNA có nhiều bản sao và không
mã hóa cho bất kì protein nào và là vùng gen bảo tồn nên được xem là cơ sở chính
xác để tìm ra sự tương đồng hoặc khác biệt của các sinh vật cùng loài hay khác loài,
đóng vai trò quan trọng trong các nghiên cứu về quá trình tiến hóa, phát sinh loài,
định danh và xác định tính đa dạng di truyền của sinh vật, đặc biệt là nấm do việc
phân loại chúng dựa vào đặc điểm hình thái và sinh hóa thường cho kết quả chưa
thuyết phục và tốn nhiều thời gian.
Ribosome là bào quan nhỏ có trong tất cả các tế bào của sinh vật nhân sơ và sinh
vật nhân chuẩn, đảm nhiệm chức năng thực hiện quá trình sinh tổng hợp protein của
tế bào. Các ribosome được cấu tạo từ rRNA và ribosome protein. Một ribosome
gồm tiểu phần nhỏ và tiểu phần lớn. Hai tiểu đơn vị này chỉ kết hợp với nhau tạo ra
một ribosome hoạt động khi quá trình dịch mã trên mRNA thực sự bắt đầu.
Ribosome có thể nằm tự do trong tế bào chất, hay bám trên màng của mạng lưới nội
chất. RNA ribosome là một trong hai thành phần chính của ribosome. Ở sinh vật
nhân chuẩn, tiểu phần nhỏ của ribosome (40S) chứa 18S RNA, tiểu phần lớn (60S)
chứa 28S, 5.8S và 5S. RNA ribosome được phiên mã từ rDNA, rDNA bao gồm
SVTH: Nguyễn Thị Thu Thảo


8


Khóa luận tốt nghiệp

nhiều đơn vị lặp lại, mỗi đơn vị lặp lại bao gồm vùng LSU (ribosomal large subunit,
25-28S), vùng 18S, ITS (internal transcribed spacer), 5.8S, 5S RNA và vùng IGS
(intergenic spacer) (hình 1.2). Vùng IGS bao gồm phần ETS (external transcribed
spacer) và phần không phiên mã NTS (non-transcribed spacer). Vùng gen nrLSU là
vùng gen mã hóa cho RNA 25S-28S của ribosome (tiểu phần lớn của ribosome), có
tính bảo tồn cao nên phù hợp cho các nghiên cứu ở cấp họ hay xa hơn.
Một đơn vị lặp lại bao gồm vùng IGS2-18S (SSU)-ITS1-5.8S-ITS2-28S (LSU)IGS1-5S-IGS2. Trong đó vùng 18S-28S là vùng phiên mã chính, chứa thông tin di
truyền phiên mã cho rRNA - thành phần cấu trúc chính của ribosome (LSU, SSU).
Bởi rDNA gồm nhiều đơn vị lặp lại nên sau khi khuếch đại bằng mồi, kết quả sẽ thu
được một số lượng rất lớn các đoạn DNA cần khảo sát. Đây cũng là một trong
những thuận lợi của trình tự nrLSU.

Hình 1.2. Cấu trúc của rDNA và vùng gen nrLSU với cặp mồi LR0R/LR5 [55]
Cấu trúc của nrLSU ngoài những vùng bảo tồn còn có những vùng biến động gọi là
các domain D1/D2/D3 (D-divergence region, các số được đánh thứ tự 1, 2, 3… bắt
đầu từ đầu 5‟ – 3‟). Các domain khác nhau của 25-28S rDNA chứa nhiều thông tin
cho phép so sánh các cấp phân loài từ cao xuống đến cấp độ loài. Đặc biệt, vùng

SVTH: Nguyễn Thị Thu Thảo

9


Khóa luận tốt nghiệp


domain D1-D2 của LSU rDNA gần đây được xem là rất hữu ích cho việc phân loài
nhiều loài nấm. Cặp mồi LR0R/LR5 là cặp mồi phổ quát khuếch đại vùng D1-D2
trên gen nrLSU và cho sản phẩm khuếch đại khoảng 800-1000 bp. Đây là cặp mồi
được ứng dụng phổ biến trong nhiều nghiên cứu phả hệ phân tử hỗ trợ định danh
nấm ký sinh côn trùng và các loài sinh vật khác [48, 46].
1.2.2.2.

Trình tự gen Rpb1 trong định danh phân tử nấm

Vùng gen giữ nhà - housekeeping genes là những gen được biểu hiện thường xuyên
ở mức tương đối ổn định trong bất kì điều kiện nào, chúng mã hóa cho các protein
giữ vai trò quan trọng, liên quan đến những chức năng cần thiết cho quá trình nuôi
dưỡng và duy trì tế bào. Đây cũng là những vùng trình tự bảo tồn cao giúp ích cho
việc so sánh và phân tích mối quan hệ giữa các loài. Do vậy, vùng gen giữ nhà đã
được sử dụng phổ biến đối với định danh phân tử nấm. Các gen đơn bản sao mã hóa
các chuỗi polypeptide có độ dài khoảng 400 acid amin và hiện diện 65-70% trong
số tất cả các loài là những đại diện thích hợp để giải quyết các mối quan hệ phát
sinh loài sâu trong nấm [17, 45].
Rpb1 (the largest subunit of RNA polymerase II) là gen mã hóa tiểu phần lớn nhất
của RNA polymerase II (enzyme xúc tác quá trình phiên mã trong tế bào nhân
chuẩn). Rbp1 có chứa vùng lặp lại heptapeptide hay chuỗi amino acid Tyr-Ser-ProThr-Ser-Pro- (Tyrosine-Serine-Proline-Threonine-Serine-Proline-) có tên là CTD
(C-terminal domain), trong đó Ser ở vị trí thứ 5 phosphoryl hóa bởi hoạt động
kinase của TFII, kích hoạt enzyme RNA polymerase II chuyển dịch qua promotor
và phiên mã. Nhờ cấu trúc lặp lại đặc biệt này mà gen Rpb1 có độ bảo tồn cao giúp
phân biệt giữa các nhóm loài [28].

Hình 1.3. Cấu trúc vùng gen Rpb1 [60]

SVTH: Nguyễn Thị Thu Thảo


10


Khóa luận tốt nghiệp

Nghiên cứu của P. Brandon Matheny và cộng sự (2002) đã chứng minh sự hữu ích
của cùng gen Rpb1 trong việc phân tích phát sinh loài khi công bố các kết quả cho
thấy vùng gen này đem lại kết quả phân tích phát sinh loài ổn định và phù hợp hơn
vùng gen nrLSU. Theo đó, một cuộc điều tra so sánh phát sinh học của nấm sử dụng
các trình tự gen Rpb1 và nrLSU trên cùng một tập hợp các loài trong chi Inocybe
(Agaricales, Basidiomycota). Kết quả cho thấy cả hai bộ CSDL đều thích hợp để sử
dụng trong phân tích phát sinh học, mặc dù bộ dữ liệu nrLSU cho thấy các mâu
thuẫn giữa các vị trí của hai loài. Ngược lại, độ dài các nhánh khá đồng nhất và hỗ
trợ bootstrap tăng lên đối với các nhánh trong Rpb1. Đặc biệt, bộ dữ liệu kết hợp
làm tăng mức độ tin cậy đối với một số mối quan hệ [40].
Trên thế giới đã có nhiều công trình nghiên cứu theo hướng kết hợp nhiều gen gồm
gen mã hóa rRNA của ribosome và gen mã hóa protein, trong đó có sử dụng trình tự
nrLSU và Rbp1 hỗ trợ định danh phân tử, điển hình là công trình của Sung và cộng
sự (2007) tiến hành tinh chỉnh lại phân loại của Cordyceps và Clavicipitaceae dựa
trên phân tích mối quan hệ phát sinh loài của 162 loài dựa trên 5-7 locus gen bao
gồm (nrSSU, nrLSU, Tef1, Rpb1, Rpb2, Tub và Atp6) kết hợp với phân tích hình
thái. Kết quả cho thấy sự tồn tại của ba nhánh Clavicipitaceae và bác bỏ các đơn
ngành của cả Cordyceps và Clavicipitaceae trước đó, nhóm tác giả đề xuất thêm họ
mới Ophiocordycipitaceae và hai chi mới là Elaphocordyceps và Metacordyceps,
đồng thời có thêm hai loài mới được mô tả (Metacordyceps yongmunensis và
Ophiocordyceps communis) [47].

1.3. TÌNH HÌNH NGHIÊN CỨU TRONG NƢỚC
Ở Việt Nam, việc nghiên cứu về nấm ký sinh côn trùng đang ngày càng được quan

tâm, một số kết quả có thể kể đến như:
Năm 2006, Lê Tấn Hưng và cộng sự tiến hành khảo sát nhóm nấm này trong vườn
quốc gia Cát Tiên. Kết quả công bố vào năm 2007 cho biết họ đã thu được tổng
cộng 259 mẫu nấm. Phân loại, định danh bằng phương pháp hình thái học dựa trên
các đặc điểm về ký chủ, màu sắc, loại bào tử, kích thước và hình dạng bào tử,… cho
thấy có tổng cộng 41 loài được ghi nhận thuộc 17 chi bao gồm Akanthomyces,
Aschersonia, Beauveria, Conoideocrella, Cordyceps, Gibellula, Hirsutella,
SVTH: Nguyễn Thị Thu Thảo

11


Khóa luận tốt nghiệp

Hymenostilbe,

Hypocrella,

Isaria,

Metarhizium,

Moelleriella,

Nomuraea,

Ophiocordyceps, Paecilomyces, Torrubiella và Verticillium. Trong đó, có 1 loài
thuộc chi Cordyceps và 2 loài thuộc chi Ophiocordyceps [3].
Năm 2009, Viện Khoa học Lâm nghiệp Việt Nam và Trường Đại học Lâm Nghiệp
đã tiến hành điều tra thu mẫu nấm ĐTHT tại Khu bảo tồn Tây Yên Tử, Sơn Động,

Bắc Giang, tác giả Phạm Quang Thu đã công bố phát hiện được loài nấm ký sinh
côn trùng và được giám định là loài Cordyceps nutans [7]. Tại Vườn quốc gia Tam
Đảo, Vĩnh Phúc, tác giả cũng đã phát hiện nấm ký sinh côn trùng Cordyceps gunnii
[8]. Tại Vườn quốc gia Hoàng Liên, Lào Cai đã phát hiện nấm ĐTHT Cordyceps
militaris [9]. GS. Đái Duy Ban và cộng sự cũng công bố phát hiện mới của mình về
loài ĐTHT lần đầu tiên được tìm thấy ở Việt Nam là Isaria cerambycidae trên ấu
trùng Xén tóc [1].
Năm 2010, PGS.TS Phạm Thị Thùy công bố kết quả nghiên cứu đề tài phát triển
nấm ĐTHT làm nguyên liệu thực phẩm chức năng cho người. Nhóm tác giả đã xác
định được 3 loài nấm ĐTHT là Cordyceps nutans (ở Cúc Phương, Ninh Bình và
Tam Đảo, Vĩnh Phúc), Cordyceps militaris (ở Vũ Quang, Hà Tĩnh) và Cordyceps
spI (ở Sơn Động, Bắc Giang). Đồng thời, tác giả cũng xác định được một số giá trị
dược liệu của nấm ĐTHT Cordyceps militaris gồm Cordycepin, HEAA, một số
vitamin và nguyên tố vi lượng [11].
Nghiên cứu phát hiện các chủng nấm Cordyceps bản địa tại vùng cao nguyên
Langbiang, Lâm Đồng và khảo sát một số hoạt tính sinh học của các loài nấm này
của nhóm tác giả Trương Bình Nguyên, Đinh Minh Hiệp, Lê Huyền Ái Thúy năm
2010 [64]. Từ năm 2009 đến năm 2013, Đinh Minh Hiệp và Trương Bình Nguyên
đã tiến hành nghiên cứu nhóm nấm Cordyceps ở Tây Nguyên. Kết quả công bố
trong Hội thảo quốc tế “Hợp tác khoa học công nghệ vì sự phát triển bền vững nông
nghiệp Lâm Đồng - Tây Nguyên năm 2014” cho biết họ đã thu 124 mẫu nấm, phân
tích hình thái - giải phẫu 85 mẫu và sơ bộ định danh đến mức chi, gồm 37 mẫu
thuộc chi Cordyceps, 8 mẫu thuộc chi Ophiocordyceps, 15 mẫu thuộc Isaria, 7 mẫu
thuộc chi Metarhizium, 6 mẫu thuộc Beauveria, 4 mẫu thuộc Hirsutella, 2 mẫu
thuộc chi Torrubiella, 2 mẫu thuộc chi Gibellula, 1 mẫu thuộc chi Hypocrella, 1
SVTH: Nguyễn Thị Thu Thảo

12



Khóa luận tốt nghiệp

mẫu thuộc chi Akanthomyces, 1 mẫu thuộc chi Aschersonia và 1 mẫu thuộc chi
Hymenostibe. Bên cạnh đó, nhóm nghiêm cứu cũng đã xây dựng thành công
phương pháp định danh bằng sinh học phân tử kết hợp tin - sinh học dựa trên việc
phân tích vùng trình tự ITS [2].

1.4. KỸ THUẬT PCR VÀ GIẢI TRÌNH TỰ
1.4.1. Kỹ thuật PCR [10, 59]
Phương pháp PCR (Polymerase Chain Reaction) là phương pháp khuếch đại nhanh
nhiều bản sao các đoạn DNA, phương pháp này được Kary Mullis đưa ra năm 1985
và Saiki hoàn thiện năm 1988. Kỹ thuật PCR có thể được ứng dụng trong nhiều lĩnh
vực: chẩn đoán, xét nghiệm cnác tác nhân vi sinh vật gây bệnh, xác định giới tính
của phôi, giải mã di truyền, tạo giống mới với các đột biến định hướng, nghiên cứu
sự tiến hoá của sinh vật ở mức độ phân tử,…
Phương pháp PCR được thực hiện hoàn toàn trong các eppendoff và trong thời gian
ngắn ta có thể thu nhận rất nhiều bản sao DNA. Các thành phần chính của phản ứng
PCR gồm: ADN khuôn, dNTPs, mồi (primer), enzym Taq-polymerase, MgCl2 và
dung dịch đệm PCR. Primer là những đoạn DNA ngắn, có khả năng bắt cặp bổ sung
với một mạch của đoạn DNA khuôn và nhờ hoạt động của DNA polymerase đoạn
primer này được kéo dài để hình thành mạch mới. Kỹ thuật PCR được hình thành
dựa trên đặc tính này của DNA polymerase, đoạn DNA nằm giữa hai primer sẽ
được khuếch đại thành số lượng lớn bản sao và được phát hiện sau khi nhuộm bằng
ethidium bromide, có thể thu nhận đoạn DNA này cho các mục đích khác nhau
bằng các thao tác trên gel. Như vậy, để khuếch đại một trình tự DNA xác định, cần
phải có những thông tin tối thiểu về trình tự của DNA, đặc biệt là trình tự base ở hai
đầu đoạn DNA đủ để tạo các primer bổ sung chuyên biệt. Phản ứng được thực hiện
trong máy luân nhiệt (máy PCR). Chu kì nhiệt của phản ứng gồm các bước: biến
tính (95oC), bắt cặp mồi (37-65oC, nhiệt độ bắt cặp của mồi Ta< Tm khoảng 5oC với
Tm là nhiệt nóng chảy của mồi) và kéo dài (72oC). Tuỳ theo nồng độ DNA đích có

trong mẫu mà xác định số lượng chu kỳ cần thực hiện, số lượng trình tự khuyếch
đại càng nhiều nếu số chu kỳ càng tăng.

SVTH: Nguyễn Thị Thu Thảo

13


Khóa luận tốt nghiệp

1.4.2. Kỹ thuật giải trình tự [22]
Giải trình tự là xác định thứ tự sắp xếp của các nucleotide trên phân tử DNA. Hai
phương pháp chính trong xác định trình tự là phương pháp hóa học của Maxam và
Gilbert (1977) và phương pháp enzzyme học của Sanger và cộng sự (1977). Nguyên
tắc của phương pháp hóa học dựa vào các phản ứng hóa học thủy giải đặc hiệu phân
tử DNA, tạo thành một tập hợp nhiều phân đoạn có kích thước khác nhau. Nguyên
tắc enzyme học của Sanger dựa vào sự tổng hợp mạch bổ sung cho trình tự cần xác
định nhờ DNA polymerase. Với việc sử dụng thêm các dideoxynucleotide cùng các
deoxynucleotide thông thường, kết quả tổng hợp cũng là sự hình thành một tập hợp
nhiều đoạn DNA có kích thước khác nhau. Ở cả hai trường hợp, các phân đoạn
DNA sẽ được phân tách thông qua điện di trên gel polyacrylamide hay polymer
trong các mao quản có khả năng phân tách hai đoạn DNA chỉ chênh lệch nhau một
nucleotide. Với phương pháp đánh dấu bằng đồng vị phóng xạ 32P và 35S, các vạch
điện di được phát hiện bằng kỹ thuật xạ ký tự ghi, từ các vạch này giải được trình tự
đoạn DNA mục tiêu.
Các phòng thí nghiệm hiện nay thường dùng phương pháp giải trình tự bằng máy tự
động, đây là phương pháp cải tiến của phương pháp Sanger. Lúc này, ddNTP được
đánh dấu bằng các phân tử phát huỳnh quang màu khác nhau và được chạy phản
ứng PCR sau đó điện di trên gel polyacrylamide. Các trình tự có độ dài nu khác
nhau sẽ có khối lượng khác nhau và đi qua vị trí phát tín hiệu vào thời gian khác

nhau dưới tác dụng của lực mao dẫn, kết quả được máy báo cáo tự động.

1.5. NGHIÊN CỨU PHÁT SINH LOÀI
Nghiên cứu phát sinh loài là nghiên cứu về mối quan hệ tiến hóa của loài dựa vào
phân tích sự khác biệt di truyền phân tử (DNA, RNA, protein). Phân tích phát sinh
loài nghĩa là suy luận hoặc ước lượng các mối quan hệ tiến hóa đó. Kết quả phân
tích phả hệ phân tử thường được thể hiện qua một sơ đồ phân nhánh gọi là cây phả
hệ phân tử [29].
Bộ cơ sở dữ liệu phát sinh loài có thể chứa hàng trăm loài khác nhau, mỗi một loài
có thể có tỷ lệ đột biến thay đổi làm ảnh hưởng đến tiến hóa. Đồng thời, có rất nhiều
mô hình tiến hóa và các phương pháp phân tích phát sinh chủng loài khác nhau. Do
SVTH: Nguyễn Thị Thu Thảo

14


Khóa luận tốt nghiệp

đó, các phương pháp tối ưu cho phân tích phát sinh loài phụ thuộc vào bản chất của
nghiên cứu và cơ sở dữ liệu sử dụng [21, 35, 36].
Các bƣớc trong phân tích phát sinh loài [15]:
(1) Sắp gióng cột: xây dựng mô hình dữ liệu cục bộ và xử lý dữ liệu phát
sinh loài.
Bất kỳ thông tin sinh học nào có thể được sử dụng để suy ra các mối quan hệ tiến
hóa giữa các loài được biết đến như là một marker thông tin phát sinh loài như
DNA, RNA, protein,… Xác định các locus gen được bảo tồn (mã hóa hoặc không
mã hóa) là bước đầu tiên trong việc phân tích các mối quan hệ phát sinh loài. Cả
vùng gen mã hóa và không mã hóa đều có thể được sử dụng để phân tích các mối
quan hệ phát sinh loài [39].
Dữ liệu trình tự phát sinh loài thường bao gồm nhiều trình tự được sắp gióng cột. Vị

trí dãy thẳng hàng để phân tích phát sinh loài đại diện cho một kết luận phát sinh
loài ưu tiên bởi những vị trí này thể hiện sự liên quan hoặc tương đồng về mặt phả
hệ. Các vùng trình tự có độ tương đồng cao và có chứa những thay đổi trong trạng
thái đặc thù hữu ích cho việc phân tích phát sinh loài được thường được gọi là
“vùng thông tin” (informative sites).
Các bước trong việc sắp gióng cột bao gồm lựa chọn cách thức sắp gióng cột và
khai thác dữ liệu phát sinh loài được thiết lập từ sự sắp xếp đó. Các quy trình sau đó
đòi hỏi phải xác định được những vùng không tương đồng và việc chèn/xóa các gap
(còn gọi là indel, nghĩa là các khoảng trống) sẽ được quyết định theo phương pháp
dựng cây. Một quy trình sắp gióng cột điển hình thường áp dụng một chương trình
tin sinh như CLUSTAL W, sau đó được hiệu chỉnh lại bằng tay và đưa vào một
chương trình dựng cây. Việc sắp gióng cột trình tự được khuyến khích thực hiện
hoàn toàn bằng máy tính với lý do chỉnh sửa bằng tay là không rõ ràng, khách quan
nhưng sau đó cần phải tự hiệu chỉnh lại bằng mắt bởi vì các thuật toán và các
chương trình sắp gióng cột không được tối ưu để phù hợp cho sự phân tích phát sinh
loài.
Một số phương pháp sắp gióng cột nhiều trình tự trên máy tính thực hiện sắp gióng
cột trình tự một cách chặt chẽ dựa trên thứ tự đầu vào mà không có bất kỳ xem xét

SVTH: Nguyễn Thị Thu Thảo

15


Khóa luận tốt nghiệp

nào về mối quan hệ của chúng. Hiện nay đã có nhiều phương pháp sắp xếp theo một
tiêu chí phát sinh loài rõ ràng - “cây định hướng” (guide tree), ví dụ như CLUSTAL
W, PileUp, ALIGN trong ProPack..., những cây định hướng này được tạo ra trên cơ
sở sắp xếp trình tự theo từng cặp ban đầu. Cây định hướng từ CLUSTAL W được

định dạng như một tập tin cây PHYLIP và có thể được nhập vào nhiều chương trình
vẽ cây.
Việc sắp gióng cột trình tự cũng làm thay đổi chiều dài trình tự, do đó, bộ dữ liệu
phát sinh loài ban đầu thường không đồng nhất với bộ dữ liệu sau khi sắp gióng cột,
ngay cả khi sắp gióng cột các trình tự có cùng chiều dài bởi nội dung bộ dữ liệu có
thể khác nhau. Trong trường hợp các trình tự có chiều dài không đồng nhất, mức độ
khác biệt giữa bộ dữ liệu đã sắp thẳng hàng và bộ dữ liệu phát sinh loài ban đầu
được xác định chủ yếu bởi những vùng sắp xếp không rõ ràng và việc xử lý indels.
Cách xử lý indels điển hình nhất là loại bỏ tất cả các vùng có gap, cách tiếp cận này
có lợi thế là cho phép tất cả các biến thể trong các trình tự được mô tả trong giới
hạn của mô hình thay thế, mà không cần một mô hình đặc biệt để giải thích cho
indel, nhưng phương pháp này cũng có nhược điểm là tín hiệu phát sinh loài chứa
trong vùng indel cũng bị loại bỏ.
Tóm lại, sắp gióng cột trình tự là phương pháp gần nhất để hiểu được mối quan hệ
tiến hóa giữa các trình tự được kiểm tra, trừ khi các mối quan hệ phát sinh loài thực
tế được biết trước, không có cách nào để xác định rõ ràng phương thức nào là tốt
nhất cho một phân tích phát sinh loài nhất định. Khi thực hiện sắp gióng cột nhiều
trình tự cho một phân tích phát sinh loài cần xem xét các điểm sau đây:
• Sắp gióng cột trình tự trong phân tích phát sinh loài là một trong những bước quan
trọng nhất bởi bước này tạo ra những bộ dữ liệu mà trên đó mô hình của sự tiến hóa
được sử dụng.
• Dữ liệu sắp gióng cột thường được chỉnh sửa, xóa đi những vùng không thẳng
hàng và chèn hoặc xóa khoảng trống để phản ánh chính xác hơn quá trình tiến hóa
có thể xảy ra dẫn đến sự phân hóa giữa các trình tự.

SVTH: Nguyễn Thị Thu Thảo

16



×