BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC NÔNG LÂM THÀNH PHỒ CHÍ MINH
KHOA CÔNG NGHỆ SINH HỌC
*************
KHÓA LUẬN TỐT NGHIỆP
ĐỊNH DANH NẤM Colletotrichum DỰA VÀO TRÌNH TỰ
VÙNG ITS-rDNA
Ngành học: CÔNG NGHỆ SINH HỌC
Sinh viên thực hiện: HOÀNG VĂN DƯƠNG
Niên khóa: 2005 – 2009
Tháng 7/2009
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC NÔNG LÂM THÀNH PHỒ CHÍ MINH
KHOA CÔNG NGHỆ SINH HỌC
*************
KHÓA LUẬN TỐT NGHIỆP
ĐỊNH DANH NẤM Colletotrichum DỰA VÀO TRÌNH TỰ
VÙNG ITS-rDNA
Hướng dẫn khoa học
Sinh viên thực hiện
TS. LÊ ĐÌNH ĐÔN
HOÀNG VĂN DƯƠNG
KS. NGUYỄN VĂN LẪM
Tháng 7/2009
LỜI CẢM ƠN
Con xin gửi lời cảm ơn sâu sắc nhất đến Mẹ, không gì có thể so sánh với tình yêu con
dành cho Mẹ, người đã sinh thành, dưỡng dục, nuôi con khôn lớn lên người.
Em xin chân thành cảm ơn:
Các Thầy Cô trong trường Đại học Nông Lâm TP. Hồ Chí Minh đã tận tình
truyền đạt kiến thức cho em trong suốt 4 năm học.
TS. Lê Đình Đôn đã tận tình chỉ dẫn em trong suốt quá trình thực hiện khóa
luận.
Anh Nguyễn Văn Lẫm, chị Trần Thị Vân đã hết lòng hướng dẫn em trong quá
trình thực hiện khóa luận.
Các anh chị trong Viện Công Nghệ Sinh Học Và Môi Trường đã động viên,
chia sẻ kinh nghiệm và giúp đỡ em trong quá trình thực hiện khóa luận.
Xin chân thành cảm ơn.
TP. Hồ Chí Minh, tháng 07 năm 2009
Hoàng Văn Dương
iii
TÓM TẮT
Đề tài “ Định danh nấm Colletotrichum dựa trên trình tự vùng ITS – rDNA ”
được thực hiện tại phòng I5, khoa công nghệ sinh học và tại Viện Công Nghệ Sinh
Học Và Môi Trường, trường Đại Học Nông Lâm Thành Phố Hồ Chí Minh từ ngày
20/02/2009 đến 30/07/2009 nhằm định danh một số dòng nấm Colletotrichum tại Việt
Nam, làm cơ sở cho việc kiểm soát hiệu quả các bệnh do loại nấm này gây ra.
Colletotrichum là một loại nấm bệnh cây trồng, gây thiệt hại kinh tế lớn trên nhiều loại
kí chủ khác nhau. Chính vì vậy việc kiểm soát hiệu quả các bệnh gây ra bởi
Colletotrichum là rất quan trọng.
Định danh các dòng Colletotrichum được thực hiện dựa trên kết quả định danh
hình thái đã có và những phân tích trên vùng ITS-rDNA. Vùng ITS-rDNA là vùng
trình tự tương đối bảo tồn và có ý nghĩa trong nghiên cứu phân loại, vì thế vùng này đã
được chọn làm cơ sở phân tử cho việc định danh các dòng nấm Colletotrichum trong
nghiên cứu này.
Nội dung nghiên cứu là phục hồi, nhân sinh khối các dòng nấm Colletotrichum,
thực hiện phản ứng PCR với cặp mồi ITS4 – ITS5 nhằm khuếch đại vùng ITS1-5.8SITS2. Trình tự vùng ITS1-5.8S-ITS2 của các dòng nấm Colletotrichum trong nước
được so sánh với các loài trên GenBank sử dụng chương trình BLAST trên NCBI. Để
định danh phân tử và xác định mối quan hệ di truyền của các dòng nấm Colletotrichum
trong nước, các cây phân nhóm được xây dựng dựa trên trình tự vùng ITS1 - 5.8S ITS2 của các dòng nấm trong nước và một số loài trên GenBank. Cây phát sinh loài
này được xây dựng sử dụng phương pháp Neigbor Joining trong chương trình MEGA.
Kết quả của nghiên cứu này là định danh được một số dòng Colletotrichum
trong nước. Các loài Colletotrichum đã gây bệnh trên cây trồng tại một số vùng ở Việt
Nam được xác định trên cao su: C. acutatum; địa lan: C. gloeosporioides; dâu tây: C.
acutatum; cà phê: C. gloeosporiodes; ớt: C. capsici. Xác định được vùng biến đổi nhất
trong toàn vùng ITS – rDNA là vùng ITS1. Như vậy, vùng ITS – rDNA có thể được sử
dụng hiệu quả trong việc định danh các dòng nấm Colletotrichum, tuy nhiên cũng có
những loài không thể phân biệt được dựa trên trình tự ITS – rDNA do đó việc kết hợp
thêm những phương pháp khác hay phân tích trên những vùng gen khác là cần thiết.
iv
SUMMARY
The title of research is: “IDENTIFICATION OF Colletotrichum SPECIES BASED
ON ITS-rDNA REGION”. The research is carried out from 20 February, 2009 to 30
Junly, 2009 at I5 department, Faculty of Biotechnology, Nong Lam University and
Research Institute For Biotechnology and Environment, Nong Lam University with
the goal is accurate identification of Colletotrichum species in some regions in Viet
Nam so that we can control this plant pathogen effectively. The genus Colletotrichum
is considered major plant pathogen worldwide. Colletotrichum cause significant
economic damage to crops in tropical, subtropical, and temperate regions. Accurate
identification of Colletotrichum species responsible for epidemics is essential for
developing and implementing effective disease control strategies.
Identification of Colletotrichum isolates based on the morphology results and
analysing ITS – rDNA region. ITS – rDNA region is a fairly conservative sequence
and significant for taxonomic research. Thus, ITS – rDNA region is selected for
identifying Collectotrichum isolates in this research.
Content of this research is : inoculating Colletotrichum isolates in broth culture,
extracted DNA and amplified the ITS1 - 5,8 S - ITS2 region with two primers ITS4
and ITS5. 580 bp products have been obtained. ITS1-5.8S-ITS2 region of
Colletotrichum isolates in Viet Nam have been compared with data in GenBank using
BLAST program in NCBI. To find the evolution relationship of Colletotrichum
isolates and test the results of identification morphology, we have constructed
phylogenetic trees using Neigbor Joining in MEGA.
The result of this research are: identifided some Colletotrichum isolates and
findding ITS1 region is the most variable in ITS – rDNA region. So ITS – rDNA
region can be used to identify Colletotrichum species. However, some Colletotrichum
species aren’t distinguishable based on ITS – rDNA, so we should use ITS – rDNA
along with other techniques or other genes to identify Colletotrichum species.
v
MỤC LỤC
Lời cảm ơn..................................................................................................................... iii
Tóm tắt........................................................................................................................... iv
Summary..........................................................................................................................v
Mục lục .......................................................................................................................... vi
Danh sách các bảng ....................................................................................................... ix
Danh sách các hình ..........................................................................................................x
Chương 1 MỞ ĐẦU ........................................................................................................1
1.1. Đặt vấn đề.................................................................................................................1
1.2. Yêu cầu của đề tài.....................................................................................................2
1.3. Mục đích của đề tài...................................................................................................2
1.4. Nội dung thực hiện ...................................................................................................2
Chương 2 TỔNG QUAN TÀI LIỆU...............................................................................3
2.1. Giới thiệu về nấm Colletotrichum ............................................................................3
2.1.1. Vị trí phân loại.......................................................................................................3
2.1.2. Đặc điểm hình thái.................................................................................................3
2.1.3. Bệnh thán thư do Colletotrichum ..........................................................................4
2.2. Giới thiệu kỹ thuật PCR và phương pháp giải trình tự DNA...................................6
2.2.1. Kỹ thuật PCR.........................................................................................................6
2.2.2. Các phương pháp giải trình tự DNA .....................................................................9
2.3. Tổng quan về vùng ITS-rDNA...............................................................................10
2.3.1. Giới thiệu về vùng rDNA và vùng ITS ..............................................................10
2.3.2. rDNA trong nghiên cứu phát sinh loài ................................................................10
2.4.1. Chức năng của chương trình BLAST..................................................................11
2.4.2. Cơ sở dữ liệu của BLAST ...................................................................................12
2.4.3. Lựa chọn chương trình BLAST phù hợp ............................................................13
2.4.4. Các bước thực hiện BLAST ................................................................................15
2.5. Giới thiệu cây phát sinh loài...................................................................................15
2.5.1. Khái niệm cây phát sinh loài ...............................................................................15
2.5.2. Cấu trúc cây phát sinh loài ..................................................................................16
vi
2.5.3. Một số lưu ý về cây phát sinh loài.......................................................................17
2.5.4. Các bước cơ bản để tiến hành nghiên cứu phát sinh loài dựa vào phân tử .........17
2.5.5. Chọn lựa phương pháp xây dựng cây phát sinh loài thích hợp ...........................17
2.6. Tình hình nghiên cứu định danh Colletotrichum trên thế giới...............................18
2.7. Tình hình nghiên cứu định danh Colletotrichum trong nước.................................20
Chương 3 VÂT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU......................................22
3.1. Thời gian, địa điểm nghiên cứu..............................................................................22
3.2. Vật liệu ..................................................................................................................22
3.2.1. Đối tượng nghiên cứu..........................................................................................22
3.2.3. Hoá chất và thiết bị..............................................................................................24
3.3. Phương pháp..........................................................................................................24
3.3.1. Phục hồi các dòng nấm Colletotrichum trên môi trường PGA ...........................24
3.3.2. Nhân, thu sinh khối và nghiền mẫu nấm ............................................................24
3.3.3. Ly trích DNA từ nấm đã được nghiền mịn .........................................................25
3.3.4. Điện di kiểm tra kết quả ly trích DNA và PCR..................................................26
3.3.5. Thực hiện phản ứng PCR khuếch đại vùng ITS – rDNA...................................26
3.3.6. Phương pháp xử lý số liệu ..................................................................................27
Chương 4 KẾT QUẢ VÀ THẢO LUẬN......................................................................43
4.1. Kết quả nhân sinh khối ...........................................................................................43
4.2. Kết quả ly trích DNA ............................................................................................43
4.3. Kết quả khuếch đại trình tự vùng ITS1-5.8S-ITS2 ................................................44
4.4. Kết quả phân nhóm các loài Colletotrichum trong nước và nước ngoài................44
4.5. Kết quả định danh các dòng Colletotrichum ..........................................................47
4.6. Xác định vùng tiến hóa nhanh nhất trong toàn vùng ITS - rDNA .........................56
4.6.1. Phân nhóm loài Colletotrichum dựa vào trình tự ITS1 .......................................56
4.6.2. Phân nhóm các loài Colletotrichum dựa vào trình tự vùng ITS2........................59
4.7. Phân tích mối quan hệ di truyền của các dòng Colletotrichum trong nước. ..........59
Chương 5 KẾT LUẬN VÀ ĐỀ NGHỊ ..........................................................................61
5.1. Kết luận...................................................................................................................61
5.2. Đề nghị ...................................................................................................................61
TÀI LIỆU THAM KHẢO .............................................................................................62
PHỤ LỤC……………………………………………………………………………..
vii
DANH SÁCH CÁC CHỮ VIẾT TẮT
BLAST: Basic Local Alignment Search Tool - Công cụ tìm kiếm liên kết vùng cơ bản.
dNTP: 2’ – dideoxynucleotide – 5’ – triphosphate.
dATP: 2’ – dideoxyadenine – 5’ – triphosphate.
dCTP: 2’ – dideoxycytosine – 5’ – triphosphate.
dGTP: 2’ – dideoxyguanine – 5’ – triphosphate.
dTTP: 2’ – dideoxyadenine – 5’ – triphosphate.
EDTA: Ethylene Diamin Tetracetic Acid.
ETS:
External Transcribed Spacer - Vùng phiên mã bên ngoài.
IGS:
Intergenic spacer – khoảng giữa hai gen.
ITS:
Internal Transcribed Spacer - vùng phiên mã bên trong.
LSU:
Large Subunit - Tiểu đơn vị lớn.
NCBI: National Center for Biotechnology Informatic - Trung tâm quốc gia về sinh
tin sinh học.
PCR:
Polymerase Chain Reaction.
PGA:
Potato glucose agar
rDNA: ribosomal DNA.
RAPD: Random Amplified Polymorphism DNA - Đa hình DNA được khuếch đại
ngẫu nhiên.
RNA:
Ribonucleic acid.
RFLP: Restriction Fragment Length Polymorphism - Đa hình chiều dài đoạn cắt
giới hạn.
SDS:
Sodium Dodecyl Sulfate.
SSU:
Small Subunit - Tiểu đơn vị nhỏ.
Taq:
Thermus aquaticus.
TAE:
Tricacetic ethylene diamine tetra acetate.
TE:
Tris ethylene diamine tetra acetate.
Tm:
Melting Tempereture - Nhiệt độ nóng chảy.
viii
DANH SÁCH CÁC BẢNG
Bảng 2.1 Cơ sở dữ liệu protein .....................................................................................12
Bảng 2.2 Cơ sở dữ liệu nucleotide................................................................................13
Bảng 2.3 Lựa chọn chương trình cho trình tự protein ..................................................14
Bảng 2.4 Lựa chọn chương trình cho trình tự nucleotide .............................................15
Bảng 3.1 Các dòng nấm Colletotrichum được sử dụng trong nghiên cứu này.............22
Bảng 3.2 Các loài Colletotrichum trên GenBank .........................................................23
Bảng 3.3 Thành phần các chất cho 1 phản ứng PCR thể tích 50l ..............................26
Bảng 4.1 Độ tương đồng trình tự vùng ITS – rDNA (%) dòng CS1 ...........................47
Bảng 4.2 Độ tương đồng trình tự vùng ITS – rDNA (%) dòng CS2 ...........................47
Bảng 4.3 Độ tương đồng trình tự vùng ITS – rDNA (%) dòng CS3 ...........................48
Bảng 4.4 Độ tương đồng trình tự vùng ITS – rDNA (%) dòng CS4 ............................48
Bảng 4.5 Độ tương đồng trình tự vùng ITS – rDNA (%) dòng Ot1.............................49
Bảng 4.6 Độ tương đồng trình tự vùng ITS – rDNA (%) dòng Ot2.............................50
Bảng 4.7 Độ tương đồng trình tự vùng ITS – rDNA (%) dòng DL1............................50
Bảng 4.8 Độ tương đồng trình tự vùng ITS – rDNA (%) dòng DL2............................51
Bảng 4.9 Độ tương đồng trình tự vùng ITS – rDNA (%) dòng DL3............................51
Bảng 4.10 Độ tương đồng trình tự vùng ITS – rDNA (%) dòng Nh1 ..........................52
Bảng 4.11 Độ tương đồng trình tự vùng ITS – rDNA (%) dòng Nh2 ..........................52
Bảng 4.12 Độ tương đồng trình tự vùng ITS – rDNA (%) dòng CP1 ..........................53
Bảng 4.13 Độ tương đồng trình tự vùng ITS – rDNA (%) dòng CP2 ..........................53
Bảng 4.14 Độ tương đồng trình tự vùng ITS – rDNA (%) dòng CP3 ..........................53
Bảng 4.15 Độ tương đồng trình tự vùng ITS – rDNA (%) dòng CP4 ..........................54
Bảng 4.16 Độ tương đồng trình tự vùng ITS – rDNA (%) dòng CP5 ..........................54
Bảng 4.17 Độ tương đồng trình tự vùng ITS – rDNA (%) dòng DT1..........................55
Bảng 4.18 Độ tương đồng trình tự vùng ITS – rDNA (%) dòng DT2..........................55
Bảng 4.19 Kết quả định danh 18 dòng Colletotrichum ...............................................56
ix
DANH SÁCH CÁC HÌNH
Hình 2.1 Nấm Colletotrichum. .......................................................................................3
Hình 2.2 Bệnh thán thư do nấm Colletotrichum.............................................................4
Hình 2.3 Quá trình xâm nhiễm Colletotrichum trên cây trồng.......................................5
Hình 2.4 Sơ đồ vùng ITS - rDNA của nấm. ................................................................10
Hình 2.5 Các loại cây phát sinh loài. ............................................................................16
Hình 2.6 Sơ đồ lựa chọn phương pháp tạo cây phát sinh loài ......................................18
Hình 4.1 Kết quả ly trích DNA tổng số các dòng nấm Colletotrichum. ......................43
Hình 4.2 Kết quả PCR các dòng nấm Colletotrichum..................................................44
Hình 4.3 Cây phân nhóm các loài Colletotrichum dựa trên vùng ITS – rDNA ...........45
Hình 4.4 Cây phân nhóm loài Colletotrichum dựa vào vùng ITS1 ..............................57
Hình 4.5 Cây phân nhóm loài Colletotrichum dựa trên trình tự vùng ITS2.................58
Hình 4.6 Cây phát sinh loài các dòng Colletotrichum trong nước. ..............................59
x
Chương 1
MỞ ĐẦU
1.1. Đặt vấn đề
Colletotrichum là nấm gây bệnh trên cây trồng phân bố rộng khắp trên thế giới.
Colletotrichum gây thiệt hại kinh tế rất lớn trên nhiều loại kí chủ khác nhau bao gồm
cây trồng lâu năm, cây ăn trái, ngũ cốc, cây họ đậu, rau.
Để kiểm soát bệnh hiệu quả, trước tiên phải xác định chính xác loài gây bệnh vì
các loài Colletotrichum khác nhau có sự nhạy cảm khác nhau đối các loại thuốc diệt
nấm, ví dụ: C. acutatum có mức nhạy cảm trung bình với thuốc diệt nấm
benzimidazole, trong khi C. gloeosporioides lại có độ nhạy cảm cao ( Freeman và ctv,
1998 ) . Trong khi ranh giới giữa các giống loài ngày nay khá rõ ràng, thì ranh giới
giữa các loài trong giống Colletotrichum vẫn chưa được chấp nhận rộng rãi. Những
khái niệm phân loại của nhóm này chủ yếu dựa theo von Arx (1957, 1970) và Sutton
(1980). Những đặc điểm hình thái như màu sắc khuẩn lạc, hình dạng, kích cỡ bào tử,
nhiệt độ tối ưu, tốc độ phát triển và khoảng vật chủ đã được sử dụng như những
phương pháp truyền thống để xác định loài Colletotrichum ( Wharton và Uribeondo,
2002 ). Do ảnh hưởng của môi trường những đặc điểm hình thái có thể thay đổi và
những tiêu chuẩn này trong nhiều trường hợp không thể cho kết quả định danh chính
xác, đồng thời nhiều loài Colletotrichum có khoảng ký chủ rộng như Colletotrichum
acutatum có thể gây bệnh trên xoài, dâu tây, cao su, táo, lê. Do đó không thể dựa vào
khoảng ký chủ để định danh trong những trường hợp này.
Hiện nay sinh học phân tử đã đưa ra nhiều phương pháp đáng tin cậy trong việc
phân loại, đặc biệt là sự xác định loài, quan hệ bên trong loài và giữa các loài
Colletotrichum. Nhiều kỹ thuật phân tử khác nhau đã được sử dụng thành công để định
danh loài Colletotrichum chủ yếu dựa trên sự phân tích trình tự DNA, do trình tự
DNA không bị ảnh hưởng trực tiếp bởi các yếu tố môi trường. Những kỹ thuật phân tử
được sử dụng trong định danh Colletotrichum như: phân tích trình tự rDNA, A+T-rich
DNA RFLPs, ap-PCR. Trong đó, phân tích trình tự rDNA, đặc biệt là vùng ITS, đã
được sử dụng rộng rãi trong các nghiên cứu định danh Colletotrichum do rDNA lặp lại
nhiều lần trên genome và những biến đổi trên rDNA có ý nghĩa lớn trong phân tích
1
tiến hóa, chính vì vậy vùng ITS – rDNA đã được sử dụng trong nghiên cứu này để
định danh các dòng nấm Colletotrichum ở một số vùng tại Việt Nam.
1.2. Yêu cầu của đề tài
- Ly trích DNA của các dòng nấm.
- Đọc trình tự vùng gen ITS1 – 5,8 S – ITS2.
- Định danh các dòng nấm Colletotrichum trên một số cây trồng tại Việt Nam.
1.3. Mục đích của đề tài
- Định danh các dòng nấm Colletotrichum trên một số cây trồng tại Việt Nam
dựa trên vùng ITS – rDNA.
1.4. Nội dung thực hiện
- Phục hồi, nhân sinh khối các dòng Colletotrichum.
- Khuếch đại vùng gen ITS1 – 5,8 S – ITS2 của các dòng nấm Colletotrichum
dùng cặp mồi ITS4 – ITS5.
- Định danh và xác định mối quan hệ di truyền của các dòng nấm
Colletotrichum dựa trên trình tự vùng ITS – rDNA.
2
Chương 2
TỔNG QUAN TÀI LIỆU
2.1. Giới thiệu về nấm Colletotrichum
2.1.1. Vị trí phân loại (wikipedia)
Giới : Fungi
Ngành : Ascomycota
Lớp : Sordariomycetes
Lớp phụ : Incertae sedis
Bộ : Phyllachorales
Họ : Phyllachoraceae
Giống : Colletotrichum
2.1.2. Đặc điểm hình thái
Sợi nấm Colletotrichum nội sinh, mảnh, phân nhánh, có vách ngăn, sợi nấm có nội
bào và gian bào. Nhiều hạt dầu được sản xuất trong mỗi tế bào của hệ sợi nấm. Khi chín
sợi nấm trở nên sậm màu và bện xoắn lại thành dạng chất nền nhỏ dưới lớp ngoài cùng.
Hình 2.1 Nấm Colletotrichum. a) Colletotrichum gloeosporioides;
b) Colletotrichum acutatum (bioblaze, 2008).
Colletotrichum sinh sản vô tính bằng bào tử đính, bào tử đính phát triển trên
cuống bào tử trong dạng thể quả là cụm cuống bào tử. Cụm cuống bào tử có dạng đĩa
phẳng, mặt sau có cấu trúc phấn mịn, mỗi cụm cuống bào tử gồm lớp chất nền, bề mặt
3
sản sinh cuống bào tử trong suốt. Cuống bào tử không có vách ngăn kéo dài đơn bào,
dạng liềm, cong, bào tử trong suốt. Cùng với bào tử và cuống bào tử là các lông cứng
trên mỗi cụm cuống bào tử, lông dài cứng, thuôn nhọn, không phân nhánh và đa bào
cấu trúc như tơ cứng. Theo Frost (1964), một vài loài của Colletotrichum có hoặc
không có lông cứng có thể được kiểm soát bởi sự thay đổi độ ẩm.
Sự hình thành một số lớn của bào tử gây nứt gãy trên biểu bì vật chủ, gặp điều
kiện thuận lợi, mỗi bào tử mọc từ một đến nhiều ống mầm để hình thành hệ sợi nấm.
Đĩa bám là dạng của Colletotrichum trong nuôi cấy. Sợi nấm già đôi khi hình thành
vách dày, màu nâu sậm, hình cầu hoặc không đều gọi là hậu bào tử (Chlamydospores),
nó có thể ở tận cùng hoặc chen giữa sợi nấm và tồn tại trong thời gian dài và khi tách
ra chúng cũng mọc mầm để hình thành sợi nấm mới (Cao Ngọc Điệp, 2007).
2.1.3. Bệnh thán thư do Colletotrichum
Thán thư là bệnh nguy hiểm trên cây trồng, bệnh này xuất hiện ở nhiều loại cây
khác nhau trên khắp thế giới. Colletotrichum gây bệnh thán thư thường tấn công cành
non, lá non, hoa và trái với những triệu chứng bệnh điển hình như: trên hoa, bệnh làm
rụng hoa; ở lá, đốm bệnh có màu xám nâu, tạo các đốm cháy; ngọn, cành non có các
đốm bệnh màu nâu xám, vùng bị bệnh sẽ khô đi làm rụng lá và khô chết đọt; trên trái,
vỏ trái có những đốm đen hơi tròn hay bầu dục, lõm vào. Bệnh này xuất hiện ở cả
những mô đang phát triển lẫn mô trưởng thành, gây hại cả trước và sau thu hoạch.
Colletotrichum có thể xâm nhập và không biểu hiện ngay mà khi có điều kiện thuận
lợi mới gây bệnh. Bệnh thán thư do Colletotrichum gây hại chủ yếu ở những phần trên
mặt đất, tuy nhiên rễ và thân củ cũng có khả năng nhiễm bệnh.
Hình 2.2 Bệnh thán thư do nấm Colletotrichum. (a) Bệnh thán thư trên nho;
(b) bệnh thán thư trên dâu tây (Leonor Leandro, 2001).
4
Hình 2.3 Quá trình xâm nhiễm Colletotrichum trên cây trồng
(Wharton và Uribeondo, 2003).
Trên ớt, trái ớt đã lớn, khi bị nhiễm bệnh, xuất hiện những vết lõm xuống, hình
vòng tròn, hơi ướt. Khi gặp thời tiết thuận lợi, bệnh lan ra rất nhanh, vết bệnh có màu
nâu nhạt đến đậm. Trên trái, nơi bị bệnh nặng, xuất hiện những hạch bào tử màu vàng.
Ngoài ra, bệnh còn tấn công trên cây con gây chết rạp lá ớt và gây hiện tượng đốm.
Bệnh này có thể gây thất thu đến 80 – 90%.
Trên cà phê, bệnh xuất hiện ở giai đoạn từ khi cây cà phê ra hoa đến trái
chín. Bệnh làm khô đen lá, quả, cành và thậm chí cả thân. Trên lá, các vết bệnh có
vòng đồng tâm. Đặc biệt nấm bệnh hay xâm nhập ở đầu lá nên thường thấy lá khô
cháy từ ngoài chóp lá vào. Trên cành, bệnh thường tấn công trên các cành đang
hóa gỗ, xâm nhập chủ yếu ở đầu cành mang quả và các vết nứt tạo nên những vết
nâu lõm xuống làm vỏ biến màu nâu đen và khô dần. Nếu bệnh nặng, nấm tấn
công cả cành lớn và lan vào cả thân, làm rụng lá, để lại những cành trơ trụi khô
đen. Trên trái, bệnh để lại những vết lõm ở phần vỏ sau đó trái biến màu nâu nhạt,
khô đen và rụng sớm.
Trên sầu riêng, bệnh phát triển nhiều trên lá, tạo những đốm bệnh riêng
biệt, tròn và hoại tử hoặc có hình bất dạng, thường ở rìa và chóp lá. Đốm lá có
màu nâu xám nhạt với các vòng đồng tâm hoặc các vòng xung quanh vết bệnh với
một số bào tử màu đen, xung quanh vết bệnh thường có ranh giới màu nâu vàng.
5
Bệnh thường phát sinh trên lá già, lá bánh tẻ. Lá bệnh trên cây con hay cây bị suy
yếu dễ rụng sớm.
2.2. Giới thiệu kỹ thuật PCR và phương pháp giải trình tự DNA
2.2.1. Kỹ thuật PCR
2.2.1.1. Khái niệm chung
Kỹ thuật PCR (phản ứng chuỗi trùng hợp - polymerase chain reaction), là kỹ
thuật tổng hợp nhân tạo các đoạn DNA với tốc độ nhanh, chính xác cao được thực hiện
trong máy chu trình nhiệt (máy PCR). Kỹ thuật này khuếch đại một trình tự đích DNA
ban đầu thành hàng triệu bản sao nhờ hoạt động của enzyme polymerase và cặp primer
đặc hiệu cho đoạn DNA cần được khuếch đại (Trịnh Đình Đạt, 2006).
2.2.1.2. Nguyên lý
Kỹ thuật PCR tuân thủ những nguyên tắc cơ bản của sao chép DNA trong cơ thể
như: đoạn DNA cần mở xoắn thành hai mạch đơn, cần các cặp mồi (mồi xuôi, mồi
ngược), cần nguyên liệu và điều kiện môi trường thích hợp và enzym DNA
polymerase. Tuy nhiên kỹ thuật PCR có khác là dùng nhiệt độ cao thay cho helicase
kết hợp với DNA polymerase chịu nhiệt và hệ thống điều nhiệt thích hợp cho từng giai
đoạn phản ứng tổng hợp cùng với các đoạn mồi được thiết kế chủ động.
2.2.1.3. Các thành phần tham gia phản ứng
DNA khuôn: Có thể là DNA kép, đơn hoặc ARN được tách chiết từ các đối
tượng nghiên cứu. DNA khuôn phải có độ nguyên vẹn cao tránh lẫn tạp (hệ số
A260nm/A280nm = 1,8 – 2), đôi khi DNA khuôn có thể thu được trực tiếp từ dịch trích tế
bào và có lượng ban đầu từ 1 đến hàng chục ng.
DNA polymerase: Là enzym xúc tác cho quá trình lắp ráp các nucleotit A, T, G,
C vào mạch DNA mới đang tổng hợp, có nhiều loại DNA polymerase: Taq DNA
polymerase, Pfu DNA polymerase, T4 DNA polymerase, Tth DNA polymerase,… đây
các là enzyme chịu nhiệt cao. DNA polymerase được sử dụng phổ biến là Taq DNA
polymerase tách chiết từ vi khuẩn Thermus aquaticus (vi khuẩn suối nước nóng). Taq
polymerase quá cao sẽ dẫn đến các kết quả không chuyên tính, còn nếu nồng độ Taq
polymerase quá thấp sẽ không có đủ số lượng enzyme để xúc tác tạo ra sản phẩm PCR
theo ý muốn.
Mồi (primer): Primer có vai trò rất quan trọng trong tiến trình khuếch đại của
phản ứng PCR. Đoạn mồi là các oligonucleotit có độ dài 6 – 30 nucleotit, có trình tự
6
bắt cặp bổ sung với trình tự hai đầu mạch khuôn. Trình tự primer được chọn sao cho
không có sự bắt cặp bổ sung giữa primer “xuôi” và primer “ngược”, không có những
cấu trúc “primer dimer” do sự bắt cặp bổ sung giữa các thành phần khác nhau của một
primer. Mồi phải đảm bảo đủ dài để đảm bảo bắt cặp chính xác. Nhiệt độ nóng chảy
Tm của mồi xuôi và mồi ngược không được cách biệt quá xa. Các primer phải đặc
trưng cho trình tự DNA cần khuếch đại, không trùng với trình tự lặp lại trên gen. Công
thức tính nhiệt độ gắn mồi:
- Đối với mồi ≤ 20: Tm = [ 2( A + T ) + 4( G + C )]0C
- Đối với mồi > 20: Tm = 22 + 1,46[2(G + C ) + ( A + T)]0C.
Nồng độ mồi thường khoảng 100 – 500 nM.
Thời gian gắn mồi khoảng 30 – 60 giây.
Bốn loại nucleotid (dNTP): dATP, dTTP, dGTP, dCTP là ngyên liệu tạo nên mạch
DNA mới, thường được sử dụng ở nồng độ 100 - 200µM mỗi loại nucleotid. Nếu nồng độ
cao hơn dễ dẫn đến sự khuếch đại sản phẩm dương tính giả hay tạp nhiễm. Sự mất cân bằng
trong thành phần các nucleotid lại làm tăng các lỗi sao chép của polymerase.
Dung dịch đệm (buffer): Thành phần dung dịch đệm của phản ứng PCR thường
phụ thuộc vào loại enzym DNA polymerase sử dụng trong PCR.
Nồng độ Mg2+ thường trong khoảng 0,5 – 5 mM. Mg2+ có tác dụng gắn liên kết
dNTP với DNA polymerase, tăng khả năng bám nối của mồi.
2.2.1.4. Các chu kỳ của phản ứng PCR
Sự khuếch đại được thực hiện nhờ chu trình nhiệt lặp lại.
Phản ứng PCR gồm nhiều chu kỳ lặp lại nối tiếp nhau. Mỗi chu kỳ gồm 3 giai đoạn:
Giai đoạn 1 (giai đoạn biến tính: tách sợi đơn DNA, denaturation): ở điều kiện
nhiệt độ cao phân tử DNA từ mạch đôi tách ra thành dạng mạch đơn dùng làm khuôn
để tổng hợp mạch mới DNA, nhiệt độ thừơng là 94 - 950C trong 30 - 60 giây.
Giai đoạn 2 (giai đoạn bắt cặp giữa primer và khuôn, anealation): khi nhiệt độ
hạ thấp hơn nhiệt độ nóng chảy Tm của primer, primer sẽ bắt cặp với mạch khuôn tại
vị trí có trình tự bổ sung với primer. Nhiệt độ cho giai đoạn này 50 - 640C. Đây là giai
đoạn quan trọng. Nhiệt độ gắn mồi phải đảm bảo đúng để khả năng gắn tốt nhất, tránh
hiện tượng gắn không đặc hiệu.
Giai đoạn 3 (giai đoạn tổng hợp, kéo dài, elongation): nhiệt độ tăng lên 68 720C, ở nhiệt độ này Taq DNA polymerase hoạt động tối ưu. Trong khoảng 30 giây
7
cho đến vài phút tùy theo kích thước cần khuếch đại. Khi đó Taq DNA polymerase
tổng hợp mạch DNA mới dựa trên trình tự của mạch khuôn, độ dài đoạn khuếch đại là
khoảng cách giữa hai primer đơn đã bắt cặp với 2 DNA khuôn mạch đơn, các
nucleotid lần lượt được gắn vào mỗi đầu DNA khuôn sợi đơn , gắn kế tiếp các
nucleotid của primer và chiều bổ sung là 5’ ở trên cả 2 DNA sợi đơn.
Trong phản ứng PCR một chu kỳ gồm 3 giai đoạn trên sẽ được lập đi lập lại
nhiều chu kỳ và làm gia tăng số lượng DNA theo cấp số nhân, số chu kỳ thường trong
khoảng 25 - 50. Số chu kỳ trong phản ứng thông thường không được quá cao, do phản
ứng PCR diễn tiến trong các chu kỳ đầu số lượng bản sao tăng theo cấp số nhân tỉ lệ
với lượng mẫu ban đầu, sau đó hiệu quả khuếch đại giảm hẳn vì những nguyên nhân
sau: sự phân huỷ và cạn kiệt các thành phần của phản ứng, sự xuất hiện các sản phẩm
phụ làm ức chế phản ứng khuếch đại, các bản sao vừa được tổng hợp không bắt cặp
với mồi mà chúng tự bắt cặp với nhau. Số chu kỳ cho một phản ứng còn phụ thuộc vào
số lượng mẫu ban đầu.
Sản phẩm khuếch đại được tính như sau: Tổng số DNA khuếch đại = m x 2n .
Trong đó: n là số chu kỳ thực hiện, m là số bản sao ban đầu của chuỗi trình tự
DNA cần nhân ra.
2.2.1.5. Thiết bị và dụng cụ phản ứng PCR
Máy PCR cần đáp ứng được yêu cầu thay đổi nhiệt độ thật nhanh, thật chính
xác, tránh tối đa sự bốc hơi nước trong quá trình phản ứng PCR.
Eppendorf dùng cho phản ứng PCR phải là loại có vách mỏng và có khả năng
truyền nhiệt tốt.
2.2.1.6. Ứng dụng của kỹ thuật PCR
Kỹ thuật PCR được ứng dụng rộng rãi trong nhiều lĩnh vực khác nhau, từ nghiên
cứu khoa học đến sản xuất và đời sống xã hội. Những ứng dụng chính của PCR là:
Tách nhanh chóng, chính xác từng gen hoặc từng đoạn DNA riêng biệt.
Là kỹ thuật nền cho các nghiên cứu di truyền phân tử như xác định trình tự gen,
đa hình DNA, xác định marker phân tử cho chọn giống, phát hiện đột biến
gen,… Phát hiện DNA có tính đa hình nhờ PCR
Xác định giới tính động vật ở giai đoạn phôi, thai.
Chẩn đoán nhanh nhạy các bệnh di truyền, bệnh nhiễm trùng ( virus, vi khuẩn, nấm,…)
Khôi phục gen của các sinh vật cổ cách đây hàng triệu năm.
8
Xác định nguồn gốc hài cốt, quan hệ họ hàng, xác định cá thể dùng trong việc
xác định huyết thống cũng như trong khoa học hình sự.
PCR là kỹ thuật chuẩn và từ đó cải tiến để tăng thêm hiệu quả nghiên cứu cho
những gene có tính đa hình cao hay lập bản đồ di truyền, bản đồ vật lý. Tính đa hình
của gene được ứng dụng rất nhiều trong di truyền và chọn giống.
PCR chuẩn cần phải biết trước trình tự đầu tiên của gen để thiết kế các primer
đặc hiệu. Tuy nhiên có những nghiên cứu thực hiện trên những vùng thông tin về các
chuỗi mã di truyền trên vùng genome một số đối tượng chưa biết trước. Cho nên để
phát hiện tính đa hình của DNA trên những vùng chưa biết trước đó ta phải cải tiến kỹ
thuật PCR để có thể ứng dụng vào những nghiên tính đa hình hay những trình tự DNA
ngắn hay tính lập lại của một vùng nào đó của genome.
2.2.2. Các phương pháp giải trình tự DNA
Muốn nghiên cứu trình tự các nucleotit của một gen, một đoạn DNA, hoặc cả
phân tử DNA cần tiến hành giải trình tự DNA. Sau đây là hai phương pháp giải trình
tự DNA chủ yếu thường dùng.
2.2.2.1. Phương pháp hóa học ( Phương pháp Maxam và Gilbert )
Nguyên lý của phương pháp hóa học là các đoạn DNA có số lượng trình
tự nucleotit giống nhau được đánh dấu bằng đồng vị phóng xạ P 31 ở đầu 5’. Các
đoạn DNA đã mang dấu phóng xạ được chia thành 4 nhóm. Mỗi nhóm được xử
lý bằng các chất hóa học khác nhau nhằm bẻ gãy các đoạn DNA ở các vị trí khác
nhau ở một hay hai loại bazơ nitơ khác nhau. Kết quả sau khi xử lý tạo thành các
đoạn DNA bị cắt ngẫu nhiên có kích thước khác nhau. Bốn nhóm sau khi cắt
được đem đi điện di trên gel polyacrylamid và thu được các băng DNA khác
nhau theo thứ tự. Tùy theo đoạn nucleotit dài ngắn khác nhau sẽ thu được trật tự
băng khác nhau. Các đoạn nucleotit ngắn chạy nhanh, các đoạn nucleotit dài
chạy chậm. Nhờ phương pháp phóng xạ tự ghi, thu được các băng khác nhau
trên bản gel sau điện di (Trịnh Đình Đạt, 2006).
2.2.2.2. Phương pháp dideoxy
Nguyên lý của phương pháp xác định trình tự DNA dideoxy của F. Sanger
(1977) là phương pháp sử dụng enzym DNA polymerase và các dideoxy. Dideoxy là
các nucleotit mất cả hai nhóm OH ở vị trí cacbon 2 và 3 trên phân tử đường pentose.
9
Phương pháp này dựa trên nguyên tắc là DNA polymerase xúc tác cho việc kéo dài
chuỗi polynucleotit khi gặp các dideoxynucleotit thì dừng lại. Do vậy các đoạn
polynucleotit sẽ có chiều dài khác nhau.
2.3. Tổng quan về vùng ITS-rDNA
2.3.1. Giới thiệu về vùng rDNA và vùng ITS
rDNA là nhóm gene mã hoá rRNA của ribosome và đóng vai trò quan trọng
trong các nghiên cứu quan hệ phát sinh loài. Các bản sao của gen nằm liên tiếp trên
một locus và liên quan mật thiết tới quá trình tiến hoá.
Hình 2.4 Sơ đồ vùng ITS - rDNA của nấm. NTS): vùng không phiên mã; ETS): vùng
phiên mã bên ngoài; ITS): vùng phiên mã bên trong (Wikipedia).
rDNA chứa vùng 18S, ITS1, 5.8S, ITS2, 28S và vùng IGS (bao gồm vùng
phiên mã bên ngoài, vùng không phiên mã và vùng kết thúc phiên mã). Vùng phiên mã
18S hình thành tiểu đơn vị nhỏ (SSU), trong khi 28S, 5.8S và 5S, mã hóa bởi một gen
không thuộc rDNA, hình thành tiểu đơn vị lớn (LSU) của ribosome RNA. Những vùng
ITS được phiên mã (tổng hợp từ RNA), nhưng bị phân cắt trước khi rRNA hoàn thiện
được hình thành, tuy nhiên vùng ITS lại có chức năng trong sự hình thành ribosome.
IGS là vùng kém bảo tồn nhất của rDNA.
Các nhóm gen gồm nhiều bản sao lập lại, mỗi đơn vị lặp lại chứa một vùng
phiên mã (ETS, ITS1, ITS2, 18S, 25S và 5,8S) và một vùng không phiên mã (NTS).
Các rDNA 5.8S, 18S, 28S phiên mã thành các tiền rRNA riêng rẽ, nằm xen kẽ với các
vùng phiên mã bên trong (ITS) và các vùng phiên mã bên ngoài (ETS).
rDNA 5.8 S có kích thước rất nhỏ và ít có sự biến đổi song rRNA 5.8S là thành phần
không thể thiếu của nu-LSU- rRNA, có vai trò ổn định cấu trúc ribosome và thúc đẩy
quá trình tổng hợp protein (Szymanski và cộng sự, 2001).
2.3.2. rDNA trong nghiên cứu phát sinh loài
Trình tự rDNA được sử dụng trong nhiều nghiên cứu quan hệ phát sinh loài trên
một phạm vi rộng , từ những nghiên cứu giữa những nòi giống cơ bản của sự sống đến
quan hệ giữa những loài có quan hệ gần. rDNA có thể được áp dụng trong nhiều
10
trường hợp như vậy là do rDNA bao gồm nhiều mức độ tiến hóa trong những vùng
khác nhau và sự hiện diện nhiều bản sao trong mỗi genome. rDNA có thể được phân
tích dựa trên kỹ thuật giải trình tự trực tiếp RNA, DNA hay sử dụng enzym cắt.
Vùng được nghiên cứu nhiều nhất của rDNA là vùng mã hóa cho tiểu đơn vị
nhỏ 16-18S rRNA. Gen này được nghiên cứu phổ biến do nó là vùng tiến hóa chậm
trong sinh vật, vì thế có thể được sử dụng để nghiên cứu những sự kiện tiến hóa cổ
xưa. Ngoài ra, tỉ lệ thay đổi thấp cho phép tạo ra những primer phổ biến, điều này giúp
cho việc giải trình tự của những nhóm sinh vật mà trước đây chưa được nghiên cứu.
Gene mã hóa cho tiểu đơn vị lớn 23-28S rRNA có kích thước lớn hơn và tiến
hóa nhanh hơn so với tiểu đơn vị nhỏ. Gene này có thể được dùng cho những so sánh
cổ xưa, tuy nhiên nó chủ yếu được sử dụng để nghiên cứu những sự kiện tiến hóa
trong đại cổ sinh và đại trung sinh. Gene này có nhiều domain khác nhau hay những
đoạn mở rộng, vì thế kích cỡ của gene thay đổi đáng kể giữa các nghành. Những
domain khác nhau này có thể được sử dụng cho việc tìm hiểu những sự kiện tiến hóa
tương đối gần (trong kỷ thứ 3), mặc dù những vùng sử dụng cho nghiên cứu phải được
chọn lựa cẩn thận.
Gene mã hóa cho 5.8S rRNA của eukaryotes (tương ứng với vùng gene mã hóa
cho tiểu đơn vị lớn của prokaryotes) có ứng dụng trong phân tích tiến hóa giống với
gene mã hóa cho tiểu đơn vị nhỏ, mặc dù kích thước ngắn giới hạn hiệu quả của nó
trong nghiên cứu tiến hóa.
Vùng không mã hóa cho rRNA có thể được sử dụng để tìm hiểu quan hệ phát
sinh loài trong những loài có quan hệ gần. Ngoài ra những thay đổi trong vùng này
cũng có thể được sử dụng trong định danh loài, nghiên cứu sự lai giống, và như những
marker trong nghiên cứu di truyền quần thể. Vùng NTS tiến hóa nhanh nhất và vùng
ITS bảo tồn hơn. Việc khuếch đại hai vùng ITS1, ITS2 là khá dễ dàng bằng phản ứng
PCR do những vùng bảo tồn của 18S, 5.8S và 28S có thể được sử dụng để thiết kế
những primer phổ biến. Vì thế việc sử dụng vùng này trong nghiên cứu tiến hóa của
những loài có quan hệ gần đang trở lên phổ biến (Hillis và Dixon, 1991).
2.4. Giới thiệu chương trình BLAST
2.4.1. Chức năng của chương trình BLAST
Sự so sánh những trình tự nucleotide hay protein của cùng một sinh vật hay của
những sinh vật khác nhau có vai trò quan trọng trong những nghiên cứu sinh học phân
11
tử. Sự giống nhau giữa các trình tự có thể cho biết chức năng của gen mới, tiên đoán
những thành viên mới của một họ gen, cũng như quan hệ tiến hóa. Việc tìm sự giống
nhau giữa các trình tự có thể được sử dụng để tiên đoán vị trí và chức năng của những
vùng điều hòa phiên mã và mã hóa protein ( Nguyễn Văn Cách, 2005).
Basic Local Alignment Search Tool (BLAST) là chương trình được sử dụng
phổ biến nhất cho việc tính toán sự tương đồng của các trình tự.
2.4.2. Cơ sở dữ liệu của BLAST
Một chương trình BLAST có 4 yếu tố: trình tự cần so sánh, cơ sở dữ liệu,
chương trình sử dụng và mục đích tìm kiếm. Để chọn lựa chương trình BLAST
thích hợp, trước tiên cần biết những cơ sở dữ liệu và dạng trình tự trong cơ sở
dữ liệu đó. Tùy theo loại trình tự mà phân thành hai nhóm là cơ sở dữ liệu
nucleotide và protein.
Bảng 2.1 Cơ sở dữ liệu protein
Database
Giải thích
nr
non-redundant, bao gồm dữ liệu từ Genbank + PDB + SwissProt
+ PIR + PRP, không bao gồm env_nr
refseq
Những trình tự protein từ NCBI Reference Sequence project
swissprot
Những trình tự protein từ cơ sở dữ liệu của SWISS-PROT
pat
Những trình tự protein có bản quyền của GenBank
month
Tất cả các trình tự mới từ GenBank + PDB + SwissProt + PIR +
PRF trong 30 ngày gần nhất.
pdb
Những trình tự từ cấu trúc 3 chiều trong Protein Data Bank.
env_nr
Những trình tự từ cổng env_nt
Smart nr v4.0 ²
663 PSSMs từ Smart
Pfam v11.0 ²
7255 PSSMs từ Pfam
COG v1.00 ²
4873 PSSMs từ NCBI COG
KOG v1.00 ²
4825 PSSMs từ NCBI KOG
CDD v2.05 ²
11399 PSSMs từ NCBI curated cd
12
Bảng 2.2 Cơ sở dữ liệu nucleotide
Database
nr
Giải thích
Tất cả trình tự từ GenBank + EMBL + DDBJ + PDB ( ngoại trừ
các trình tự ETS, STS, GSS, 0, 1, 2 HTGS ).
refseq_mrna
Những trình tự mRNA từ NCBI Refence Sequence Project.
refseq_genomic Những trình tự genome từ NCBI Refence Sequence Project
est
Những trình tự trong GenBank + EMBL + DDBJ từ phần ETS
est_human
Những trình tự ETS của người
est_mouse
Những trình tự ETS của chuột
est_others
Những trình tự ETS của những sinh vật khác, ngoài
người và chuột
gss
Trình tự genome chung
htgs
Những trình tự genome chưa hoàn thiện: phase 0, 1, 2.
pat
Những trình tự nucleotide có bản quyền của GenBank.
pdb
Những trình tự nhận được từ cấu trúc ba chiều của protein từ
Protein Data Bank.
month
Trình tự nucleotide mới từ GenBank + EMBL + DDBJ + PDB
trong 30 ngày gần nhất.
alu_repeats
alu_repeats từ REPBASE.
dbsts
Những trình tự từ phần STS của GenBank + EMBL + DDBJ.
chromosome
Genomes và chromosomes hoàn chỉnh từ NCBI Reference
Sequence project.
wgs
Nhóm những trình tự của toàn bộ Genome Shotgun.
env_nt
Trình tự từ những mẫu thu được từ môi trường.
2.4.3. Lựa chọn chương trình BLAST phù hợp
Đây là bước thao tác đầu tiên yêu cầu người phân tích phải xác định rõ chương
trình BLAST nào sẽ được sử dụng. Việc lựa chọn chương trình BLAST thích hợp cho
một tìm kiếm phụ thuộc vào 3 yếu tố: Bản chất của trình tự sử dụng cho BLAST ; mục
đích và cơ sở dữ liệu mà chương trình sử dụng.
Các chương trình BLAST trên NCBI gồm:
blastn (nucleotide BLAST): So sánh trình tự DNA với cơ sở dữ liệu DNA
13
blastp (protein BLAST): So sánh trình tự protein với cơ sở dữ liệu protein
blastx (translated BLAST): Dịch mã trình tự DNA thành 6 trình tự protein sử dụng
6 khung đọc có thể xảy ra, sau đó so sánh mỗi protein này với cơ sở dữ liệu protein
tblastn (translated BLAST): Dịch mỗi trình tự DNA thành cơ sở dữ liệu gồm 6
protein có thể xảy ra, sau đó so sánh trình tự protein nhập vào với mỗi protein trong cơ sở
dữ liệu này.
tblastx (translated BLAST): Sử dụng thuật toán phức tạp nhất, dịch mã DNA
nhập và từ một cơ sở dữ liệu thành những nhóm 6 protein có thể xảy ra sau đó thực
hiện tìm kiếm với những protein này.
Bảng 2.3 Lựa chọn chương trình cho trình tự protein
Chiều dài
Cơ sở dữ liệu
Mục đích
Chương trình
discontiguous megablast,
Nhận biết trình tự
megablast, or blastn
Tìm những trình tự
discontiguous megablast
tương đồng.
or blastn
Tìm những trình tự tương
20 bp hay
Nucleotide
hơn
đồng, từ Trace archive
Trace megablast, or
Trace discontiguous
megablast
Tìm những trình tự protein
giống với trình tự protein
28 bp hay
mà trình tự đang xem xét
hơn dùng
mã hóa trong cơ sở dữ liệu
megablast
Translated BLAST
(blastx)
dịch mã từ nucleotide.
Tìm
những
trình
tự
protein giống với trình tự
Peptide
protein mà trình tự đang
xem xét mã hóa trong cơ
Translated BLAST
(tblastx)
sở dữ liệu protein.
Tìm vị trí gắn primer hay
7 – 20 bp
Nucleotide
bản đồ những motif ngắn
gần nhau.
14
Search for short, nearly
exact matches
Bảng 2.4 Lựa chọn chương trình cho trình tự nucleotide
Chiều dài
Cơ sở dữ liệu
Mục đích
Chương trình
Nhận biết hay tìm kiếm những Standard Protein
trình tự protein tương đồng.
BLAST (blastp)
Tìm thành viên của một họ
protein hay xây dựng một ma PSI-BLAST
trận tỷ số vị trí chuyên biệt.
Tìm những protein tương
peptide
15 hay dài
đồng theo một mẫu đã biết.
Tìm những domain bảo tồn
hơn
PHI-BLAST
CD-search (RPSBLAST)
Tìm những domain bảo tồn Conserved Domain
và nhận biết các trình tự ArchitectureRetrieval
protein khác có cấu trúc Tool (CDART)
domain tương tự.
Tìm những protein tương
nucleotide
đồng trong cơ sở dữ liệu
dịch mã từ nucleotide.
5 - 15
peptide
Tìm những peptide motif
Translated BLAST
(tblastn)
Search for short,
nearly exact matches
2.4.4. Các bước thực hiện BLAST
Thực hiện một chương trình BLAST gồm 4 bước:
Bước 1: Chọn trình tự. Trình tự có thể ở dạng FASTA hay accession number
Bước 2: Chọn chương trình BLAST phù hợp
Bước 3: Chọn cơ sở dữ liệu.
Bước 4: Chọn tham số. Có thể chọn sinh vật, mở hay đóng chức năng filtering,
thay đổi expect value, thay đổi kích cỡ chữ, thay đổi định dạng kết quả.
2.5. Giới thiệu cây phát sinh loài
2.5.1. Khái niệm cây phát sinh loài
Cây phát sinh loài là sơ đồ hình cây miêu tả lịch sử tiến hóa của một nhóm các
loài với những đặc tính khác nhau nhưng cùng có mối quan hệ họ hàng với nhau và
15