Tải bản đầy đủ (.pdf) (14 trang)

Thực hành tin sinh học kiểm tra sự khác biệt trong các trình tự tiến hóa ths nguyễn thành luân

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (822.15 KB, 14 trang )

Thực hành Tin sinh học

KIỂM TRA SỰ KHÁC BIỆT TRONG CÁC
TRÌNH TỰ TIẾN HÓA
Bài thực hành Tin sinh học số 3
GV: ThS. Nguyễn Thành Luân


CÁC QUY ĐỊNH CHUNG TRONG THỜI
GIAN THỰC HÀNH
THỜI GIAN THỰC HÀNH VỚI MÁY

KHÔNG LÀM BẤT KỲ CÔNG VIỆC RIÊNG NÀO VỚI MÁY

TỰ LÀM VIỆC, THỜI GIAN KIỂM TRA THEO NHÓM HOẶC CÁ
NHÂN

ThS. Nguyễn Thành Luân

1


Thực hành Tin sinh học

CÀI ĐẶT PHẦN MỀM
 BioEdit
 MEGA4
 MỞ FILE THỰC HÀNH SỐ 03  Gen thực

hành 03.rar


VẤN ĐỀ - TRIỆU CHỨNG
SINH HỌC
 Một bệnh nhân được báo cáo tại 1 bệnh viện

với sự phát triển khác thường ở mắt (ảnh).

ThS. Nguyễn Thành Luân

2


Thực hành Tin sinh học

VẤN ĐỀ SINH HỌC
 Các bác sĩ tiến hành phẫu thuật mắt và lấy

ra 1 con ấu trùng trong cơ thể từ vết thương
đó (ảnh dưới)  Mang đi giải mã trình tự

GIỚI THIỆU CSDL
BOLDSYSTEMS
 BOLD = The Barcode of Life Database
 Được thiết kế để hỗ trợ sự phát triển và ứng

dụng của các CSDL Barcode DNA.
 Nền tảng CSDL bao gồm 3 phần chính: 1 cổng
nhập liệu CSDL, 1 hệ thống máy chủ CSDL
barcode và khu vực chọn lọc CSDL
 BOLD được mở rộng miễn phí cho bất kỳ nhà
nghiên cứu nào đam mê trong lĩnh vực DNA

Barcoding

ThS. Nguyễn Thành Luân

3


Thực hành Tin sinh học

Giới thiệu Barcode Of Life Database
(BOLD)
 Chứa trên 800,000 trình tự barcode (2010)
 Được đóng góp bởi nhiều nhà khoa học và

nghiên cứu viên trên toàn thế giới.
 DNA được tách chiết từ cơ thể SV, phóng đại
gen COI sau đó giải mã trình tự gen.
 Trình tự sau đó được đưa vào BOLD kết hợp
với tên loài phù hợp với mã barcode đã được
giải mã.

THAO TÁC THỰC HÀNH
 Để xác định loài chưa biết tên đó, vào trang web

()  Click vào mục
“Identification”
 Dán đoạn trình tự GEN THỰC HÀNH SỐ 03 vào
mục textbox của Animal Identification (COI).
 Click vào mục “Submit”. Sau đó, chờ cho việc phân
tích hoàn tất, bạn sẽ được dẫn đến 1 trang mới với

danh sách các loài, phân loại của loài đó và tỷ lệ
tương đồng với những loài khác.

ThS. Nguyễn Thành Luân

4


Thực hành Tin sinh học

Giao diện BOLDSYSTEMS

Di chuyển
xuống
dưới và
Dán trình
tự ở dạng
.fasta 
SUBMIT

Nguồn: Ratnasingham, S. & Hebert, P. D. N. (2007). BOLD: The Barcode of
Life Data System (www.barcodinglife.org). Molecular Ecology Notes 7, 355364. DOI: 10.1111/j.1471-8286.2006.01678.

TRẢ LỜI CÂU HỎI
 Tên loài nào tương đồng nhất với loài được giải

trình tự?

 Loài nào được phân loại và chi tiết loài được phân


loại?

 Có phải loài phân loại này thuộc nhóm ký sinh

trùng gây bệnh ở người hay không? (dùng Google
search hay theo tênS)

ThS. Nguyễn Thành Luân

5


Thực hành Tin sinh học

CSDL INSECT/SPIDERS

te1
01.com/article.cfm/
screwworm_parasi
tic_fly

KẾT LUẬN CỦA BÁC SỸ
 Trong trường hợp này, việc tìm hiểu thông tin cực

kỳ quan trọng cho việc quyết định phương pháp
điều trị cho bệnh nhân. Loài đặc biệt này chỉ có thể
ký sinh trên 1 người trong giai đoạn ấu trùng.
 Vì vậy, không có cơ hội nào cho bất cứ ấu trùng
nào còn sót lại để dẫn đến sự tàn phá cơ thể bệnh
nhân. Tuy nhiên, những ký sinh trùng khác như

giun móc, giun sán không nằm trong trường hợp
này.

ThS. Nguyễn Thành Luân

6


Thực hành Tin sinh học

Xây dựng và dẫn xuất 1
đoạn genome nhỏ
 Mục đích bài tập:
– Thực hiện việc xây dựng 1 chương trình genome từ dữ liệu của
1 đoạn genome ti thể.
– Đoạn gen ti thể của 1 loài giun tròn với mỗi phân mảnh trình tự
khoảng 500 –800 nucleotide.
– Những đoạn trình tự chứa những đoạn lặp lại
– Nhiệm vụ của bạn là phân mảnh lại các đoạn này với nhau và
lập nên 1 trình tự genome hoàn chỉnh
– Sau đó, dẫn xuất genome đó, tìm kiếm các gen trên đoạn
genome đó, chính xác nơi nào nó bắt đầu, nơi nào nó kết thúc.
Nhiệm vụ của bạn là xác định vị trí của 6 nhóm gen liên kết
protein (protein coding gene) và 5 gen tRNA

Xây dựng và dẫn xuất 1
đoạn genome nhỏ
 Đoạn gen này được giải mã trình tự bằng phương

pháp Walking và các báo cáo khoa học muốn

được công nhận phải có đầy đủ 2 sợi (Double
strands) của chuỗi DNA đã được giải mã.
 Điều này cho thấy 1 hướng nghiên cứu dựa trên

mỗi đoạn trình tự riêng lẻ như mỗi sợi của chuỗi
DNA phải bổ sung 1 cách chính xác

ThS. Nguyễn Thành Luân

7


Thực hành Tin sinh học

THAO TÁC THỰC HÀNH
 Mở file mt_fwd_frags.abi trong FILE THUC HANH 03 bằng







BioEdit
File này chứa 17 đoạn trình tự với độ dài khoảng 500-800 nucleotide
Để tìm thấy nơi nào đoạn trình tự bị lặp lại với 1 đoạnh trình tự khác
trong CSDL, chúng ta sử dụng chương trình CONTIG ASSEMBLY
trong BioEdit
Chương trình này sẽ nói cho bạn nơi nào những trình tự bị trùng lắp và
có thể gắn kết những mảnh DNA liên kề đơn lẻ với nhau.

Chọn „Accessory Application‟ ở Menu, và chọn „CAP
ContigAssembly Program‟
Click vào “Run Application”

Giao diện BioEdit

ThS. Nguyễn Thành Luân

8


Thực hành Tin sinh học

THAO TÁC THỰC HÀNH
 Kết quả phân tích trình tự hoàn tất khi có chữ “SHOW” xuất hiện
 Để xem kết quả của việc phân tích, đóng cửa sổ này.
 Bạn sẽ thấy được 1 đoạn trình tự khoảng hơn 8000 base pair và

kéo sang phải sẽ thấy các đoạn trùng lắp trên DNA
 Đoạn trình tự kết nối với nhau sẽ được chỉ với đoạn trình tự cuối
cùng nằm phía dưới ký hiệu là Contig-0. Đây là đoạn trình tự giải
mã xuôi (Forward sequence)
 Để SAVE đoạn trình tự này, xóa tất cá các trình tự nhỏ khác bằng
phím CTRL + DEL, chỉ lưu lại 1 đoạn CONTIG-0.
 Sau đó chọn File ở Menu, Save As tên file là
CONTIG_FWD.FAS

THAO TÁC THỰC HÀNH
 Lặp lại quá trình trên nhưng chọn file là mt_rev_frags.abi cho


đoạn gen phiên mã ngược. Save đoạn gen giải mã là
CONTIG_REV.FAS
 Để xem 2 sợi DNA từ 2 đoạn trình tự có chính xác kết hợp bổ sung
với nhau hay không, mở file CONTIG_FWD.FAS vào mục FILE ở
Menu, chọn Import  Sequence Alignment  Import file
CONTIG_REV.FAS
 Chúng có vẻ không bổ sung kết hợp cho nhau vì chúng kết hợp từ
những đoạn gen từ 2 sợi khác nhau nên để thấy chúng kết hợp bổ
sung nhau, bạn phải xem 1 đoạn từ phải sang trái hay dùng kỹ thuật
phiên mã ngược 1 trong 2 sợi của chuỗi DNA

ThS. Nguyễn Thành Luân

9


Thực hành Tin sinh học

THAO TÁC THỰC HÀNH
 Click vào 1 trong 2 đoạn trình tự để highlight

nó  Vào mục Sequence ở Menu  chọn
„Nucleic Acid‟  chọn „Reverse
Complement‟.
 Nó sẽ hiện ra 1 bằng chứng 2 đoạn gen trình
tự phải được kết hợp chính xác với nhau. Để
kiểm tra lại lần cuối 1 cách nhanh chóng, click
vào biểu tượng dưới đây:

HOÀN THÀNH CÂU 2 (5’)

 Tiếp theo, bạn sẽ phải lập bản đồ vị trí gen

trên đoạn genome vừa phân loại được. Copy
đoạn genome vừa giải mã được vào file Gen
thực hành 03.doc
 Vào ORFinder theo link
/>in để thấy các đoạn đọc mở (Open Reading
Frames) trong đoạn trình tự của bạn

ThS. Nguyễn Thành Luân

10


Thực hành Tin sinh học

ORF Finder
 Dán đoạn trình tự của bạn vào textbox và

chọn “Invertebrate Mitochondrial” ở mục
Genetic Code (vì chúng ta biết đây là loài
động vật không xương sống (giun tròn)
 Click vào OrfFind  Sau khi quá trình phân
tích hoàn tất, bạn sẽ thấy 1 kết quả như hình:

Ý nghĩa biểu diễn trong ORF
 Mỗi thanh trong khung đọc mở miêu tả 1 trong 6 khung đọc

khác nhau.
– 3 thanh đầu mô tả khung đọc mở cho 3 đoạn gen phiên mã xuôi

(Forward reading frames),
– 3 thanh cuối mô tả 3 đoạn gen phiên mã ngược (Reverse reading
frames).
– Chúng ta cần xác định 6 gen mã hóa protein (protein coding gene) nên
chúng ta tìm hiểu đoạn đọc mở dài nhất biểu hiện bằng đoạn đọc có
màu xanh dài nhất

 Click vào đoạn đọc mở đơn lẻ màu xanh (Single ORF). Nó sẽ

chuyển từ màu xanh sang hồng khi bạn click vào.
 Ví dụ: Click vào biểu tượng khung đọc mở bên trái, thanh
đầu tiên dài nhất, đoạn dịch mã sẽ biểu hiện trình tự với
aa khởi đầu là Methionine và kết thúc với 1 codon kết
thúc (TAG)

ThS. Nguyễn Thành Luân

11


Thực hành Tin sinh học

TRẢ LỜI CÂU HỎI (5’)
Hãy trả lời câu hỏi vào Bảng 1

Hướng dẫn (Hints)
 Để xác định mỗi đoạn ORF, bạn sẽ cần phải thực

hiện tìm kiếm “BLASTP SEARCH”
 Highlight đoạn trình tự mới kiếm được, click vào

nút biểu tượng “BLAST”  thấy được Protein ID
(Đây là gen mã hóa protein)  Click vào thanh
„View Report‟.
 Sau khi BLAST search hoàn tất, bạn sẽ thấy 1 bảng
biểu thị tất cả những gen về ti thể liên quan đến
đoạn đọc mở trên. Nếu có, bạn đã thành công trong
việc xác định khung đọc mở và thêm vào bảng báo
cáo của bạn như trên

ThS. Nguyễn Thành Luân

12


Thực hành Tin sinh học

Tìm kiếm các đoạn tRNA
 Bạn mong muốn tìm kiếm 5 đoạn gen tRNA trong

trình tự genome ti thể của bạn.
 Copy đoạn genome trình tự của bạn  vào
tRNAScantheo link:
/> Dán đoạn trình tự của bạn vào textbox  chỉnh ở
phần „Source‟ sang Nematode Mito, và đặt ở mục
„Genetic Code for tRNA Isotype Prediction‟ thành
„Invertebrate Mito‟.
 Ghi rõ ở mục „Cove Score Cutoff‟ là 15.

Tìm kiếm tRNA – Kết quả
 Click vào nút Run tRNAScan.

 Chờ quá trình phân tích dữ liệu hoàn tất, bạn

sẽ thấy 1 danh sách các gen tRNA với vị trí
chúng được đánh dấu và cove score (điểm
vòng).
 Điểm vòng là 1 sự chỉ thị các phân mảnh trình
tự được phân loại có thể gắn vào trong 1 cấu
trúc tRNA vòng xoay đặc biệt 1 cách đặc hiệu
hay không.

ThS. Nguyễn Thành Luân

13


Thực hành Tin sinh học

Tìm kiếm tRNA (5’)
 Tìm kiếm 5 gen tRNA và điền vào bảng
tRNA gene

Vị trí nucleotide

Tên gene

1
2
3
4
5


KẾT THÚC BÀI THỰC HÀNH
 Chuẩn bị kiểm tra tại lớp 5%
 Làm thêm các bài tập trong giáo trình thực

hành
 Mang theo USB 3G cho thực hành môn học

ThS. Nguyễn Thành Luân

14



×