Tải bản đầy đủ (.pdf) (12 trang)

Thiết kế primer trên đoạn gen mã hóa protein nucleocapsid của SARS cov 2

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.24 MB, 12 trang )

Họ và tên: Nguyễn Minh Anh
MSSV: 20174394
Lớp: KTSH.02-K62
Nhóm: Thứ 3

BÁO CÁO TIỂU LUẬN
Thực hành: Tin sinh học
Thiết kế Primer trên đoạn gen mã hóa Protein nucleocapsid
của SARS-CoV-2
I.
-

-

Tổng quan:
SARS-CoV-2 là virus gây ra đại dịch viêm phổi cấp COVID-19. Tính đến ngày
28/6/2020, số ca mắc COVID-19 trên toàn thế giới đã vượt ngưỡng 10 triệu người,
hơn 500.000 ca tử vong.
Yêu cầu cấp bách đặt ra là tìm cách phát triển các phương pháp xét nghiệm chẩn
đoán và tìm ra vaccine đặc hiệu, ngăn chặn sự lây lan của virus nguy hiểm này.
Mục tiêu của bài tiểu luận là thiết kế mồi cho phản ứng PCR phát hiện gen của
SARS-CoV-2 trên đoạn gen mã hóa nucleocapsid của SARS-CoV-2.

-

Các bước tiến hành
SARS-CoV-2 có họ hàng gần với SARS-CoV (cùng là coronavirus chủng SARS),
nên tiến hành xây dựng phương án thiết kế mồi dựa trên trình tự gen của các bài
báo đã được công bố.
1. Thu thập dữ liệu gen nucleocapsid trên Database
Truy cập trang web NCBI/ Nucleotide/ Nhập từ khóa


NCBI: />Tìm gen với từ khóa SARS

-

Tìm gen mã hóa nucleocapsid trên genome của SARS-CoV, nằm ở vùng gen N
Lấy trình tự FASTA

II.


>NC_004718.3:28120-29388 SARS coronavirus, complete genome
ATGTCTGATAATGGACCCCAATCAAACCAACGTAGTGCCCCCCGCATTACATTTGGTGGACCCACAGATTCAACTGA
CAATAACCAGAATGGAGGACGCAATGGGGCAAGGCCAAAACAGCGCCGACCCCAAGGTTTACCCAATAATACTGCGT
CTTGGTTCACAGCTCTCACTCAGCATGGCAAGGAGGAACTTAGATTCCCTCGAGGCCAGGGCGTTCCAATCAACACC
AATAGTGGTCCAGATGACCAAATTGGCTACTACCGAAGAGCTACCCGACGAGTTCGTGGTGGTGACGGCAAAATGAA
AGAGCTCAGCCCCAGATGGTACTTCTATTACCTAGGAACTGGCCCAGAAGCTTCACTTCCCTACGGCGCTAACAAAG
AAGGCATCGTATGGGTTGCAACTGAGGGAGCCTTGAATACACCCAAAGACCACATTGGCACCCGCAATCCTAATAAC
AATGCTGCCACCGTGCTACAACTTCCTCAAGGAACAACATTGCCAAAAGGCTTCTACGCAGAGGGAAGCAGAGGCGG
CAGTCAAGCCTCTTCTCGCTCCTCATCACGTAGTCGCGGTAATTCAAGAAATTCAACTCCTGGCAGCAGTAGGGGAA
ATTCTCCTGCTCGAATGGCTAGCGGAGGTGGTGAAACTGCCCTCGCGCTATTGCTGCTAGACAGATTGAACCAGCTT
GAGAGCAAAGTTTCTGGTAAAGGCCAACAACAACAAGGCCAAACTGTCACTAAGAAATCTGCTGCTGAGGCATCTAA
AAAGCCTCGCCAAAAACGTACTGCCACAAAACAGTACAACGTCACTCAAGCATTTGGGAGACGTGGTCCAGAACAAA
CCCAAGGAAATTTCGGGGACCAAGACCTAATCAGACAAGGAACTGATTACAAACATTGGCCGCAAATTGCACAATTT
GCTCCAAGTGCCTCTGCATTCTTTGGAATGTCACGCATTGGCATGGAAGTCACACCTTCGGGAACATGGCTGACTTA
TCATGGAGCCATTAAATTGGATGACAAAGATCCACAATTCAAAGACAACGTCATACTGCTGAACAAGCACATTGACG
CATACAAAACATTCCCACCAACAGAGCCTAAAAAGGACAAAAAGAAAAAGACTGATGAAGCTCAGCCTTTGCCGCAG
AGACAAAAGAAGCAGCCCACTGTGACTCTTCTTCCTGCGGCTGACATGGATGATTTCTCCAGACAACTTCAAAATTC
CATGAGTGGAGCTTCTGCTGATTCAACTCAGGCATAA

-


-

Thực hiện Blast trên ngân hàng dữ liệu của NCBI (có thể thực hiện trên EMBL
hoặc các cơ sở dữ liệu khác) để tìm kiếm các trình tự gen tương tự trên các bài báo
khoa học về bộ gen của SARS-CoV đã được công bố
/>

-

Tìm trình tự mã hóa gen trên các bài báo ở các nguồn và các nơi khác nhau, để
mong đợi có độ sai khác nhất định về trình tự gen (do virus biến đổi gen trong quá
trình vận động tiến hóa), từ đó có thể tìm vùng bảo thủ.


2. Đưa các trình tự đã tìm được vào công cụ Clustal W để so sánh cấu trúc gen

…………………..

3. Chọn khuôn và thiết kế mồi
3.1 Chọn khuôn


-

-

-

Dựa trên thời điểm nghiên cứu và công bố bài báo, chọn khuôn là đoạn gen mã hóa

nucleocapsid của Genbank MK211374.1 vì có thời gian công bố gần đây nhất (2019),
và gen được giải trình tự từ chủng SARS lây sang người
3.2 Thiết kế mồi
Sử dụng công cụ Primer-BLAST />Khuôn:

>MK211374.1:28076-29341 Coronavirus BtRl-BetaCoV/SC2018, complete genome
ATGTCTGATAATGGACCCCAAAACCAGCGTAGTGCCCCCCGCATTACATTTGGTGGACCCACAGATTCAAC
TGACAATAACCAGGATGGAGGACGCAGTGGTGCACGGCCAAAGCAGCGCCGACCCCAAGGTTTACCCAATA
ATACTGCGTCTTGGTTCACAGCTCTCACTCAGCATGGCAAGGAGGAACTTAAATTCCCTCGAGGCCAGGGC
GTTCCAATCAACACCAATAGTGGTAAAGATGACCAAATTGGCTACTACCGAAGAGCTACCCGACGAGTTCG
TGGTGGTGATGGTAAAATGAAAGAGCTCAGCCCCAGATGGTACTTCTATTACCTAGGTACTGGCCCAGAAG
CTTCACTTCCCTACGGCGCTAACAAAGAAGGCATCGTATGGGTCGCAACTGAGGGAGCCTTGAATACACCT
AAAGATCACATTGGCACCCGCAATCCTAATAACAATGCTGCCATCGTGCTACAACTTCCTCAAGGAACAAC
ATTGCCAAAAGGCTTCTACGCAGAGGGGAGCAGAGGCGGCAGTCAAGCCTCTTCTCGCTCTTCATCACGTA
GTCGCGGTAATTCAAGAAATTCAACTCCTGGCAGCAGTAGGGGAAATTCTCCTGCTCGAATGGCTAGCGGA
GGTGGTGAAACTGCCCTCGCGCTATTGCTGCTAGACAGATTGAACCAGCTTGAGAGCAAAGTTTCTGGTAA
AGGCCAACAACAGCAAGGCCAAACTGTCACTAAGAAATCTGCTGCTGAGGCATCCAAAAAGCCTCGCCAAA
AACGTACTGCCACAAAACAGTACAACGTCACTCAAGCATTTGGGAGGCGTGGTCCAGAACAAACCCAAGGA
AACTTTGGTGACCAAGAATTAATCAGACAAGGGACTGATTACAAACATTGGCCACAAATTGCACAATTTGC
TCCGAGTGCCTCTGCATTTTTCGGAATGTCACGCATTGGCATGGAAGTCACACCTTCGGGAACATGGCTGA
CTTATCATGGAGCCATTAAATTGGATGATAAAGATCCACAATTCAAAGACAACGTCATGCTGTTGAATAAG
CACATTGACGCATACAAAGCATTCCCACCAACAGAGCCTAAAAAGGACAAAAAGAAAAAGACTGATGAAGC
TCAGCCTTTACCGCAGAGACAAAAGAAGCAGCCTACTGTGACTCTTCTTCCTGCGGCTGACATGGATGATT
TCTCCAGACAACTTCAAAATTCCATGAGTGGAGCTTCTGCTGATTCAACTCAGGCATAA

Kết quả thiết kế mồi:
Kết quả cho 15 cặp mồi ảo:




-

-

Dựa vào đặc điểm về nhiệt độ bắt cặp mồi, tỉ lệ %G-C (trong khoảng 40-60%), khả
năng tự bắt cặp,… ta tiến hành chọn mồi và thử chạy PCR ảo với các cặp mồi
4. Chạy PCR ảo
Trang />Nhận thấy đặc điểm cặp mồi số 2 có nhiều đặc tính tốt: Nhiệt độ bắt cặp xấp xỉ bằng
nhau, tỉ lệ GC% trên 40%, khả năng tự bổ sung và tự bổ sung kéo dài mạch ở đầu
3’ thấp so với các cặp mồi khác
=> Chọn cặp mồi 2 làm mồi để tiến hành chạy PCR ảo


-

Kết quả:
PCR Products results
>973 bp product from linear template MK211374.1:28076-29341 Coronavirus
BtRl-BetaCoV/SC2018, complete genome, base 136 to base 1108 (BNN2 N2).
CCCAATAATACTGCGTCTTGGTTCACAGCTCTCACTCAGCATGGCAAGGAGGAACTTAAATTCCCTCGAGG
CCAGGGCGTTCCAATCAACACCAATAGTGGTAAAGATGACCAAATTGGCTACTACCGAAGAGCTACCCGAC
GAGTTCGTGGTGGTGATGGTAAAATGAAAGAGCTCAGCCCCAGATGGTACTTCTATTACCTAGGTACTGGC
CCAGAAGCTTCACTTCCCTACGGCGCTAACAAAGAAGGCATCGTATGGGTCGCAACTGAGGGAGCCTTGAA
TACACCTAAAGATCACATTGGCACCCGCAATCCTAATAACAATGCTGCCATCGTGCTACAACTTCCTCAAG
GAACAACATTGCCAAAAGGCTTCTACGCAGAGGGGAGCAGAGGCGGCAGTCAAGCCTCTTCTCGCTCTTCA
TCACGTAGTCGCGGTAATTCAAGAAATTCAACTCCTGGCAGCAGTAGGGGAAATTCTCCTGCTCGAATGGC
TAGCGGAGGTGGTGAAACTGCCCTCGCGCTATTGCTGCTAGACAGATTGAACCAGCTTGAGAGCAAAGTTT
CTGGTAAAGGCCAACAACAGCAAGGCCAAACTGTCACTAAGAAATCTGCTGCTGAGGCATCCAAAAAGCCT
CGCCAAAAACGTACTGCCACAAAACAGTACAACGTCACTCAAGCATTTGGGAGGCGTGGTCCAGAACAAAC
CCAAGGAAACTTTGGTGACCAAGAATTAATCAGACAAGGGACTGATTACAAACATTGGCCACAAATTGCAC

AATTTGCTCCGAGTGCCTCTGCATTTTTCGGAATGTCACGCATTGGCATGGAAGTCACACCTTCGGGAACA
TGGCTGACTTATCATGGAGCCATTAAATTGGATGATAAAGATCCACAATTCAAAGACAACGTCATGCTGTT
GAATAAGCACATTGACGCATACAAAGCATTCCCACCAACAGAGCCTAAAA

- Tương tự khi chạy thử với các mồi khác đều ra được kết quả
• Trên thực tế, có thể gen cần tách có sự sai khác về trình tự gen ở đúng đoạn
mồi. Ta phải tiến hành so sánh với càng nhiều gen tìm được, tìm ra nhiều đoạn
bảo thủ, làm việc với nhiều mồi để có thể chạy được PCR trên khuôn thực

-

5. Kiểm tra trình tự sản phẩm PCR
Kiểm tra trình tự kết quả bằng BLAST, xem kết quả BLAST có ra các trình tự tương
đồng với gen ban đầu làm khuôn không


• Tiến hành chạy thử với gen mã hóa nucleocapsid của SARS-CoV-2 (trình tự đã
được công bố), cho kết quả:

>973 bp product from linear template NC_045512.2:28274-29533 Severe acute
respiratory syndrome coronavirus 2 isolate Wuhan-Hu-1, complete genome, base
136 to base 1108 (BNN2 - N2).
CCCAATAATACTGCGTCTTGGTTCACCGCTCTCACTCAACATGGCAAGGAAGACCTTAAATTCCCTCGAGGACAAGG
CGTTCCAATTAACACCAATAGCAGTCCAGATGACCAAATTGGCTACTACCGAAGAGCTACCAGACGAATTCGTGGTG
GTGACGGTAAAATGAAAGATCTCAGTCCAAGATGGTATTTCTACTACCTAGGAACTGGGCCAGAAGCTGGACTTCCC
TATGGTGCTAACAAAGACGGCATCATATGGGTTGCAACTGAGGGAGCCTTGAATACACCAAAAGATCACATTGGCAC
CCGCAATCCTGCTAACAATGCTGCAATCGTGCTACAACTTCCTCAAGGAACAACATTGCCAAAAGGCTTCTACGCAG
AAGGGAGCAGAGGCGGCAGTCAAGCCTCTTCTCGTTCCTCATCACGTAGTCGCAACAGTTCAAGAAATTCAACTCCA
GGCAGCAGTAGGGGAACTTCTCCTGCTAGAATGGCTGGCAATGGCGGTGATGCTGCTCTTGCTTTGCTGCTGCTTGA
CAGATTGAACCAGCTTGAGAGCAAAATGTCTGGTAAAGGCCAACAACAACAAGGCCAAACTGTCACTAAGAAATCTG

CTGCTGAGGCTTCTAAGAAGCCTCGGCAAAAACGTACTGCCACTAAAGCATACAATGTAACACAAGCTTTCGGCAGA
CGTGGTCCAGAACAAACCCAAGGAAATTTTGGGGACCAGGAACTAATCAGACAAGGAACTGATTACAAACATTGGCC
GCAAATTGCACAATTTGCCCCCAGCGCTTCAGCGTTCTTCGGAATGTCGCGCATTGGCATGGAAGTCACACCTTCGG
GAACGTGGTTGACCTACACAGGTGCCATCAAATTGGATGACAAAGATCCAAATTTCAAAGATCAAGTCATTTTGCTG
AATAAGCATATTGACGCATACAAAACATTCCCACCAACAGAGCCTAAAA


6. Một số đặc điểm của Major capsid protein (MCP) của SARS-CoV-2

-

Protein nucleocapsid (N) (SARS-CoV) là một trong bốn protein cấu trúc của virus
pI = 10,11
Mw = 45052,14 Da


-

Protein vỏ capsid ở ngoài tế bào chất, hình thành vỏ của virus, góp phần quyết định
kháng nguyên của virus




×