báo cáo môn tin sinh

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (644.11 KB, 20 trang )

Bài 1. Anh (chị) hãy sử dụng công cụ tìm kiếm trên internet để tìm 01 gen liên
quan đến khả năng kháng sâu của cây trồng (trong Ngân hàng gen Quốc tế
NCBI - Copy toàn bộ thông tin và trình tự nucleotide của gen đó để đưa vào Báo
cáo).
Trả lời

Zea mays cultivar B73 chromosome 6, B73
RefGen_v4, whole genome shotgun sequence
NCBI Reference Sequence: NC_024464.2
FASTA Graphics

Go to:
LOCUS
NC_024464
1864 bp DNA linear CON 20-MAR-2017
DEFINITION Zea mays cultivar B73 chromosome 6, B73 RefGen_v4, whole
genome
shotgun sequence.
ACCESSION NC_024464 REGION: complement(91511985..91513848)
GPC_000002840
VERSION NC_024464.2
DBLINK BioProject: PRJNA249074
BioSample: SAMN04296295
Assembly: GCF_000005005.2
KEYWORDS WGS; RefSeq.
SOURCE
Zea mays
ORGANISM Zea mays
Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta;
Spermatophyta; Magnoliophyta; Liliopsida; Poales; Poaceae; PACMAD
clade; Panicoideae; Andropogonodae; Andropogoneae; Tripsacinae;

Zea.
COMMENT REFSEQ INFORMATION: The reference sequence is identical to
CM000782.4.
On Mar 20, 2017 this sequence version replaced gi:662248888.
Assembly name: B73 RefGen_v4
The genomic sequence for this RefSeq record is from the
whole-genome assembly released by the maizesequence on 2017/02/07.
The original whole-genome shotgun project has the accession
LPUQ00000000.1.
##Genome-Assembly-Data-START##

Assembly Provider
:: Genome Center, Washington University
School of Medicine, USA, St. Louis
Assembly Method
:: Celera Assembler v. CA 8.3rc2
Assembly Name
:: B73 RefGen_v4
Long Assembly Name :: B73 RefGen_v4 Zm00001d
Genome Representation :: Full
Expected Final Version :: Yes
Genome Coverage
:: 65.0x
Sequencing Technology :: PacBio
##Genome-Assembly-Data-END##
##Genome-Annotation-Data-START##
Annotation Provider
:: NCBI
Annotation Status

:: Full annotation
Annotation Version
:: Zea mays Annotation Release 101
Annotation Pipeline
:: NCBI eukaryotic genome annotation
pipeline
Annotation Software Version :: 7.3
Annotation Method
:: Best-placed RefSeq; Gnomon
Features Annotated
:: Gene; mRNA; CDS; ncRNA
##Genome-Annotation-Data-END##
FEATURES
Location/Qualifiers
source
1..1864
/organism="Zea mays"
/mol_type="genomic DNA"
/cultivar="B73"
/db_xref="taxon:4577"
/chromosome="6"
/tissue_type="seedling"
/country="USA"
gene
<1..1864
/gene="mir1"
/gene_synonym="CL872_-2; CL872_-2_ov; GRMZM2G150276"
/note="maize insect resistance 1; Derived by automated
computational analysis using gene prediction method:
BestRefSeq."

/db_xref="GeneID:542561"
mRNA
join(1..>567,706..938,1068..1211,1363..1864)
/gene="mir1"
/gene_synonym="CL872_-2; CL872_-2_ov; GRMZM2G150276"

CDS

/product="maize insect resistance 1"
/inference="similar to RNA sequence, mRNA (same
species):RefSeq:NM_001112101.1"
/exception="annotated by transcript or proteomic data"
/note="The RefSeq transcript has 24 substitutions, 6
non-frameshifting indels and aligns at 97% coverage
compared to this genomic sequence; Derived by automated
computational analysis using gene prediction method:
BestRefSeq."
/transcript_id="NM_001112101.1"
/db_xref="GeneID:542561"
join(18..567,706..938,1068..1211,1363..1656)
/gene="mir1"
/gene_synonym="CL872_-2; CL872_-2_ov; GRMZM2G150276"
/inference="similar to AA sequence (same
species):RefSeq:NP_001105571.1"
/exception="annotated by transcript or proteomic data"
/note="The RefSeq protein has 13 substitutions, 6
non-frameshifting indels and aligns at 99% coverage
compared to this genomic sequence; Derived by automated
computational analysis using gene prediction method:

BestRefSeq."
/codon_start=1
/product="maize insect resistance 1 precursor"
/protein_id="NP_001105571.1"
/db_xref="GeneID:542561"

/translation="MRPTRSAVSATALLLLAVALALAATAAARHSYTTTTTRVPAPAE
RADEEVRRMYEAWKSKHGRGGSSNDDCDMAPGDDEQEEEDRRLRLEVFRDNLRYIDA
H
NAEADAGLHTFRLGLTPFADLTLEEYRGRVLGFRARGRRSGARYGSGYSVRGGDLPDA
IDWRQLGAVTEVKDQQQCGGCWAFSAVAAIEGVNAIATGNLVSLSEQEIIDCDAQDSG
CDGGQMENAFRFVIGNGGIDTEADYPFIGTDGTCDASKEKNEKVATIDGLVEVASNNE
TALQEAVAIQPVSVAIDASGRAFQHYSSGIFNGPCGTSLDHGVTAVGYGSESGKDYWI
VKNSWSASWGEAGYIRMRRNVPRPTGKCGIAMDASYPVKDTYHPGTGTATARAAAMD
V

IKMVLA"

Origin
TCCCATCATCTCTCGCCATGCGCCCAACACGCTCCCCTGTGCCGGCTACG
GCGCTGCTCCTGCTTGCCGTGGCACTGGCACTGGCCGCCACGGCGGCG
GCCCGCCACTTCTACACCACCACCACCACCACCCGCGTCCCGGCGCCAG
CGGAGCGGGCGGACGAGGAGGTAAGGCGCATGTACGAGGCGTGGAAGT
CGAAGCACGGGCGCGGCGGCAGCAGCAACGACGACTGCGACATGGCG
CCCGGCGATGATGAGCAGGAGGAGGACCGCCGGCTGCGGCTGGAGGTG
TTCCGCGACAACCTTCGGTACATCGACAAGCACAACGCGGAGGCGGAC
GCTGGGCTCCACACCTTCCGCCTCGGCCTCACCCCCTTCGCCGACCTCA
CCCTGGACGAGTACCGCGGCCGCGTCCTCGGATTCCGCGCCCGCGCCCG
CCGCAGCGGCGCCCGCTACGGCCACGGCCACGGCTACCGCGCCCGTCC

CCGCGGCGGCGACCTCCTCCCCGACGCCATCGACTGGCGCCAGCTTGGC
GCCGTCACCGAGGTCAAGGACCAGCAACAGTGCGGTCCGTAGCATATAT
ACTCCGACCCATAGCGCGCCGTACTCTTACATATGTGTGCGTGCTCTCCG
GCGAGAAGCTTGTTGCGGCTACTTATCTGATGACGATCTCTGTGGGGGG
CATGCAATGCATGCATGCTTGCAGGTGGGTGCTGGGCGTTCTCGGCGGT
GGCGGCCATCGAGGGGATCAACGCGATCGCGACGGGTAAC
CTGGTGTCGCTGTCGGAGCAGGAGATCATCGACTGCGACGCCCAGGAC
AGCGGCTGCGACGGCGGGCAGATGGAGAACGCGTTCCGGTTCGTCATC
GGCAACGGCGGGATCGACACCGAGGCCGACTACCCCTTCATCGGAACC
GACGGCACTTGTGACGCCAGCAAGGTCGGTATGGGTGCTGGCGTGCTGC
TGCTTTTGCTTCGTCGATCGATGGATGGATGATGCGGTAGTACTGCTGCT
AATATAACGGAGAGATCGATATGACTGTGTGTGTACGTGTTCAATTCAAT
GCAGGAGAACAACGAGAAGGTCGCCACCATAGATGGGTTGGTGGAGGT
GGCGAGCAACAACGAGACGGCGCTGCAGGAGGCGGTGGCGATCCAGC
CCGTCAGTGTCGCCATCGACGCAAGCGGGCGTGCGTTCCAGCACTACAG
TTCGGTAAGCTAGCTAGCTAGCTAAGCATGCATGAGAATGAGATCCATCA
GACGACGACGACGACGACCGTCACAGATTTAGGAAGAACTAGCTAGCT
AGGTTCTGTGCGTGTCTGTCTGTGTGATGAACTGTTGTAGTATGCACTAT
AATGCAGGGCATCTTCAACGGGCCATGCGGGACGAGCCTGGACCACGG
CGTCACGGCGGTGGGCTACGGCAGCGAGAGCGGCAAGGACTACTGGAT
CGTGAAGAACTCGTGGAGCGCCAGCTGGGGCGAGGCCGGCTACATCCG
CATGAGGCGCAACGTGCCCCGGCCCACGGGCAAGTGCGGCATCGCCAT
GGACGCGTCCTACCCTGTGAAGGACACCTACCACGACCCCGGCACCGG
CACCGGCACCGCCACGGCTACGGCAGCTGCCATGGATGTGATCAAGATG
GTTCTTGCTTAGGAGGGAGCGAGCGGAGCAGGCAGCAGAGAGCCGATG
GTCTTGTCGTGTTGAACTTTACATATGGTAGCTAGGTACCACTGGGGATA
ATTAAGTTAATCCGTTATGGTGTGGCAAGTTAATTAATATGTGCGTATCTC

TTTTGATGAGTGCCATATATGATGTAATGAAGTTACATAAACTCAAATAAA

GTCGTAATCGTAATGGTAAA
Bài 2. Anh (chị) hãy sử dụng các phần mềm đã học để thiết kế cặp mồi đặc hiệu
cho nhân gen mà các Anh (chị) tìm được ở trên. Ghi chú : Ở cả mồi xuôi và mồi
ngược đều gắn điểm cắt của enzyme giới hạn phù hợp, tính toán các thông số của
mồi như: số nucleotide, Tm, tỷ lệ % GC.
Trả lời
Origin
TCCCATCATCTCTCGCCATGCGCCCAACACGCTCCCCTGTGCCGGCTACG
GCGCTGCTCCTGCTTGCCGTGGCACTGGCACTGGCCGCCACGGCGGGG
CCCGCCACTTCTACACCACCACCACCACCACCCGCGTCCCGGCGCCAGC
GGAGCGGGCGGACGAGGAGGTAAGGCGCATGTACGAGGCGTGGAAGTC
GAAGCACGGGCGCGGCGGCAGCAGCAACGACGACTGCGACATGGCGC
CCGGCGATGATGAGCAGGAGGAGGACCGCCGGCTGCGGCTGGAGGTGT
TCCGCGACAACCTTCGGTACATCGACAAGCACAACGCGGAGGCGACGC
TGGGCTCCACACCTTCCGCCTCGGCCTCACCCCCTTCGCCGACCTCACC
CTGGACGAGTACCGCGGCCGCGTCCTCGGATTCCGCGCCCGCGCCCGCC
GCAGCGGCGCCCGCTACGGCCACGGCCACGGCTACCGCGCCCGTCCCC
GCGGCGGCGACCTCCTCCCCGACGCCATCGACTGGCGCCAGCTTGGCGC
CGTCACCGAGGTCAAGGACCAGCAACAGTGCGGTCCGTAGCATATATAC
TCCGACCCATAGCGCGCCGTACTCTTACATATGTGTGCGTGCTCTCCGGC
GAGAAGCTTGTTGCGGCTACTTATCTGATGACGATCTCTGTGGGGGGCAT
GCAATGCATGCATGCTTGCAGGTGGGTGCTGGGCGTTCTCGGCGGTGGC
GGCCATCGAGGGGATCAACGCGATCGCGACGGGTAACCTGGTGTCGCTG
TCGGAGCAGGAGATCATCGACTGCGACGCCCAGGACAGCGGCTGCGAC
GGCGGGCAGATGGAGAACGCGTTCCGGTTCGTCATCGGCAACGGCGGG
ATCGACACCGAGGCCGACTACCCCTTCATCGGAACCGACGGCACTTGTG
ACGCCAGCAAGGTCGGTATGGGTGCTGGCGTGCTGCTGCTTTTGCTTCG
TCGATCGATGGATGGATGATGCGGTAGTACTGCTGCTAATATAACGGAGA
GATCGATATGACTGTGTGTGTACGTGTTCAATTCAATGCAGGAGAACAAC
GAGAAGGTCGCCACCATAGATGGGTTGGTGGAGGTGGCGAGCAACAAC

GAGACGGCGCTGCAGGAGGCGGTGGCGATCCAGCCCGTCAGTGTCGCC
ATCGACGCAAGCGGGCGTGCGTTCCAGCACTACAGTTCGGTAAGCTAGC
TAGCTAGCTAAGCATGCATGAGAATGAGATCCATCAGACGACGACGACG
ACGACCGTCACAGATTTAGGAAGAACTAGCTAGCTAGGTTCTGTGCGTG
TCTGTCTGTGTGATGAACTGTTGTAGTATGCACTATAATGCAGGGCATCTT

CAACGGGCCATGCGGGACGAGCCTGGACCACGGCGTCACGGCGGTGGG
CTACGGCAGCGAGAGCGGCAAGGACTACTGGATCGTGAAGAACTCGTG
GAGCGCCAGCTGGGGCGAGGCCGGCTACATCCGCATGAGGCGCAACGT
GCCCCGGCCCACGGGCAAGTGCGGCATCGCCATGGACGCGTCCTACCCT
GTGAAGGACACCTACCACGACCCCGGCACCGGCACCGGCACCGCCACG
GCTACGGCAGCTGCCATGGATGTGATCAAGATGGTTCTTGCTTAGGAGG
GAGCGAGCGGAGCAGGCAGCAGAGAGCCGATGGTCTTGTCGTGTTGAA
CTTTACATATGGTAGCTAGGTACCACTGGGGATAATTAAGTTAATCCGTTA
TGGTGTGGCAAGTTAATTAATATGTGCGTATCTCTTTTGATGAGTGCCATA
TATGATGTAATGAAGTTACATAAACTCAAATAAAGTCGTAATCGTAATGG
TAAA

 Thiết kế mồi xuôi :
Bước 1: Từ mã mở đầu kéo dài 15-20 nucleotide sau mã mở đầu
Bước 2 : Thêm 3 nucleotide trước mã mở đầu
Bước 3 : Thêm enzym cắt giới hạn trước 3 nucleotide
Bước 4 : Thêm 1 vài nucleotide trước điểm cắt enzym cắt giới hạn. copy trình tự
gen -> vào DNAclub kiểm tra và chọn enzym có trình tự cắt là 0 => enzym được
chọn có tên AluI (AGCT).
* Kết quả : Mồi xuôi : ATCAGCTCGCATGCGCCCAACACGCTCCCCTG
E. AluI
START
Tm=71%; GC% = 65; nt = 32

 Thiết kế mồi ngược:
Bước 1: Từ mã kết thúc kéo dài 15-20 nucleotide trước mã kết thúc
Bước 2 : Thêm 3 nucleotide sau mã kết thúc
Bước 3 : Thêm enzym cắt giới hạn sau 3 nucleotide đó
Bước 4 : Thêm 1 vài nucleotide sau điểm cắt enzym cắt giới hạn. Copy trình tự gen
-> vào DNAclub kiểm tra và chọn enzym có trình tự cắt là 0 => enzym được chọn
có tên BssH II (GCGCGC).
Mồi chưa đảo chiều :
AGTGCCATATATGATGTAATGAGCTGCGCGCGCT
STOP
E. BssH II

Trình tự mồi :
AGTGCCATATATGATGTAATGAGCTGCGCGCGCT
Mồi đã đảo chiều và bổ sung:
CGCGCGCGCAGCTCATTACATCATATATGGCACT
Tm = 64; GC% = 52; nt = 34
Điều chỉnh thông số 2 mồi giống nhau :
Mồi xuôi: ATCAGCTCGCATGCGCCCAACACGCTCCCCTG ( thêm 4 nu AT)
=> ATCAGCTCGCATGCGCCCAACACGCTCCCCTGATAT
Được: Tm = 70; GC% = 58; nt = 36
Mồi ngược: CGCGCGCGCAGCTCATTACATCATATATGGCACT (thêm 4 nu
GC vào cuối) => CGCGCGCGCAGCTCATTACATCATATATGGCACTGCGC.
Được: Tm = 68; GC% = 57; nt = 38
Thông số
Tm in PCR (C)
GC Content (%)
Primer length (nt)

Mồi xuôi
70
58
36

Nhận xét : tỉ lệ GC Content cả hai mồi đều >50%.
Tm in PCR của cả hai mồi gần sát nhau (>55).
Chiều dài của 2 mồi chênh lệch nhau là 2.
=> Đoạn mồi thiết kế được là hợp lý.

Mồi ngược
68
57
38

Bài 3: Anh (chị) hãy sử dụng các phần mềm đã học để so sánh trình tự nucleotide
của các đoạn ADN như bên dưới (S1, S2, S3, S4 và S5).
Sử dụng công cụ tạo cây quan hệ di truyền (Tool/Tree) trong Ngân hàng dữ liệu
DNA Việt Nam (www.dnabank.vn) để tạo cây quan hệ di truyền giữa các mẫu (S1,
S2, S3, S4 và S5).
S1
ATGCGATACTTGCTGTGAATTGCAGAATCCCGCGAACCATCGAGTCTTTG
AACGCTAGTTGCGCCCGAAGCCATTAGGCTGAGGGCACGTCTGCCTGGG
CGTCTCACGTTGCGTCGCCCGCGCCCCCTCCCCCGCGAAGGGAAGAAG
GGCTGCGGACGGATGCTGGCCCCCCGCGCGCGGTCGGCCCAAAAACGA
GTCCCCCGCGACGGACGACGCGTCGCGACGAGTGGTGGTTGACAAACC
GTTGCGTCGCCTCGCGCGCGTCCGCGCCGTCTCGGGAGGCCTGTCGTGA
GCCCATCGCGCCGCCAAGGCCAAGGCCAAGGCCAAGGCGCTCCGATCG
CGACCCCAGGTCAGGCGGGATTACCGGCTGAGTTTAAGCATATCAATAA

GCGGAGGA
S2
ATGCGATACTTGGTGTGAATTGGAGAATCCCGCGAACCATCGAGTCTTTG
AACGCAAGTTGCGCCCGAAGCCATTAGGCTGAGGGCACGTCTGCCTGG
GCGTCTCACGTTGCGTCGCCCGCGCCCCCTCCCCCGCGAAGGGAAGAA
GGGCTGCGGGCGGATGCTGGCCCCCCGCGCGCGGTCGGCCCAAAAACG
AGTCCCCCGCGACGGACGACGCGTCGCGACGAGTGGTGGTTGACAAAC
CGTTGCGTCGTCTCGCGCGCGTCCGCGCCGTCTCGGGAGGCCTGTCGTG
ACCCCATCGCGCCGCCAAGGCCAAGGCCAAGGCCAAGGCGCTCCGATC
GCGACCCCAGGTCAGGCGGGATTACCCGCTGAGTTTAAGCATATCAATA
AGCGGAGGA
S3
ATGCGATACTTAGTGTGAATTGCAGAATCCCGCGAACCATCGAGTCTTTG
AACGCAAGTTGCGCCCGAAGCCATTAGGTTGAGGGCACGTCTGCCTGG
GCGTCTCACGTTGCGTCGCCCGCGCCCCCCTCCCCCGCGAAGGGAAGA
AGGGCTGCGGGCGGATGCTGGGCCCCCGCGCGCGCCCGCGCACGGTCG
GCCCAAAAGCGAGTCCCCCGCGACGGACGACGCGTCGCGACGAGTGGT
GGTTGACAAACCGTTGCGTCGCCTCGCGCGCGTCCGCGCCGTCTCGGGA
GGCCTGTCGTGACCCCATCGCGCCAAGGCCAAGGCCAAGGCGCTGCGA

TCGCGACCCCAGGTCAGGCGGGATTACCCGCTGAGTTTAAGCATATCAAT
AAGCGGAGGA
S4
ATGCGATACTTGGTGTGAATTGCAGAATCCCGCGAACCATCGAGTCTTTG
AACGCAAGTTGCGCCCGAAGCCATTAGGTTGAGGGCACGTCTGCCTGG
GCGTCTCGCGTTGCGTCGCCCGCGCCCCCCTCCCCCGCGAAGGGAAGA
AGGGCTGCCGGCGGATGCTGGCCCCCCGCGCGCGCCCGCGCGCGGTCG
GCCCAAAAGCGAGTCCCCCGCGACGGACGACGCGTCGCGACGAGTGGT
GGTTGACAATCCGTTGCGTCGCCTCGCGCGCGTCCGCGCCGTCTCGGGA

GGCCTGTCGTGACCCCATCGCGCCAAGGCCAAGGCCAAGGCGCTCCGA
TCGCGACCCGAGGTCAGGCGGGATTACCCGCTGAGTTTAAGCATATCAAT
AAGCGGAGGA
S5
ATGCGATATTTGGTGTGAATTGCAGAATCCCGCGAACCATCGAGTCTTTG
AACGCAAGTTGCGCCCGAAGCCATTAGGCTGAGGGCACGTCTGCCTGG
GCGTCTCACGTTGCGTCGCCCGCGCCCCCTCCCCCGCGAAGGGAAGAA
GGGCTGCAGGCGGATGCTGGCCCCCCGCGCGCGGTCTGACCAAAAACG
AGTCCCCCGCGACGGACGACGCGTCGCGACGAGTGGTGGTTGACAAAC
CGTTGCGTCGCCTCGCGCGCGTCCGCGCCGTTTCGGGAGGCCTGTCGTG
ACGCCATCGCGCCGCCAAGGCCTAGGCCAAGGCCAAGGCGCTCCGATC
GCGACCCCAGGTCAGGCGGGATTACCCGCTGAGTTTAAGCATATCAATA
AGCAGAGGA
Bài làm
Bước 1: Vào Notepad

Bước 2: Vào ClustalX

Bước 3: Vào Gendoc để so sánh trình tự nucleotide của các đoạn ADN như bên
dưới (S1, S2, S3, S4 và S5)

Bước 4: Lập sơ đồ cây di truyền bằng gendoc
Sau khi ra được kết quả như trên, ta sử dụng Gendoc để tạo cây di truyền:
Tree->Manage Expression->Import->Chọn file của gen ở dạng “.ph” bằng cách lưu
file trên ClustalX với “Draw tree”->OK->Phylogenetic View.
Kết quả:

Bài 4. Anh (chị) hãy sử dụng các phần mềm đã học để xử lý trình tự nucleotide từ
phổ giải trình tự sau (File phổ trình tự gửi kèm).
Thông tin bổ sung:
 Trình tự đọc theo chiều xuôi : Tên File PMYB-F
 Trình tự đọc theo chiều ngược : Tên File PMYB-R
 Primer F: ataatggggaggcaaccgtgctgtgacaaa
Primer R: gcggctcacaattcatcgtcatcaagaaaggg
Bài làm
Từ file PMYB-F ta vào Edit/Copy Fasta Formatted rồi Paste sang word ta được
trình tự F:
>2259053_PMYB_DN1_PMYBF
5’TGGATTGTTGCCCACGTTTGTGGGACAGCAGTAGGTAAGACACGACA
AACATAGGTGAATTTTATCACCCTGCATGGCCATGGATGCTGGCGCGAAG
TACCCAAACTTGCTGGTCTGCTTAGATGTGGCAAGAGCTGTAGATTGCG
CTGGACAAATTACTTGCGCCCAGATTTGAAGCGTGGATTATTGTCTGAAT
CAGAAGAGAAGCTCATCATTGATCTACATGCTGCCATAGGGAATAGGTG
GTCACGAATCGCTGCGCAATTGCCAGGGAGAACTGATAACGAGATCAAG
AATTACTGGAACACGAGGATCAAGAAGAAACTGCGCCAGATGGGAATC
GATCCTGTGACCCACAAGCCTCTCACCCAAATGCAAATGCAGAGCACCC
CTGCGCAGACTCTGCTGCTGCAAGAAAATGATACAGAGCAGAAGCAGC
AGGAGCAACATAATGAGCCTGATCCTGATCAGAATCAGAGCAGCAATGG
CACTGTGGAGACATTGGTCTCGAGGGCGAGAGAACCCCACGACGACAT
AGAGCCTCTGCAGAATTTCAACATGGAGGATTCGAATTTTAACATGGAG
GATTCGATGCAATTGTTCGATGTCTGCTCGCCCACCAGCGGGATAAGCCT
GTCTGGGAGAACCGAGGAGGTCGATTCAGATGATTCTGATCAGGTCTCC
AAGAGCTTCGGCAATGGCAGCAGTACCCATTCTCAGTACATTGGGCGAG
AAAGCTCTGGTGTCGAGGCCGAATGTGGTTTGTCTGGTTGGGATCAGAT
GGCTGGCGTTTTGGGCGATCCCCTTTCTGAGTGGAATGTCGATTTGGAGT
CCTGGGCTGCTGGATTGGATGCCCCTGCAGCCTCTGCCTCTGCATGGATT
CAGCAGCTCCCTGACTGCCAATGGAACGACTTCCAGGGCGATTTTGAGA

TCTGCAGCAGCAAGTCATGTCCGGAGACTCTGCAGAGACTGGGGCCCTT
TCTTGATGACGATGATTTTGGGGACCCCAAAATTTTTTAT3’

Từ file PMYB-R ta vào View/ Reverse complement để đảo chiều và bổ xung trình
tự sau đó vào Edit/Copy Fasta Formatted rồi Paste sang word ta được trình tự R :

>2259054_PMYB_DN1_PMYBR
5’AAAAAAAAAAATTTTTAATGGGGGGGGGCACCGTGCTGTGACAAAGT
GGGATTGAAGAAGGGTCCATGGACTGCAGAGGAAGACAGAAAACTGGT
GAATTTTATCACCCTGCATGGCCATGGATGCTGGCGCGAAGTACCCAAAC
TTGCTGGTCTGCTTAGATGTGGCAAGAGCTGTAGATTGCGCTGGACAAA
TTACTTGCGCCCAGATTTGAAGCGTGGATTATTGTCTGAATCAGAAGAGA
AGCTCATCATTGATCTACATGCTGCCATAGGGAATAGGTGGTCACGAATC
GCTGCGCAATTGCCAGGGAGAACTGATAACGAGATCAAGAATTACTGGA
ACACGAGGATCAAGAAGAAACTGCGCCAGATGGGAATCGATCCTGTGA
CCCACAAGCCTCTCACCCAAATGCAAATGCAGAGCACCCCTGCGCAGA
CTCTGCTGCTGCAAGAAAATGATACAGAGCAGAAGCAGCAGGAGCAAC
ATAATGAGCCTGATCCTGATCAGAATCAGAGCAGCAATGGCACTGTGGA
GACATTGGTCTCGAGGGCGAGAGAACCCCACGACGACATAGAGCCTCT
GCAGAATTTCAACATGGAGGATTCGAATTTTAACATGGAGGATTCGATGC
AATTGTTCGATGTCTGCTCGCCCACCAGCGGGATAAGCCTGTCTGGGAG
AACCGAGGAGGTCGATTCAGATGATTCTGATCAGGTCTCCAAGAGCTTC
GGCAATGGCAGCAGTACCCATTCTCAGTACATTGGGCGAGAAAGCTCTG
GTGTCGAGGCCGAATGTGGTTTGTCTGGTTGGGATCAGATGGCTGGCGT
TTTGGGCGATCCCCTTTCTGAGTGGAATGTCGATTTGGAGTCCTGGGCTG
CTGGATTGGATGCCCCTGCAGCCTCTGCCTCTGCATGGATTCAGCAGCTC
CCTGACTGCCAATGGAACGACTTCCAGGGCGATTTTGAGATTTTTATCAG
CGAGTCCAGTCCGGAGACTAAAAAAAAAAATTTGGGG3’
Lấy một đoạn đầu 5’của R ghép với đoạn đầu 3’của F, thu được trình tự. Sau đó

dung phần mềm Find để tìm đoạn trùng nhau giữa 2 trình tự. (Đoạn màu xanh là
đoạn trùng nhau giữa 2 trình tự)

AAAAAAAAAAATTTTTAATGGGGGGGGGCACCGTGCTGTGACAA
AGTGGGATTGAAGAAGGGTCCATGGACTGCAGAGGAAGACAGAAAACT
GGTGAATTTTATCACCCTGCATGGCCATGGATGCTGGCGCGAAGTACCCA
AACTTGCTGGTCTGCTTAGATGTGGCAAGAGCTGTAGATTGCGCTGGAC
AAATTACTTGCGCCCAGATTTGAAGCGTGGATTATTGTCTGAATCAGAAG
AGAAGCTCATCATTGATCTACATGCTGCCATAGGGAATAGGTGGTCACGA
ATCGCTGCGCAATTGCCAGGGAGAACTGATAACGAGATCAAGAATTACT
GGAACACGAGGATCAAGAAGAAACTGCGCCAGATGGGAATCGATCCTG
TGACCCACAAGCCTCTCACCCAAATGCAAATGCAGAGCACCCCTGCGCA
GACTCTGCTGCTGCAAGAAAATGATACAGAGCAGAAGCAGCAGGAGCA
ACATAATGAGCCTGATCCTGATCAGAATCAGAGCAGCAATGGCACTGTG
GAGACATTGGTCTCGAGGGCGAGAGAACCCCACGACGACATAGAGCCT
CTGCAGAATTTCAACATGGAGGATTCGAATTTTAACATGGAGGATTCGAT
GCAATTGTTCGATGTCTGCTCGCCCACCAGCGGGATAAGCCTGTCTGGG
AGAACCGAGGAGGTCGATTCAGATGATTCTGATCAGGTCTCCAAGAGCT
TCGGCAATGGCAGCAGTACCCATTCTCAGTACATTGGGCGAGAAAGCTC
TGGTGTCGAGGCCGAATGTGGTTTGTCTGGTTGGGATCTCAAGAATTACT
GGAACACGAGGATCAAGAAGAAACTGCGCCAGATGGGAATCGATCCTG
TGACCCACAAGCCTCTCACCCAAATGCAAATGCAGAGCACCCCTGCGCA
GACTCTGCTGCTGCAAGAAAATGATACAGAGCAGAAGCAGCAGGAGCA
ACATAATGAGCCTGATCCTGATCAGAATCAGAGCAGCAATGGCACTGTG
GAGACATTGGTCTCGAGGGCGAGAGAACCCCACGACGACATAGAGCCT
CTGCAGAATTTCAACATGGAGGATTCGAATTTTAACATGGAGGATTCGAT
GCAATTGTTCGATGTCTGCTCGCCCACCAGCGGGATAAGCCTGTCTGGG
AGAACCGAGGAGGTCGATTCAGATGATTCTGATCAGGTCTCCAAGAGCT
TCGGCAATGGCAGCAGTACCCATTCTCAGTACATTGGGCGAGAAAGCTC

TGGTGTCGAGGCCGAATGTGGTTTGTCTGGTTGGGATCAGATGGCTGGC

GTTTTGGGCGATCCCCTTTCTGAGTGGAATGTCGATTTGGAGTCCTGGGC
TGCTGGATTGGATGCCCCTGCAGCCTCTGCCTCTGCATGGATTCAGCAGC
TCCCTGACTGCCAATGGAACGACTTCCAGGGCGATTTTGAGATCTGCAG
CAGCAAGTCATGTCCGGAGACTCTGCAGAGACTGGGGCCCTTTCTTGAT
GACGATGATTTTGGGGACCCCAAAATTTTTTAT
 Loại bỏ phần nu bị trùng trên R cho đến các nu trước trình tự đó trên F, là
đoạn nền đen ta được trình tự đầy đủ sau:

5’AAAAAAAAAAATTTTTAATGGGGGGGGGCACCGTGCTGTGACA
AAGTGGGATTGAAGAAGGGTCCATGGACTGCAGAGGAAGACAGAAAA
CTGGTGAATTTTATCACCCTGCATGGCCATGGATGCTGGCGCGAAGTACC
CAAACTTGCTGGTCTGCTTAGATGTGGCAAGAGCTGTAGATTGCGCTGG
ACAAATTACTTGCGCCCAGATTTGAAGCGTGGATTATTGTCTGAATCAGA
AGAGAAGCTCATCATTGATCTACATGCTGCCATAGGGAATAGGTGGTCAC
GAATCGCTGCGCAATTGCCAGGGAGAACTGATAACGAGATCAAGAATTA
CTGGAACACGAGGATCAAGAAGAAACTGCGCCAGATGGGAATCGATCC
TGTGACCCACAAGCCTCTCACCCAAATGCAAATGCAGAGCACCCCTGCG
CAGACTCTGCTGCTGCAAGAAAATGATACAGAGCAGAAGCAGCAGGAG
CAACATAATGAGCCTGATCCTGATCAGAATCAGAGCAGCAATGGCACTG
TGGAGACATTGGTCTCGAGGGCGAGAGAACCCCACGACGACATAGAGC
CTCTGCAGAATTTCAACATGGAGGATTCGAATTTTAACATGGAGGATTCG
ATGCAATTGTTCGATGTCTGCTCGCCCACCAGCGGGATAAGCCTGTCTGG
GAGAACCGAGGAGGTCGATTCAGATGATTCTGATCAGGTCTCCAAGAGC
TTCGGCAATGGCAGCAGTACCCATTCTCAGTACATTGGGCGAGAAAGCT
CTGGTGTCGAGGCCGAATGTGGTTTGTCTGGTTGGGATCAGATGGCTGG
CGTTTTGGGCGATCCCCTTTCTGAGTGGAATGTCGATTTGGAGTCCTGGG

CTGCTGGATTGGATGCCCCTGCAGCCTCTGCCTCTGCATGGATTCAGCAG
CTCCCTGACTGCCAATGGAACGACTTCCAGGGCGATTTTGAGATCTGCA
GCAGCAAGTCATGTCCGGAGACTCTGCAGAGACTGGGGCCCTTTCTTGA
TGACGATGATTTTGGGGACCCCAAAATTTTTTAT3’
 Ghép mồi:
-Mồi xuôi F: ATAATGGGGAGGCAACCGTGCTGTGACAAA
Chọn vài nu cuối (chữ đỏ), dùng công cụ tìm kiếm Find để tìm trình tự này
trên đoạn đầu của trình tự đã ghép rồi xóa bỏ đoạn thích hợp để thu được trình tự
hoàn chỉnh.

- Mồi ngược R: GCGGCTCACAATTCATCGTCATCAAGAAAGGG
Đảo chiều bổ sung, được trình tự mới, lấy khoảng 6 nu đầu ( tô nền vàng) để tìm
kiếm trên đoạn cuối của trình tự đã ghép rồi xóa bỏ đoạn thừa ta thu được trình tự
hoàn chỉnh
+ Mồi ngược đã đảo chiều và bổ sung có trình tự :
CCCTTTCTTGATGACGATGAATTGTGAGCCGC
Tiếp sau tìm đoạn CTGTGACAAA và CCCTTT để thực hiện ghép mồi ta nhấn
Ctrl + F để tìm
Xóa bỏ đoạn thích hợp và ghép mồi ta thu được trình tự hoàn chỉnh
5’ATAATGGGGAGGCAACCGTGCTGTGACAAAGTGGGATTGAAGAAGGG
TCCATGGACTGCAGAGGAAGACAGAAAACTGGTGAATTTTATCACCCTG
CATGGCCATGGATGCTGGCGCGAAGTACCCAAACTTGCTGGTCTGCTTA
GATGTGGCAAGAGCTGTAGATTGCGCTGGACAAATTACTTGCGCCCAGA
TTTGAAGCGTGGATTATTGTCTGAATCAGAAGAGAAGCTCATCATTGATC
TACATGCTGCCATAGGGAATAGGTGGTCACGAATCGCTGCGCAATTGCCA
GGGAGAACTGATAACGAGATCAAGAATTACTGGAACACGAGGATCAAG
AAGAAACTGCGCCAGATGGGAATCGATCCTGTGACCCACAAGCCTCTCA
CCCAAATGCAAATGCAGAGCACCCCTGCGCAGACTCTGCTGCTGCAAG
AAAATGATACAGAGCAGAAGCAGCAGGAGCAACATAATGAGCCTGATC

CTGATCAGAATCAGAGCAGCAATGGCACTGTGGAGACATTGGTCTCGAG

GGCGAGAGAACCCCACGACGACATAGAGCCTCTGCAGAATTTCAACATG
GAGGATTCGAATTTTAACATGGAGGATTCGATGCAATTGTTCGATGTCTG
CTCGCCCACCAGCGGGATAAGCCTGTCTGGGAGAACCGAGGAGGTCGA
TTCAGATGATTCTGATCAGGTCTCCAAGAGCTTCGGCAATGGCAGCAGT
ACCCATTCTCAGTACATTGGGCGAGAAAGCTCTGGTGTCGAGGCCGAAT
GTGGTTTGTCTGGTTGGGATCAGATGGCTGGCGTTTTGGGCGATCCCCTT
TCTGAGTGGAATGTCGATTTGGAGTCCTGGGCTGCTGGATTGGATGCCC
CTGCAGCCTCTGCCTCTGCATGGATTCAGCAGCTCCCTGACTGCCAATG
GAACGACTTCCAGGGCGATTTTGAGATCTGCAGCAGCAAGTCATGTCCG
GAGACTCTGCAGAGACTGGGGCCCTTTCTTGATGACGATGAATTGTGAG
CCGC3’
So sánh trình tự nucleotide của đoạn vừa phân tích với ngân hàng NCBI :

Pinus taeda R2R3-MYB transcription factor (MYB1) mRNA, complete cds

Sequence ID: AY356372.1Length: 1023Number of Matches: 1
Related Information
UniGene-clustered expressed sequence tags
Range 1: 1 to 1023GenBankGraphicsNext MatchPrevious Match
Alignment statistics for match #1

Score

Expect

Identities

Gaps

Strand

1829 bits(990)

0.0

1012/1023(99%)

0/1023(0%)

Plus/Plus

Query

4

ATGGGGAGGCAACCGTGCTGTGACAAAGTGGGATTGAAGAAGGGTCCATGGACTGCAGAG

63

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct

1

ATGGGGAGGCAACCGTGCTGTGACAAAGTGGGATTGAAGAAGGGTCCATGGACTGCAGAG

60

Query

64

GAAGACAGAAAACTGGTGAATTTTATCACCCTGCATGGCCATGGATGCTGGCGCGAAGTA

123

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct

61

GAAGACAGAAAACTGGTGAATTTTATCACCCTGCATGGCCATGGATGCTGGCGCGAAGTA

120

Query

124

CCCAAACTTGCTGGTCTGCTTAGATGTGGCAAGAGCTGTAGATTGCGCTGGACAAATTAC

183

||||||||||||||||||||||||||||||||||| ||||||||||| ||||||||||||
Sbjct

121

CCCAAACTTGCTGGTCTGCTTAGATGTGGCAAGAGTTGTAGATTGCGTTGGACAAATTAC

180

Query

184

TTGCGCCCAGATTTGAAGCGTGGATTATTGTCTGAATCAGAAGAGAAGCTCATCATTGAT

243

|||||||| |||||||||||||||||||||||||||||||| ||||||||||||||||||
Sbjct

181

TTGCGCCCGGATTTGAAGCGTGGATTATTGTCTGAATCAGAGGAGAAGCTCATCATTGAT

240

Query

244

CTACATGCTGCCATAGGGAATAGGTGGTCACGAATCGCTGCGCAATTGCCAGGGAGAACT

303

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct

241

CTACATGCTGCCATAGGGAATAGGTGGTCACGAATCGCTGCGCAATTGCCAGGGAGAACT

300

Query

304

GATAACGAGATCAAGAATTACTGGAACACGAGGATCAAGAAGAAACTGCGCCAGATGGGA

363

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct

301

GATAACGAGATCAAGAATTACTGGAACACGAGGATCAAGAAGAAACTGCGCCAGATGGGA

360

Query

364

ATCGATCCTGTGACCCACAAGCCTCTCACCCAAATGCAAATGCAGAGCACCCCTGCGCAG

423

|||||||||||||||||||||||||||||||||||||||||||||||||||||||| |||
Sbjct

361

ATCGATCCTGTGACCCACAAGCCTCTCACCCAAATGCAAATGCAGAGCACCCCTGCCCAG

420

Query

424

ACTCTGCTGCTGCAAGAAAATGATACAGAGCAGAAGCAGCAGGAGCAACATAATGAGCCT

483

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||

Sbjct

421

ACTCTGCTGCTGCAAGAAAATGATACAGAGCAGAAGCAGCAGGAGCAACATAATGAGCCT

480

Query

484

GATCCTGATCAGAATCAGAGCAGCAATGGCACTGTGGAGACATTGGTCTCGAGGGCGAGA

543

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct

481

GATCCTGATCAGAATCAGAGCAGCAATGGCACTGTGGAGACATTGGTCTCGAGGGCGAGA

540

Query

544

GAACCCCACGACGACATAGAGCCTCTGCAGAATTTCAACATGGAGGATTCGAATTTTAAC

603

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct

541

GAACCCCACGACGACATAGAGCCTCTGCAGAATTTCAACATGGAGGATTCGAATTTTAAC

600

Query

604

ATGGAGGATTCGATGCAATTGTTCGATGTCTGCTCGCCCACCAGCGGGATAAGCCTGTCT

663

|||||||||||||||||||||||| ||||||| |||||||||||||||||||||||||||
Sbjct

601

ATGGAGGATTCGATGCAATTGTTCAATGTCTGTTCGCCCACCAGCGGGATAAGCCTGTCT

660

Query

664

GGGAGAACCGAGGAGGTCGATTCAGATGATTCTGATCAGGTCTCCAAGAGCTTCGGCAAT

723

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct

661

GGGAGAACCGAGGAGGTCGATTCAGATGATTCTGATCAGGTCTCCAAGAGCTTCGGCAAT

720

Query

724

GGCAGCAGTACCCATTCTCAGTACATTGGGCGAGAAAGCTCTGGTGTCGAGGCCGAATGT

783

|||||||||||||||||||||||||||||||||||||||||||||||| |||||||||||
Sbjct

721

GGCAGCAGTACCCATTCTCAGTACATTGGGCGAGAAAGCTCTGGTGTCAAGGCCGAATGT

780

Query

784

GGTTTGTCTGGTTGGGATCAGATGGCTGGCGTTTTGGGCGATCCCCTTTCTGAGTGGAAT

843

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct

781

GGTTTGTCTGGTTGGGATCAGATGGCTGGCGTTTTGGGCGATCCCCTTTCTGAGTGGAAT

840

Query

844

GTCGATTTGGAGTCCTGGGCTGCTGGATTGGATGCCCCTGCAGCCTCTGCCTCTGCATGG

903

|||||||||||||||||||||||||||||||||||| |||| ||||||||||||||||||
Sbjct

841

GTCGATTTGGAGTCCTGGGCTGCTGGATTGGATGCCACTGCGGCCTCTGCCTCTGCATGG

900

Query

904

ATTCAGCAGCTCCCTGACTGCCAATGGAACGACTTCCAGGGCGATTTTGAGATCTGCAGC

963

|||||||||||||||||||||||||||||||||||||| |||||||||||||||||||||
Sbjct

901

ATTCAGCAGCTCCCTGACTGCCAATGGAACGACTTCCAAGGCGATTTTGAGATCTGCAGC

960

Query

964

AGCAAGTCATGTCCGGAGACTCTGCAGAGACTGGGGCCCTTTCTTGATGACGATGAATTG

1023

||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct

961

AGCAAGTCATGTCCGGAGACTCTGCAGAGACTGGGGCCCTTTCTTGATGACGATGAATTG

Query

1024

TGA
|||

1026

1020

Sbjct

1021

TGA

1023

- Kết luận: Có 11 điểm không tương đồng.
- Xác định lý do sai khác: Copy đoạn gen gần điểm sai khác và tìm trong Bioedit
sequence sau 3 lần kiểm tra đều thấy chỗ sai khác phân rõ ràng => sai khác do đột
biến.

báo cáo môn tin sinh

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về