Bài 1. Anh (chị) hãy sử dụng công cụ tìm kiếm trên internet để tìm 01 gen liên
quan đến khả năng kháng sâu của cây trồng (trong Ngân hàng gen Quốc tế
NCBI - Copy toàn bộ thông tin và trình tự nucleotide của gen đó để đưa vào Báo
cáo).
Trả lời
Zea mays cultivar B73 chromosome 6, B73
RefGen_v4, whole genome shotgun sequence
NCBI Reference Sequence: NC_024464.2
FASTA Graphics
Go to:
LOCUS
NC_024464
1864 bp DNA linear CON 20-MAR-2017
DEFINITION Zea mays cultivar B73 chromosome 6, B73 RefGen_v4, whole
genome
shotgun sequence.
ACCESSION NC_024464 REGION: complement(91511985..91513848)
GPC_000002840
VERSION NC_024464.2
DBLINK BioProject: PRJNA249074
BioSample: SAMN04296295
Assembly: GCF_000005005.2
KEYWORDS WGS; RefSeq.
SOURCE
Zea mays
ORGANISM Zea mays
Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta;
Spermatophyta; Magnoliophyta; Liliopsida; Poales; Poaceae; PACMAD
clade; Panicoideae; Andropogonodae; Andropogoneae; Tripsacinae;
Zea.
COMMENT REFSEQ INFORMATION: The reference sequence is identical to
CM000782.4.
On Mar 20, 2017 this sequence version replaced gi:662248888.
Assembly name: B73 RefGen_v4
The genomic sequence for this RefSeq record is from the
whole-genome assembly released by the maizesequence on 2017/02/07.
The original whole-genome shotgun project has the accession
LPUQ00000000.1.
##Genome-Assembly-Data-START##
Assembly Provider
:: Genome Center, Washington University
School of Medicine, USA, St. Louis
Assembly Method
:: Celera Assembler v. CA 8.3rc2
Assembly Name
:: B73 RefGen_v4
Long Assembly Name :: B73 RefGen_v4 Zm00001d
Genome Representation :: Full
Expected Final Version :: Yes
Genome Coverage
:: 65.0x
Sequencing Technology :: PacBio
##Genome-Assembly-Data-END##
##Genome-Annotation-Data-START##
Annotation Provider
:: NCBI
Annotation Status
:: Full annotation
Annotation Version
:: Zea mays Annotation Release 101
Annotation Pipeline
:: NCBI eukaryotic genome annotation
pipeline
Annotation Software Version :: 7.3
Annotation Method
:: Best-placed RefSeq; Gnomon
Features Annotated
:: Gene; mRNA; CDS; ncRNA
##Genome-Annotation-Data-END##
FEATURES
Location/Qualifiers
source
1..1864
/organism="Zea mays"
/mol_type="genomic DNA"
/cultivar="B73"
/db_xref="taxon:4577"
/chromosome="6"
/tissue_type="seedling"
/country="USA"
gene
<1..1864
/gene="mir1"
/gene_synonym="CL872_-2; CL872_-2_ov; GRMZM2G150276"
/note="maize insect resistance 1; Derived by automated
computational analysis using gene prediction method:
BestRefSeq."
/db_xref="GeneID:542561"
mRNA
join(1..>567,706..938,1068..1211,1363..1864)
/gene="mir1"
/gene_synonym="CL872_-2; CL872_-2_ov; GRMZM2G150276"
CDS
/product="maize insect resistance 1"
/inference="similar to RNA sequence, mRNA (same
species):RefSeq:NM_001112101.1"
/exception="annotated by transcript or proteomic data"
/note="The RefSeq transcript has 24 substitutions, 6
non-frameshifting indels and aligns at 97% coverage
compared to this genomic sequence; Derived by automated
computational analysis using gene prediction method:
BestRefSeq."
/transcript_id="NM_001112101.1"
/db_xref="GeneID:542561"
join(18..567,706..938,1068..1211,1363..1656)
/gene="mir1"
/gene_synonym="CL872_-2; CL872_-2_ov; GRMZM2G150276"
/inference="similar to AA sequence (same
species):RefSeq:NP_001105571.1"
/exception="annotated by transcript or proteomic data"
/note="The RefSeq protein has 13 substitutions, 6
non-frameshifting indels and aligns at 99% coverage
compared to this genomic sequence; Derived by automated
computational analysis using gene prediction method:
BestRefSeq."
/codon_start=1
/product="maize insect resistance 1 precursor"
/protein_id="NP_001105571.1"
/db_xref="GeneID:542561"
/translation="MRPTRSAVSATALLLLAVALALAATAAARHSYTTTTTRVPAPAE
RADEEVRRMYEAWKSKHGRGGSSNDDCDMAPGDDEQEEEDRRLRLEVFRDNLRYIDA
H
NAEADAGLHTFRLGLTPFADLTLEEYRGRVLGFRARGRRSGARYGSGYSVRGGDLPDA
IDWRQLGAVTEVKDQQQCGGCWAFSAVAAIEGVNAIATGNLVSLSEQEIIDCDAQDSG
CDGGQMENAFRFVIGNGGIDTEADYPFIGTDGTCDASKEKNEKVATIDGLVEVASNNE
TALQEAVAIQPVSVAIDASGRAFQHYSSGIFNGPCGTSLDHGVTAVGYGSESGKDYWI
VKNSWSASWGEAGYIRMRRNVPRPTGKCGIAMDASYPVKDTYHPGTGTATARAAAMD
V
IKMVLA"
Origin
TCCCATCATCTCTCGCCATGCGCCCAACACGCTCCCCTGTGCCGGCTACG
GCGCTGCTCCTGCTTGCCGTGGCACTGGCACTGGCCGCCACGGCGGCG
GCCCGCCACTTCTACACCACCACCACCACCACCCGCGTCCCGGCGCCAG
CGGAGCGGGCGGACGAGGAGGTAAGGCGCATGTACGAGGCGTGGAAGT
CGAAGCACGGGCGCGGCGGCAGCAGCAACGACGACTGCGACATGGCG
CCCGGCGATGATGAGCAGGAGGAGGACCGCCGGCTGCGGCTGGAGGTG
TTCCGCGACAACCTTCGGTACATCGACAAGCACAACGCGGAGGCGGAC
GCTGGGCTCCACACCTTCCGCCTCGGCCTCACCCCCTTCGCCGACCTCA
CCCTGGACGAGTACCGCGGCCGCGTCCTCGGATTCCGCGCCCGCGCCCG
CCGCAGCGGCGCCCGCTACGGCCACGGCCACGGCTACCGCGCCCGTCC
CCGCGGCGGCGACCTCCTCCCCGACGCCATCGACTGGCGCCAGCTTGGC
GCCGTCACCGAGGTCAAGGACCAGCAACAGTGCGGTCCGTAGCATATAT
ACTCCGACCCATAGCGCGCCGTACTCTTACATATGTGTGCGTGCTCTCCG
GCGAGAAGCTTGTTGCGGCTACTTATCTGATGACGATCTCTGTGGGGGG
CATGCAATGCATGCATGCTTGCAGGTGGGTGCTGGGCGTTCTCGGCGGT
GGCGGCCATCGAGGGGATCAACGCGATCGCGACGGGTAAC
CTGGTGTCGCTGTCGGAGCAGGAGATCATCGACTGCGACGCCCAGGAC
AGCGGCTGCGACGGCGGGCAGATGGAGAACGCGTTCCGGTTCGTCATC
GGCAACGGCGGGATCGACACCGAGGCCGACTACCCCTTCATCGGAACC
GACGGCACTTGTGACGCCAGCAAGGTCGGTATGGGTGCTGGCGTGCTGC
TGCTTTTGCTTCGTCGATCGATGGATGGATGATGCGGTAGTACTGCTGCT
AATATAACGGAGAGATCGATATGACTGTGTGTGTACGTGTTCAATTCAAT
GCAGGAGAACAACGAGAAGGTCGCCACCATAGATGGGTTGGTGGAGGT
GGCGAGCAACAACGAGACGGCGCTGCAGGAGGCGGTGGCGATCCAGC
CCGTCAGTGTCGCCATCGACGCAAGCGGGCGTGCGTTCCAGCACTACAG
TTCGGTAAGCTAGCTAGCTAGCTAAGCATGCATGAGAATGAGATCCATCA
GACGACGACGACGACGACCGTCACAGATTTAGGAAGAACTAGCTAGCT
AGGTTCTGTGCGTGTCTGTCTGTGTGATGAACTGTTGTAGTATGCACTAT
AATGCAGGGCATCTTCAACGGGCCATGCGGGACGAGCCTGGACCACGG
CGTCACGGCGGTGGGCTACGGCAGCGAGAGCGGCAAGGACTACTGGAT
CGTGAAGAACTCGTGGAGCGCCAGCTGGGGCGAGGCCGGCTACATCCG
CATGAGGCGCAACGTGCCCCGGCCCACGGGCAAGTGCGGCATCGCCAT
GGACGCGTCCTACCCTGTGAAGGACACCTACCACGACCCCGGCACCGG
CACCGGCACCGCCACGGCTACGGCAGCTGCCATGGATGTGATCAAGATG
GTTCTTGCTTAGGAGGGAGCGAGCGGAGCAGGCAGCAGAGAGCCGATG
GTCTTGTCGTGTTGAACTTTACATATGGTAGCTAGGTACCACTGGGGATA
ATTAAGTTAATCCGTTATGGTGTGGCAAGTTAATTAATATGTGCGTATCTC
TTTTGATGAGTGCCATATATGATGTAATGAAGTTACATAAACTCAAATAAA
GTCGTAATCGTAATGGTAAA
Bài 2. Anh (chị) hãy sử dụng các phần mềm đã học để thiết kế cặp mồi đặc hiệu
cho nhân gen mà các Anh (chị) tìm được ở trên. Ghi chú : Ở cả mồi xuôi và mồi
ngược đều gắn điểm cắt của enzyme giới hạn phù hợp, tính toán các thông số của
mồi như: số nucleotide, Tm, tỷ lệ % GC.
Trả lời
Origin
TCCCATCATCTCTCGCCATGCGCCCAACACGCTCCCCTGTGCCGGCTACG
GCGCTGCTCCTGCTTGCCGTGGCACTGGCACTGGCCGCCACGGCGGGG
CCCGCCACTTCTACACCACCACCACCACCACCCGCGTCCCGGCGCCAGC
GGAGCGGGCGGACGAGGAGGTAAGGCGCATGTACGAGGCGTGGAAGTC
GAAGCACGGGCGCGGCGGCAGCAGCAACGACGACTGCGACATGGCGC
CCGGCGATGATGAGCAGGAGGAGGACCGCCGGCTGCGGCTGGAGGTGT
TCCGCGACAACCTTCGGTACATCGACAAGCACAACGCGGAGGCGACGC
TGGGCTCCACACCTTCCGCCTCGGCCTCACCCCCTTCGCCGACCTCACC
CTGGACGAGTACCGCGGCCGCGTCCTCGGATTCCGCGCCCGCGCCCGCC
GCAGCGGCGCCCGCTACGGCCACGGCCACGGCTACCGCGCCCGTCCCC
GCGGCGGCGACCTCCTCCCCGACGCCATCGACTGGCGCCAGCTTGGCGC
CGTCACCGAGGTCAAGGACCAGCAACAGTGCGGTCCGTAGCATATATAC
TCCGACCCATAGCGCGCCGTACTCTTACATATGTGTGCGTGCTCTCCGGC
GAGAAGCTTGTTGCGGCTACTTATCTGATGACGATCTCTGTGGGGGGCAT
GCAATGCATGCATGCTTGCAGGTGGGTGCTGGGCGTTCTCGGCGGTGGC
GGCCATCGAGGGGATCAACGCGATCGCGACGGGTAACCTGGTGTCGCTG
TCGGAGCAGGAGATCATCGACTGCGACGCCCAGGACAGCGGCTGCGAC
GGCGGGCAGATGGAGAACGCGTTCCGGTTCGTCATCGGCAACGGCGGG
ATCGACACCGAGGCCGACTACCCCTTCATCGGAACCGACGGCACTTGTG
ACGCCAGCAAGGTCGGTATGGGTGCTGGCGTGCTGCTGCTTTTGCTTCG
TCGATCGATGGATGGATGATGCGGTAGTACTGCTGCTAATATAACGGAGA
GATCGATATGACTGTGTGTGTACGTGTTCAATTCAATGCAGGAGAACAAC
GAGAAGGTCGCCACCATAGATGGGTTGGTGGAGGTGGCGAGCAACAAC
GAGACGGCGCTGCAGGAGGCGGTGGCGATCCAGCCCGTCAGTGTCGCC
ATCGACGCAAGCGGGCGTGCGTTCCAGCACTACAGTTCGGTAAGCTAGC
TAGCTAGCTAAGCATGCATGAGAATGAGATCCATCAGACGACGACGACG
ACGACCGTCACAGATTTAGGAAGAACTAGCTAGCTAGGTTCTGTGCGTG
TCTGTCTGTGTGATGAACTGTTGTAGTATGCACTATAATGCAGGGCATCTT
CAACGGGCCATGCGGGACGAGCCTGGACCACGGCGTCACGGCGGTGGG
CTACGGCAGCGAGAGCGGCAAGGACTACTGGATCGTGAAGAACTCGTG
GAGCGCCAGCTGGGGCGAGGCCGGCTACATCCGCATGAGGCGCAACGT
GCCCCGGCCCACGGGCAAGTGCGGCATCGCCATGGACGCGTCCTACCCT
GTGAAGGACACCTACCACGACCCCGGCACCGGCACCGGCACCGCCACG
GCTACGGCAGCTGCCATGGATGTGATCAAGATGGTTCTTGCTTAGGAGG
GAGCGAGCGGAGCAGGCAGCAGAGAGCCGATGGTCTTGTCGTGTTGAA
CTTTACATATGGTAGCTAGGTACCACTGGGGATAATTAAGTTAATCCGTTA
TGGTGTGGCAAGTTAATTAATATGTGCGTATCTCTTTTGATGAGTGCCATA
TATGATGTAATGAAGTTACATAAACTCAAATAAAGTCGTAATCGTAATGG
TAAA
Thiết kế mồi xuôi :
Bước 1: Từ mã mở đầu kéo dài 15-20 nucleotide sau mã mở đầu
Bước 2 : Thêm 3 nucleotide trước mã mở đầu
Bước 3 : Thêm enzym cắt giới hạn trước 3 nucleotide
Bước 4 : Thêm 1 vài nucleotide trước điểm cắt enzym cắt giới hạn. copy trình tự
gen -> vào DNAclub kiểm tra và chọn enzym có trình tự cắt là 0 => enzym được
chọn có tên AluI (AGCT).
* Kết quả : Mồi xuôi : ATCAGCTCGCATGCGCCCAACACGCTCCCCTG
E. AluI
START
Tm=71%; GC% = 65; nt = 32
Thiết kế mồi ngược:
Bước 1: Từ mã kết thúc kéo dài 15-20 nucleotide trước mã kết thúc
Bước 2 : Thêm 3 nucleotide sau mã kết thúc
Bước 3 : Thêm enzym cắt giới hạn sau 3 nucleotide đó
Bước 4 : Thêm 1 vài nucleotide sau điểm cắt enzym cắt giới hạn. Copy trình tự gen
-> vào DNAclub kiểm tra và chọn enzym có trình tự cắt là 0 => enzym được chọn
có tên BssH II (GCGCGC).
Mồi chưa đảo chiều :
AGTGCCATATATGATGTAATGAGCTGCGCGCGCT
STOP
E. BssH II
Trình tự mồi :
AGTGCCATATATGATGTAATGAGCTGCGCGCGCT
Mồi đã đảo chiều và bổ sung:
CGCGCGCGCAGCTCATTACATCATATATGGCACT
Tm = 64; GC% = 52; nt = 34
Điều chỉnh thông số 2 mồi giống nhau :
Mồi xuôi: ATCAGCTCGCATGCGCCCAACACGCTCCCCTG ( thêm 4 nu AT)
=> ATCAGCTCGCATGCGCCCAACACGCTCCCCTGATAT
Được: Tm = 70; GC% = 58; nt = 36
Mồi ngược: CGCGCGCGCAGCTCATTACATCATATATGGCACT (thêm 4 nu
GC vào cuối) => CGCGCGCGCAGCTCATTACATCATATATGGCACTGCGC.
Được: Tm = 68; GC% = 57; nt = 38
Thông số
Tm in PCR (C)
GC Content (%)
Primer length (nt)
Mồi xuôi
70
58
36
Nhận xét : tỉ lệ GC Content cả hai mồi đều >50%.
Tm in PCR của cả hai mồi gần sát nhau (>55).
Chiều dài của 2 mồi chênh lệch nhau là 2.
=> Đoạn mồi thiết kế được là hợp lý.
Mồi ngược
68
57
38
Bài 3: Anh (chị) hãy sử dụng các phần mềm đã học để so sánh trình tự nucleotide
của các đoạn ADN như bên dưới (S1, S2, S3, S4 và S5).
Sử dụng công cụ tạo cây quan hệ di truyền (Tool/Tree) trong Ngân hàng dữ liệu
DNA Việt Nam (www.dnabank.vn) để tạo cây quan hệ di truyền giữa các mẫu (S1,
S2, S3, S4 và S5).
S1
ATGCGATACTTGCTGTGAATTGCAGAATCCCGCGAACCATCGAGTCTTTG
AACGCTAGTTGCGCCCGAAGCCATTAGGCTGAGGGCACGTCTGCCTGGG
CGTCTCACGTTGCGTCGCCCGCGCCCCCTCCCCCGCGAAGGGAAGAAG
GGCTGCGGACGGATGCTGGCCCCCCGCGCGCGGTCGGCCCAAAAACGA
GTCCCCCGCGACGGACGACGCGTCGCGACGAGTGGTGGTTGACAAACC
GTTGCGTCGCCTCGCGCGCGTCCGCGCCGTCTCGGGAGGCCTGTCGTGA
GCCCATCGCGCCGCCAAGGCCAAGGCCAAGGCCAAGGCGCTCCGATCG
CGACCCCAGGTCAGGCGGGATTACCGGCTGAGTTTAAGCATATCAATAA
GCGGAGGA
S2
ATGCGATACTTGGTGTGAATTGGAGAATCCCGCGAACCATCGAGTCTTTG
AACGCAAGTTGCGCCCGAAGCCATTAGGCTGAGGGCACGTCTGCCTGG
GCGTCTCACGTTGCGTCGCCCGCGCCCCCTCCCCCGCGAAGGGAAGAA
GGGCTGCGGGCGGATGCTGGCCCCCCGCGCGCGGTCGGCCCAAAAACG
AGTCCCCCGCGACGGACGACGCGTCGCGACGAGTGGTGGTTGACAAAC
CGTTGCGTCGTCTCGCGCGCGTCCGCGCCGTCTCGGGAGGCCTGTCGTG
ACCCCATCGCGCCGCCAAGGCCAAGGCCAAGGCCAAGGCGCTCCGATC
GCGACCCCAGGTCAGGCGGGATTACCCGCTGAGTTTAAGCATATCAATA
AGCGGAGGA
S3
ATGCGATACTTAGTGTGAATTGCAGAATCCCGCGAACCATCGAGTCTTTG
AACGCAAGTTGCGCCCGAAGCCATTAGGTTGAGGGCACGTCTGCCTGG
GCGTCTCACGTTGCGTCGCCCGCGCCCCCCTCCCCCGCGAAGGGAAGA
AGGGCTGCGGGCGGATGCTGGGCCCCCGCGCGCGCCCGCGCACGGTCG
GCCCAAAAGCGAGTCCCCCGCGACGGACGACGCGTCGCGACGAGTGGT
GGTTGACAAACCGTTGCGTCGCCTCGCGCGCGTCCGCGCCGTCTCGGGA
GGCCTGTCGTGACCCCATCGCGCCAAGGCCAAGGCCAAGGCGCTGCGA
TCGCGACCCCAGGTCAGGCGGGATTACCCGCTGAGTTTAAGCATATCAAT
AAGCGGAGGA
S4
ATGCGATACTTGGTGTGAATTGCAGAATCCCGCGAACCATCGAGTCTTTG
AACGCAAGTTGCGCCCGAAGCCATTAGGTTGAGGGCACGTCTGCCTGG
GCGTCTCGCGTTGCGTCGCCCGCGCCCCCCTCCCCCGCGAAGGGAAGA
AGGGCTGCCGGCGGATGCTGGCCCCCCGCGCGCGCCCGCGCGCGGTCG
GCCCAAAAGCGAGTCCCCCGCGACGGACGACGCGTCGCGACGAGTGGT
GGTTGACAATCCGTTGCGTCGCCTCGCGCGCGTCCGCGCCGTCTCGGGA
GGCCTGTCGTGACCCCATCGCGCCAAGGCCAAGGCCAAGGCGCTCCGA
TCGCGACCCGAGGTCAGGCGGGATTACCCGCTGAGTTTAAGCATATCAAT
AAGCGGAGGA
S5
ATGCGATATTTGGTGTGAATTGCAGAATCCCGCGAACCATCGAGTCTTTG
AACGCAAGTTGCGCCCGAAGCCATTAGGCTGAGGGCACGTCTGCCTGG
GCGTCTCACGTTGCGTCGCCCGCGCCCCCTCCCCCGCGAAGGGAAGAA
GGGCTGCAGGCGGATGCTGGCCCCCCGCGCGCGGTCTGACCAAAAACG
AGTCCCCCGCGACGGACGACGCGTCGCGACGAGTGGTGGTTGACAAAC
CGTTGCGTCGCCTCGCGCGCGTCCGCGCCGTTTCGGGAGGCCTGTCGTG
ACGCCATCGCGCCGCCAAGGCCTAGGCCAAGGCCAAGGCGCTCCGATC
GCGACCCCAGGTCAGGCGGGATTACCCGCTGAGTTTAAGCATATCAATA
AGCAGAGGA
Bài làm
Bước 1: Vào Notepad
Bước 2: Vào ClustalX
Bước 3: Vào Gendoc để so sánh trình tự nucleotide của các đoạn ADN như bên
dưới (S1, S2, S3, S4 và S5)
Bước 4: Lập sơ đồ cây di truyền bằng gendoc
Sau khi ra được kết quả như trên, ta sử dụng Gendoc để tạo cây di truyền:
Tree->Manage Expression->Import->Chọn file của gen ở dạng “.ph” bằng cách lưu
file trên ClustalX với “Draw tree”->OK->Phylogenetic View.
Kết quả:
Bài 4. Anh (chị) hãy sử dụng các phần mềm đã học để xử lý trình tự nucleotide từ
phổ giải trình tự sau (File phổ trình tự gửi kèm).
Thông tin bổ sung:
Trình tự đọc theo chiều xuôi : Tên File PMYB-F
Trình tự đọc theo chiều ngược : Tên File PMYB-R
Primer F: ataatggggaggcaaccgtgctgtgacaaa
Primer R: gcggctcacaattcatcgtcatcaagaaaggg
Bài làm
Từ file PMYB-F ta vào Edit/Copy Fasta Formatted rồi Paste sang word ta được
trình tự F:
>2259053_PMYB_DN1_PMYBF
5’TGGATTGTTGCCCACGTTTGTGGGACAGCAGTAGGTAAGACACGACA
AACATAGGTGAATTTTATCACCCTGCATGGCCATGGATGCTGGCGCGAAG
TACCCAAACTTGCTGGTCTGCTTAGATGTGGCAAGAGCTGTAGATTGCG
CTGGACAAATTACTTGCGCCCAGATTTGAAGCGTGGATTATTGTCTGAAT
CAGAAGAGAAGCTCATCATTGATCTACATGCTGCCATAGGGAATAGGTG
GTCACGAATCGCTGCGCAATTGCCAGGGAGAACTGATAACGAGATCAAG
AATTACTGGAACACGAGGATCAAGAAGAAACTGCGCCAGATGGGAATC
GATCCTGTGACCCACAAGCCTCTCACCCAAATGCAAATGCAGAGCACCC
CTGCGCAGACTCTGCTGCTGCAAGAAAATGATACAGAGCAGAAGCAGC
AGGAGCAACATAATGAGCCTGATCCTGATCAGAATCAGAGCAGCAATGG
CACTGTGGAGACATTGGTCTCGAGGGCGAGAGAACCCCACGACGACAT
AGAGCCTCTGCAGAATTTCAACATGGAGGATTCGAATTTTAACATGGAG
GATTCGATGCAATTGTTCGATGTCTGCTCGCCCACCAGCGGGATAAGCCT
GTCTGGGAGAACCGAGGAGGTCGATTCAGATGATTCTGATCAGGTCTCC
AAGAGCTTCGGCAATGGCAGCAGTACCCATTCTCAGTACATTGGGCGAG
AAAGCTCTGGTGTCGAGGCCGAATGTGGTTTGTCTGGTTGGGATCAGAT
GGCTGGCGTTTTGGGCGATCCCCTTTCTGAGTGGAATGTCGATTTGGAGT
CCTGGGCTGCTGGATTGGATGCCCCTGCAGCCTCTGCCTCTGCATGGATT
CAGCAGCTCCCTGACTGCCAATGGAACGACTTCCAGGGCGATTTTGAGA
TCTGCAGCAGCAAGTCATGTCCGGAGACTCTGCAGAGACTGGGGCCCTT
TCTTGATGACGATGATTTTGGGGACCCCAAAATTTTTTAT3’
Từ file PMYB-R ta vào View/ Reverse complement để đảo chiều và bổ xung trình
tự sau đó vào Edit/Copy Fasta Formatted rồi Paste sang word ta được trình tự R :
>2259054_PMYB_DN1_PMYBR
5’AAAAAAAAAAATTTTTAATGGGGGGGGGCACCGTGCTGTGACAAAGT
GGGATTGAAGAAGGGTCCATGGACTGCAGAGGAAGACAGAAAACTGGT
GAATTTTATCACCCTGCATGGCCATGGATGCTGGCGCGAAGTACCCAAAC
TTGCTGGTCTGCTTAGATGTGGCAAGAGCTGTAGATTGCGCTGGACAAA
TTACTTGCGCCCAGATTTGAAGCGTGGATTATTGTCTGAATCAGAAGAGA
AGCTCATCATTGATCTACATGCTGCCATAGGGAATAGGTGGTCACGAATC
GCTGCGCAATTGCCAGGGAGAACTGATAACGAGATCAAGAATTACTGGA
ACACGAGGATCAAGAAGAAACTGCGCCAGATGGGAATCGATCCTGTGA
CCCACAAGCCTCTCACCCAAATGCAAATGCAGAGCACCCCTGCGCAGA
CTCTGCTGCTGCAAGAAAATGATACAGAGCAGAAGCAGCAGGAGCAAC
ATAATGAGCCTGATCCTGATCAGAATCAGAGCAGCAATGGCACTGTGGA
GACATTGGTCTCGAGGGCGAGAGAACCCCACGACGACATAGAGCCTCT
GCAGAATTTCAACATGGAGGATTCGAATTTTAACATGGAGGATTCGATGC
AATTGTTCGATGTCTGCTCGCCCACCAGCGGGATAAGCCTGTCTGGGAG
AACCGAGGAGGTCGATTCAGATGATTCTGATCAGGTCTCCAAGAGCTTC
GGCAATGGCAGCAGTACCCATTCTCAGTACATTGGGCGAGAAAGCTCTG
GTGTCGAGGCCGAATGTGGTTTGTCTGGTTGGGATCAGATGGCTGGCGT
TTTGGGCGATCCCCTTTCTGAGTGGAATGTCGATTTGGAGTCCTGGGCTG
CTGGATTGGATGCCCCTGCAGCCTCTGCCTCTGCATGGATTCAGCAGCTC
CCTGACTGCCAATGGAACGACTTCCAGGGCGATTTTGAGATTTTTATCAG
CGAGTCCAGTCCGGAGACTAAAAAAAAAAATTTGGGG3’
Lấy một đoạn đầu 5’của R ghép với đoạn đầu 3’của F, thu được trình tự. Sau đó
dung phần mềm Find để tìm đoạn trùng nhau giữa 2 trình tự. (Đoạn màu xanh là
đoạn trùng nhau giữa 2 trình tự)
AAAAAAAAAAATTTTTAATGGGGGGGGGCACCGTGCTGTGACAA
AGTGGGATTGAAGAAGGGTCCATGGACTGCAGAGGAAGACAGAAAACT
GGTGAATTTTATCACCCTGCATGGCCATGGATGCTGGCGCGAAGTACCCA
AACTTGCTGGTCTGCTTAGATGTGGCAAGAGCTGTAGATTGCGCTGGAC
AAATTACTTGCGCCCAGATTTGAAGCGTGGATTATTGTCTGAATCAGAAG
AGAAGCTCATCATTGATCTACATGCTGCCATAGGGAATAGGTGGTCACGA
ATCGCTGCGCAATTGCCAGGGAGAACTGATAACGAGATCAAGAATTACT
GGAACACGAGGATCAAGAAGAAACTGCGCCAGATGGGAATCGATCCTG
TGACCCACAAGCCTCTCACCCAAATGCAAATGCAGAGCACCCCTGCGCA
GACTCTGCTGCTGCAAGAAAATGATACAGAGCAGAAGCAGCAGGAGCA
ACATAATGAGCCTGATCCTGATCAGAATCAGAGCAGCAATGGCACTGTG
GAGACATTGGTCTCGAGGGCGAGAGAACCCCACGACGACATAGAGCCT
CTGCAGAATTTCAACATGGAGGATTCGAATTTTAACATGGAGGATTCGAT
GCAATTGTTCGATGTCTGCTCGCCCACCAGCGGGATAAGCCTGTCTGGG
AGAACCGAGGAGGTCGATTCAGATGATTCTGATCAGGTCTCCAAGAGCT
TCGGCAATGGCAGCAGTACCCATTCTCAGTACATTGGGCGAGAAAGCTC
TGGTGTCGAGGCCGAATGTGGTTTGTCTGGTTGGGATCTCAAGAATTACT
GGAACACGAGGATCAAGAAGAAACTGCGCCAGATGGGAATCGATCCTG
TGACCCACAAGCCTCTCACCCAAATGCAAATGCAGAGCACCCCTGCGCA
GACTCTGCTGCTGCAAGAAAATGATACAGAGCAGAAGCAGCAGGAGCA
ACATAATGAGCCTGATCCTGATCAGAATCAGAGCAGCAATGGCACTGTG
GAGACATTGGTCTCGAGGGCGAGAGAACCCCACGACGACATAGAGCCT
CTGCAGAATTTCAACATGGAGGATTCGAATTTTAACATGGAGGATTCGAT
GCAATTGTTCGATGTCTGCTCGCCCACCAGCGGGATAAGCCTGTCTGGG
AGAACCGAGGAGGTCGATTCAGATGATTCTGATCAGGTCTCCAAGAGCT
TCGGCAATGGCAGCAGTACCCATTCTCAGTACATTGGGCGAGAAAGCTC
TGGTGTCGAGGCCGAATGTGGTTTGTCTGGTTGGGATCAGATGGCTGGC
GTTTTGGGCGATCCCCTTTCTGAGTGGAATGTCGATTTGGAGTCCTGGGC
TGCTGGATTGGATGCCCCTGCAGCCTCTGCCTCTGCATGGATTCAGCAGC
TCCCTGACTGCCAATGGAACGACTTCCAGGGCGATTTTGAGATCTGCAG
CAGCAAGTCATGTCCGGAGACTCTGCAGAGACTGGGGCCCTTTCTTGAT
GACGATGATTTTGGGGACCCCAAAATTTTTTAT
Loại bỏ phần nu bị trùng trên R cho đến các nu trước trình tự đó trên F, là
đoạn nền đen ta được trình tự đầy đủ sau:
5’AAAAAAAAAAATTTTTAATGGGGGGGGGCACCGTGCTGTGACA
AAGTGGGATTGAAGAAGGGTCCATGGACTGCAGAGGAAGACAGAAAA
CTGGTGAATTTTATCACCCTGCATGGCCATGGATGCTGGCGCGAAGTACC
CAAACTTGCTGGTCTGCTTAGATGTGGCAAGAGCTGTAGATTGCGCTGG
ACAAATTACTTGCGCCCAGATTTGAAGCGTGGATTATTGTCTGAATCAGA
AGAGAAGCTCATCATTGATCTACATGCTGCCATAGGGAATAGGTGGTCAC
GAATCGCTGCGCAATTGCCAGGGAGAACTGATAACGAGATCAAGAATTA
CTGGAACACGAGGATCAAGAAGAAACTGCGCCAGATGGGAATCGATCC
TGTGACCCACAAGCCTCTCACCCAAATGCAAATGCAGAGCACCCCTGCG
CAGACTCTGCTGCTGCAAGAAAATGATACAGAGCAGAAGCAGCAGGAG
CAACATAATGAGCCTGATCCTGATCAGAATCAGAGCAGCAATGGCACTG
TGGAGACATTGGTCTCGAGGGCGAGAGAACCCCACGACGACATAGAGC
CTCTGCAGAATTTCAACATGGAGGATTCGAATTTTAACATGGAGGATTCG
ATGCAATTGTTCGATGTCTGCTCGCCCACCAGCGGGATAAGCCTGTCTGG
GAGAACCGAGGAGGTCGATTCAGATGATTCTGATCAGGTCTCCAAGAGC
TTCGGCAATGGCAGCAGTACCCATTCTCAGTACATTGGGCGAGAAAGCT
CTGGTGTCGAGGCCGAATGTGGTTTGTCTGGTTGGGATCAGATGGCTGG
CGTTTTGGGCGATCCCCTTTCTGAGTGGAATGTCGATTTGGAGTCCTGGG
CTGCTGGATTGGATGCCCCTGCAGCCTCTGCCTCTGCATGGATTCAGCAG
CTCCCTGACTGCCAATGGAACGACTTCCAGGGCGATTTTGAGATCTGCA
GCAGCAAGTCATGTCCGGAGACTCTGCAGAGACTGGGGCCCTTTCTTGA
TGACGATGATTTTGGGGACCCCAAAATTTTTTAT3’
Ghép mồi:
-Mồi xuôi F: ATAATGGGGAGGCAACCGTGCTGTGACAAA
Chọn vài nu cuối (chữ đỏ), dùng công cụ tìm kiếm Find để tìm trình tự này
trên đoạn đầu của trình tự đã ghép rồi xóa bỏ đoạn thích hợp để thu được trình tự
hoàn chỉnh.
- Mồi ngược R: GCGGCTCACAATTCATCGTCATCAAGAAAGGG
Đảo chiều bổ sung, được trình tự mới, lấy khoảng 6 nu đầu ( tô nền vàng) để tìm
kiếm trên đoạn cuối của trình tự đã ghép rồi xóa bỏ đoạn thừa ta thu được trình tự
hoàn chỉnh
+ Mồi ngược đã đảo chiều và bổ sung có trình tự :
CCCTTTCTTGATGACGATGAATTGTGAGCCGC
Tiếp sau tìm đoạn CTGTGACAAA và CCCTTT để thực hiện ghép mồi ta nhấn
Ctrl + F để tìm
Xóa bỏ đoạn thích hợp và ghép mồi ta thu được trình tự hoàn chỉnh
5’ATAATGGGGAGGCAACCGTGCTGTGACAAAGTGGGATTGAAGAAGGG
TCCATGGACTGCAGAGGAAGACAGAAAACTGGTGAATTTTATCACCCTG
CATGGCCATGGATGCTGGCGCGAAGTACCCAAACTTGCTGGTCTGCTTA
GATGTGGCAAGAGCTGTAGATTGCGCTGGACAAATTACTTGCGCCCAGA
TTTGAAGCGTGGATTATTGTCTGAATCAGAAGAGAAGCTCATCATTGATC
TACATGCTGCCATAGGGAATAGGTGGTCACGAATCGCTGCGCAATTGCCA
GGGAGAACTGATAACGAGATCAAGAATTACTGGAACACGAGGATCAAG
AAGAAACTGCGCCAGATGGGAATCGATCCTGTGACCCACAAGCCTCTCA
CCCAAATGCAAATGCAGAGCACCCCTGCGCAGACTCTGCTGCTGCAAG
AAAATGATACAGAGCAGAAGCAGCAGGAGCAACATAATGAGCCTGATC
CTGATCAGAATCAGAGCAGCAATGGCACTGTGGAGACATTGGTCTCGAG
GGCGAGAGAACCCCACGACGACATAGAGCCTCTGCAGAATTTCAACATG
GAGGATTCGAATTTTAACATGGAGGATTCGATGCAATTGTTCGATGTCTG
CTCGCCCACCAGCGGGATAAGCCTGTCTGGGAGAACCGAGGAGGTCGA
TTCAGATGATTCTGATCAGGTCTCCAAGAGCTTCGGCAATGGCAGCAGT
ACCCATTCTCAGTACATTGGGCGAGAAAGCTCTGGTGTCGAGGCCGAAT
GTGGTTTGTCTGGTTGGGATCAGATGGCTGGCGTTTTGGGCGATCCCCTT
TCTGAGTGGAATGTCGATTTGGAGTCCTGGGCTGCTGGATTGGATGCCC
CTGCAGCCTCTGCCTCTGCATGGATTCAGCAGCTCCCTGACTGCCAATG
GAACGACTTCCAGGGCGATTTTGAGATCTGCAGCAGCAAGTCATGTCCG
GAGACTCTGCAGAGACTGGGGCCCTTTCTTGATGACGATGAATTGTGAG
CCGC3’
So sánh trình tự nucleotide của đoạn vừa phân tích với ngân hàng NCBI :
Pinus taeda R2R3-MYB transcription factor (MYB1) mRNA, complete cds
Sequence ID: AY356372.1Length: 1023Number of Matches: 1
Related Information
UniGene-clustered expressed sequence tags
Range 1: 1 to 1023GenBankGraphicsNext MatchPrevious Match
Alignment statistics for match #1
Score
Expect
Identities
Gaps
Strand
1829 bits(990)
0.0
1012/1023(99%)
0/1023(0%)
Plus/Plus
Query
4
ATGGGGAGGCAACCGTGCTGTGACAAAGTGGGATTGAAGAAGGGTCCATGGACTGCAGAG
63
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct
1
ATGGGGAGGCAACCGTGCTGTGACAAAGTGGGATTGAAGAAGGGTCCATGGACTGCAGAG
60
Query
64
GAAGACAGAAAACTGGTGAATTTTATCACCCTGCATGGCCATGGATGCTGGCGCGAAGTA
123
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct
61
GAAGACAGAAAACTGGTGAATTTTATCACCCTGCATGGCCATGGATGCTGGCGCGAAGTA
120
Query
124
CCCAAACTTGCTGGTCTGCTTAGATGTGGCAAGAGCTGTAGATTGCGCTGGACAAATTAC
183
||||||||||||||||||||||||||||||||||| ||||||||||| ||||||||||||
Sbjct
121
CCCAAACTTGCTGGTCTGCTTAGATGTGGCAAGAGTTGTAGATTGCGTTGGACAAATTAC
180
Query
184
TTGCGCCCAGATTTGAAGCGTGGATTATTGTCTGAATCAGAAGAGAAGCTCATCATTGAT
243
|||||||| |||||||||||||||||||||||||||||||| ||||||||||||||||||
Sbjct
181
TTGCGCCCGGATTTGAAGCGTGGATTATTGTCTGAATCAGAGGAGAAGCTCATCATTGAT
240
Query
244
CTACATGCTGCCATAGGGAATAGGTGGTCACGAATCGCTGCGCAATTGCCAGGGAGAACT
303
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct
241
CTACATGCTGCCATAGGGAATAGGTGGTCACGAATCGCTGCGCAATTGCCAGGGAGAACT
300
Query
304
GATAACGAGATCAAGAATTACTGGAACACGAGGATCAAGAAGAAACTGCGCCAGATGGGA
363
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct
301
GATAACGAGATCAAGAATTACTGGAACACGAGGATCAAGAAGAAACTGCGCCAGATGGGA
360
Query
364
ATCGATCCTGTGACCCACAAGCCTCTCACCCAAATGCAAATGCAGAGCACCCCTGCGCAG
423
|||||||||||||||||||||||||||||||||||||||||||||||||||||||| |||
Sbjct
361
ATCGATCCTGTGACCCACAAGCCTCTCACCCAAATGCAAATGCAGAGCACCCCTGCCCAG
420
Query
424
ACTCTGCTGCTGCAAGAAAATGATACAGAGCAGAAGCAGCAGGAGCAACATAATGAGCCT
483
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct
421
ACTCTGCTGCTGCAAGAAAATGATACAGAGCAGAAGCAGCAGGAGCAACATAATGAGCCT
480
Query
484
GATCCTGATCAGAATCAGAGCAGCAATGGCACTGTGGAGACATTGGTCTCGAGGGCGAGA
543
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct
481
GATCCTGATCAGAATCAGAGCAGCAATGGCACTGTGGAGACATTGGTCTCGAGGGCGAGA
540
Query
544
GAACCCCACGACGACATAGAGCCTCTGCAGAATTTCAACATGGAGGATTCGAATTTTAAC
603
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct
541
GAACCCCACGACGACATAGAGCCTCTGCAGAATTTCAACATGGAGGATTCGAATTTTAAC
600
Query
604
ATGGAGGATTCGATGCAATTGTTCGATGTCTGCTCGCCCACCAGCGGGATAAGCCTGTCT
663
|||||||||||||||||||||||| ||||||| |||||||||||||||||||||||||||
Sbjct
601
ATGGAGGATTCGATGCAATTGTTCAATGTCTGTTCGCCCACCAGCGGGATAAGCCTGTCT
660
Query
664
GGGAGAACCGAGGAGGTCGATTCAGATGATTCTGATCAGGTCTCCAAGAGCTTCGGCAAT
723
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct
661
GGGAGAACCGAGGAGGTCGATTCAGATGATTCTGATCAGGTCTCCAAGAGCTTCGGCAAT
720
Query
724
GGCAGCAGTACCCATTCTCAGTACATTGGGCGAGAAAGCTCTGGTGTCGAGGCCGAATGT
783
|||||||||||||||||||||||||||||||||||||||||||||||| |||||||||||
Sbjct
721
GGCAGCAGTACCCATTCTCAGTACATTGGGCGAGAAAGCTCTGGTGTCAAGGCCGAATGT
780
Query
784
GGTTTGTCTGGTTGGGATCAGATGGCTGGCGTTTTGGGCGATCCCCTTTCTGAGTGGAAT
843
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct
781
GGTTTGTCTGGTTGGGATCAGATGGCTGGCGTTTTGGGCGATCCCCTTTCTGAGTGGAAT
840
Query
844
GTCGATTTGGAGTCCTGGGCTGCTGGATTGGATGCCCCTGCAGCCTCTGCCTCTGCATGG
903
|||||||||||||||||||||||||||||||||||| |||| ||||||||||||||||||
Sbjct
841
GTCGATTTGGAGTCCTGGGCTGCTGGATTGGATGCCACTGCGGCCTCTGCCTCTGCATGG
900
Query
904
ATTCAGCAGCTCCCTGACTGCCAATGGAACGACTTCCAGGGCGATTTTGAGATCTGCAGC
963
|||||||||||||||||||||||||||||||||||||| |||||||||||||||||||||
Sbjct
901
ATTCAGCAGCTCCCTGACTGCCAATGGAACGACTTCCAAGGCGATTTTGAGATCTGCAGC
960
Query
964
AGCAAGTCATGTCCGGAGACTCTGCAGAGACTGGGGCCCTTTCTTGATGACGATGAATTG
1023
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct
961
AGCAAGTCATGTCCGGAGACTCTGCAGAGACTGGGGCCCTTTCTTGATGACGATGAATTG
Query
1024
TGA
|||
1026
1020
Sbjct
1021
TGA
1023
- Kết luận: Có 11 điểm không tương đồng.
- Xác định lý do sai khác: Copy đoạn gen gần điểm sai khác và tìm trong Bioedit
sequence sau 3 lần kiểm tra đều thấy chỗ sai khác phân rõ ràng => sai khác do đột
biến.