BÁO CÁO THÍ NGHIỆM TIN SINH:
THIẾT KẾ MỒI MỘT ĐOẠN GEN
CHƯA BIẾT
Nhóm sinh viên thực hiện:
Cao Hoàng Minh Hiếu
Đỗ Thị Quỳnh Mai
Phùng Tuấn Minh
MSSV
20174683
20174925
20174944
I.
-
-
II.
-
TỔNG QUAN ĐỀ TÀI
Tính trạng quan tâm : ung thư máu
Lý do chọn tính trạng : Nhóm em cảm thấy hứng thú khi tìm hiểu về căn bệnh
này bởi đây là căn bệnh ung thư duy nhất mà không tạo ra khối u . Ung thư máu
hay còn gọi là bệnh máu trắng, đây là loại ung thư ác tính, xuất hiện khi cơ thể
bắt đầu có hiện tượng bạch cầu gia tăng đột biến. Bạch cầu vốn đảm nhiệm nhiệm
vụ bảo vệ cơ thể nên khi tăng số lượng một cách đột biến như vậy, nó sẽ bị thiếu
thức ăn cũng như nguồn cấp dinh dưỡng, vì thế bạch cầu sau đó thường ăn chính
hồng cầu - thành phần quan trọng của máu
Gene quyết định tính trạng : FLT3
Quá trình tìm hiểu về gene quy định tính trạng: vào www.google.com.vn, tra tính
trạng ung thư máu ở người thì tìm ra gene quy định là FLT3.
QUÁ TRÌNH TÌM VÙNG BẢO THỦ CỦA GENE
Vào trang gõ tìm gene “FLT3” ở trong mục
Nucleotide, tìm được ở người chứa vùng gene.
Trình tự nucleotide ở FASTA của 3 dữ liệu lần lượt là:
>MT001898.1 Homo sapiens isolate AML_33F/40F/47F FLT3 (FLT3) gene, partial
cds
CAATTTAGGTATGAAAGCCAGCTACAGATGGTACAGGTGACCGGCTCCTCAGAATAATGAGTACTTCTAC
GTTGATTTCAGAGAATATGAATATGATCTCAAATGGGAGTTTCCAAGAGAAAATTTAGAGTTTG
>MT001897.1 Homo sapiens isolate AML_34F FLT3 (FLT3) gene, partial cds
CAATTTAGGTATGAAAGCCAGCTACAGATGGACAGGTGACCGGCTCCTCAGATAATGAGTACTTCTACGT
TGATTTCAGAGAATATGAATATGATCTCAAATGGGAGTTTCCAAGAGAAAATTTAGAGTTTGGTAAGAAT
GGAATGTGCCAAATGTTTCTGCAGCATTTCTTTTCCATTGGAAAATCTTTAAAATGCACGTACTCACCAT
TTGTCTTTGCAGGGAAGGTACTAGGATCAGGTGCTTTTGGAAAAGTGATGAACGCAACAGCTTATGGAAT
TAGCAAAACAGGAGTCTCAATCCAGGTTGCCGTCAAAATGCTGAAAG
>MT001896.1 Homo sapiens isolate AML_21F FLT3 (FLT3) gene, partial cds
CAATTTAGGTATGAAAGCCAGCTACAGATGGTACAGGTGGACCGGCTCCTCAGATAATGAGTACTTCTAC
GTTGATTTCAGAGAATATGAATATGATCTCAAATGGGAGTTTCCAAGAGAAAATTTAGAGTTTGGTAAGA
ATGGAATGTGCCAAATGTTTCTGCAGCATTTCTTTTCCATTGGAAAATCTTTAAAATGCACGTACTCACC
ATTTGTCTTTGCAGGGAAGGTACTAGGATCAGGTGCTTTTGGAAAAGTGATGAACGCAACAGCTTATGGA
ATTAGCAAAACAGGAGTCTCAATCCAGGTTGCCGTCAAAATGCTGAAAG
-
Vào trang copy 3
vùng gene mà mình đã chọn vào và để chương trình chạy, tìm ra được các Nu
tương đồng giữa 3 vùng gene, sau đó chọn vùng bảo thủ là vùng có khoảng 18
– 24 bp hoặc dài hơn:
“TAATG AGTACTTCTA CGTTGATTTC AGAGAATATG AATATGATCT
CAAATGGGAG TTTCCAAGAG AAAATTTAGA”
III.
-
YÊU CẦU ĐỐI VỚI CẶP MỒI DÙNG TRONG PHẢN ỨNG PCR
Vào trang: copy 3
gen và để chương trình chạy , copy tất cả phần consensus cho vào link
điền vào
Forward primer from 56 to 135
Reverse primer from 192 to 327
PCR produce size min 70 max 1000
Primer melting temperatures ( TM ) min 57,0 opt 60,0 max 63,0 max Tm
difference 3
Cho chạy chương trình và tìm được đoạn mồi đáp ứng đủ yêu cầu sau:
Độ dài từ 18 – 24 bp
Nhiệt độ bắt mồi của 2 mồi là 4oC (thỏa mãn không chênh lệch
quá 5oC)
Tỉ lệ GC 40 -60 %
5 nu cuối đầu 3’ có 2 GC
Primer pair 1
Sequence (5'->3')
Template
Self
Self 3'
Length Start Stop Tm GC%
strand
complementarity complementarity
Forward
TCTCAAATGGGAGTTTCCAAGAGA Plus
primer
24
95
118 59.65 41.67 4.00
2.00
Reverse
CCCTGCAAAGACAAATGGTGA
primer
19
224 204 59.04 47.62 4.00
1.00
Minus
Product
130
length
Primer pair 2
Sequence (5'->3')
Template
Self
Self 3'
Length Start Stop Tm GC%
strand
complementarity complementarity
Forward
TCTCAAATGGGAGTTTCCAAGAGA Plus
primer
24
95
118 59.65 41.67 4.00
2.00
Reverse
TCCCTGCAAAGACAAATGGTG
primer
21
225 205 59.04 47.62 4.00
1.00
Product
131
length
Minus
Primer pair 3
Sequence (5'->3')
Template
Self
Self 3'
Length Start Stop Tm GC%
strand
complementarity complementarity
Forward
TCTCAAATGGGAGTTTCCAAGAGA Plus
primer
24
95
Reverse
CCTTCCCTGCAAAGACAAATGG
primer
22
228 207 60.03 50
Minus
118 59.65 41.67 4.00
4.00
2.00
1.00
Product
134
length
Primer pair 4
Sequence (5'->3')
Template
Self
Self 3'
Length Start Stop Tm GC%
strand
complementarity complementarity
Forward
TCTCAAATGGGAGTTTCCAAGAGA Plus
primer
24
95
118 59.65 41.67 4.00
2.00
Reverse
CCCTGCAAAGACAAATGGTGAG
primer
22
224 203 60.03 50.00 4.00
0.00
Minus
Product
130
length
Primer pair 5
Sequence (5'->3')
Template
Self
Self 3'
Length Start Stop Tm GC%
strand
complementarity complementarity
Forward
CTCAAATGGGAGTTTCCAAGAGA Plus
primer
23
96
118 58.34 43.48 4.00
2.00
Reverse
CCCTGCAAAGACAAATGGTGA
primer
21
224 204 59.04 47.62 4.00
1.00
Product
129
length
Minus
Primer pair 6
Sequence (5'->3')
Template
Self
Self 3'
Length Start Stop Tm GC%
strand
complementarity complementarity
Forward
CTCAAATGGGAGTTTCCAAGAGA Plus
primer
23
96
118 58.34 43.48 4.00
2.00
Reverse
TCCCTGCAAAGACAAATGGTG
primer
21
225 205 59.04 47.62 4.00
1.00
Minus
Product
130
length
Primer pair 7
Sequence (5'->3')
Template
Self
Self 3'
Length Start Stop Tm GC%
strand
complementarity complementarity
Forward
TCTCAAATGGGAGTTTCCAAGAG Plus
primer
23
95
117 58.34 43.48 4.00
0.00
Reverse
CCCTGCAAAGACAAATGGTGA
primer
21
224 204 59.04 47.62 4.00
1.00
Minus
Product
130
length
Primer pair 8
Sequence (5'->3')
Template
Self
Self 3'
Length Start Stop Tm GC%
strand
complementarity complementarity
Forward
TCTCAAATGGGAGTTTCCAAGAG Plus
primer
23
95
117 58.34 43.48 4.00
0.00
Reverse
TCCCTGCAAAGACAAATGGTG
primer
21
225 205 59.04 47.62 4.00
1.00
Product
131
length
Minus
Primer pair 9
Sequence (5'->3')
Template
Self
Self 3'
Length Start Stop Tm GC%
strand
complementarity complementarity
Forward
CTCAAATGGGAGTTTCCAAGAGA Plus
primer
23
96
118 58.34 43.48 4.00
2.00
Reverse
CCTTCCCTGCAAAGACAAATGG
primer
22
228 207 60.03 50.00 4.00
1.00
Minus
Product
133
length
Primer pair 10
Sequence (5'->3')
Template
Self
Self 3'
Length Start Stop Tm GC%
strand
complementarity complementarity
Forward
TCTCAAATGGGAGTTTCCAAGAG Plus
primer
23
95
117 58.34 43.48 4.00
0.00
Reverse
CCTTCCCTGCAAAGACAAATGG Minus
primer
22
228 207 60.03 50.00 4.00
1.00
Product
134
length
Chọn đoạn mồi số 1, vào trang
để tiến hành chạy PCR:
Kết quả chạy PCR:
>130 bp product from linear template MT001897.1 Homo sapiens isolate
AML_34F FLT3 (FLT3) gene, partial cds, base 95 to base 224 (T7 - T3).
TCTCAAATGGGAGTTTCCAAGAGAAAATTTAGAGTTTGGTAAGAATGGAATGTGCCAAAT
GTTTCTGCAGCATTTCTTTTCCATTGGAAAATCTTTAAAATGCACGTACTCACCATTTGT
CTTTGCAGGG
IV.
THÔNG TIN VỀ PROTEIN
1. Trình tự protein mà gene được tách dòng mã hóa
Vào trang expasy.org, tìm copy phần chạy PCR test
và cho chạy chương trình, ta được:
5'3' Frame 1
SQMGVSKRKFRVW-EWNVPNVSAAFLFHWKIFKMHVLTICLCR
5'3' Frame 2
LKWEFPRENLEFGKNGMCQMFLQHFFSIGKSLKCTYSPFVFAG
5'3' Frame 3
SNGSFQEKI-SLVRMECAKCFCSISFPLENL-NARTHHLSLQ
3'5' Frame 1
PCKDKW-VRAF-RFSNGKEMLQKHLAHSILTKL-IFSWKLPFE
3'5' Frame 2
PAKTNGEYVHFKDFPMEKKCCRNIWHIPFLPNSKFSLGNSHLR
3'5' Frame 3
LQRQMVSTCILKIFQWKRNAAETFGTFHSYQTLNFLLETPI2. Khối lượng phân tử, điểm đẳng điện
Mở vào phần proteomics, rồi vào phần Compute pI/MW ,
copy phần
5'3' Frame 1
SQMGVSKRKFRVW-EWNVPNVSAAFLFHWKIFKMHVLTICLCR
Vào và cho chạy chương trình, ta ra kết quả:
3.
-
Điểm đẳng điện: 10.45
Khối lượng phân tử: 5729.90
Vị trí của protein trong tế bào
Vào trang Chọn “ Nucleotide BLAST”
Copy kết quả PCR test cho chạy chương trình:
Ra được kết quả:
Ta thấy có 3 loài có mức độ tương đồng 100% với FLT3, ta chọn MT001896.1, click
vào, chọn FASTA, ta có trình tự protein:
Homo sapiens isolate AML_21F FLT3 (FLT3) gene, partial cds
GenBank: MT001896.1
GenPept Identical Proteins Graphics
>MT001896.1 Homo sapiens isolate AML_21F FLT3 (FLT3) gene, partial cds
CAATTTAGGTATGAAAGCCAGCTACAGATGGTACAGGTGGACCGGCTCCTCAGATAATGAGTACTTCTAC
GTTGATTTCAGAGAATATGAATATGATCTCAAATGGGAGTTTCCAAGAGAAAATTTAGAGTTTGGTAAGA
ATGGAATGTGCCAAATGTTTCTGCAGCATTTCTTTTCCATTGGAAAATCTTTAAAATGCACGTACTCACC
ATTTGTCTTTGCAGGGAAGGTACTAGGATCAGGTGCTTTTGGAAAAGTGATGAACGCAACAGCTTATGGA
ATTAGCAAAACAGGAGTCTCAATCCAGGTTGCCGTCAAAATGCTGAAAG
-
Vào copy trình protein ở trên vào và chạy chương
trình, ta được kết quả:
Nhận xét:
- Từ ảnh, ta thấy đường màu xanh dương biểu diễn nằm ngoài tế bào chất, đường xanh
lá câu biểu diễn nằm trong tế bào chất, đường màu xám biểu diễn xuyên màng
- Ta thấy, tỉ lệ aa nằm ngoài tế bào chất chiếm khoảng 87%, trong khi tỉ lệ aa nằm
trong tế bào chất khoảng 17%, còn tỉ lệ aa xuyên màng hầu như k có
=> Có thể kết luận protein đang xét nằm ngoài Tế bào chất
4. Dự đoán chức năng protein
- Vào chọn proteomics, chọn protein modifications,
chọn UniProtKB/Swiss-Prot, vào BLAST, copy trình tự protein
>MT001896.1 Homo sapiens isolate AML_21F FLT3 (FLT3) gene, partial cds
CAATTTAGGTATGAAAGCCAGCTACAGATGGTACAGGTGGACCGGCTCCTCAGATAATGAGTACTTCTAC
GTTGATTTCAGAGAATATGAATATGATCTCAAATGGGAGTTTCCAAGAGAAAATTTAGAGTTTGGTAAGA
ATGGAATGTGCCAAATGTTTCTGCAGCATTTCTTTTCCATTGGAAAATCTTTAAAATGCACGTACTCACC
ATTTGTCTTTGCAGGGAAGGTACTAGGATCAGGTGCTTTTGGAAAAGTGATGAACGCAACAGCTTATGGA
ATTAGCAAAACAGGAGTCTCAATCCAGGTTGCCGTCAAAATGCTGAAAG
-
Vào và chạy chương trình, cho ra kết quả:
- Ta chọn protein có tỉ lệ cao nhất là 95.8% và thu được phần dự đoán chức năng:
CẤU TRÚC 3D CỦA ĐOẠN PROTEIN
V.
-
Vào trang
/>stSearch&BLAST_SPEC=&LINK_LOC=blasttad&LAST_PAGE=tblastn copy
đoạn protein vào mục: “ Enter accession number(s), gi(s), or FASTA
sequence(s)”.
-
Chọn dạng Database là Protein Data Bank protein(pdb) => ấn BLAST.
-
Kết quả:
Chọn kết quả có sự tương đồng cao nhất => Ấn vào đường link ở mục
Accession.
-
Vào mục Protein 3D Structure Hoặc vào trang:
=> chọn hộp thư Structure => Copy mã
1RJB vào và chạy
Kết quả:
Ấn Dowload về máy => Sử dụng phần mềm Cn3D 4.3.1 => mở file vừa
tải về để xem cấu trúc 3D của nó.
Vào mục Style => Coloring Shortcuts: Chọn màu để thể hiện các cấu
trúc 3D.
Ngoài ra, các vùng khác sẽ được xác định ở trang cấu trúc 3D khi
download cấu trúc về.
Hoặc ấn vào full-featured 3D viewer
Sử dụng các công cụ như trong phần mềm Cn3D:
-
Xác định các tính trạng, cấu trúc.
Chuỗi α và β: Style => Coloring Shortcuts => Secondary Structure
Vùng: Style => Coloring Shortcuts => Domain
Vùng kỵ nước: Style => Coloring Shortcuts => Hydrophobicity
Các phân tử: Style => Coloring Shortcuts => Molecule
Vùng bảo thủ: Style => Coloring Shortcuts => Sequence Conservation
Nhiệt độ: Style => Coloring Shortcuts => Temperature
VI.
-
NHẬN XÉT
Sản phẩm sau khi thu được có khả năng sẽ biểu hiện được tính trang do ta thấy
có khá nhiều gene có độ tương đồng từ 90 – 100%
Kết quả ta thu được cũng chỉ mang tính chất tham khảo nên nếu muốn có được
kết quả chính xác nhất ta cần nghiên cứu kết hợp với thực tế để thu được mẫu
rồi thử xem có thể biểu hiện được tính trạng mà chúng ta cần hay không