6/3/2021
HỆ GEN HỌC: CẤU TRÚC VÀ CHỨC NĂNG
Learning materials
HỆ GEN HỌC:
CẤU TRÚC VÀ CHỨC NĂNG
HỆ GEN HỌC:
CẤU TRÚC VÀ CHỨC NĂNG
Bản đồ di truyền
Bản đồ vật lý
Giải trình tự hệ gen
Chú giải hệ gen - Công cụ tin sinh
SNP (Single-Nucleotide Polymorphisms)
Số bản sao (Copy-Number Variations)
Metagenomics
Sinh học tổng hợp - Synthetic Biology
Nghiên cứu hệ phiên mã
Nghiên cứu hệ protein (proteomics)
CẤU TRÚC HỆ GEN
Bản đồ di truyền
‒ là bản đồ vị trí các gen trên nhiễm sắc thể
được xác định bằng tần số hốn vị gen.
Ví dụ 1: Gen A và B nằm trên 1 NST
– khoảng cách giữa A và B?
f(ab) = 25%
Khoảng cách A và B = 25 cM
Ví dụ 2: Gen A, B và C nằm trên 1 NST
– khoảng cách giữa A, B và C?
f(ab) = 25%, f( ac) = 15%, f (bc) = 10%
A
cm (m.u)
C
B
1
6/3/2021
More
accurate
CẤU TRÚC HỆ GEN
Limited
accurate
Bản đồ di truyền
Nhược điểm
CẤU TRÚC HỆ GEN
Bản đồ vật lý : bản đồ vị trí các gen dựa trên trình tự nucleotit
(lập bản đồ bằng tần số tái tổ hợp).
Nghiên cứu được ít gen
̶
=> gen khơng biểu hiện ra kiểu hình=> khơng
xác định được tần số trao đổi chéo => không xác
định được vị trí.
Độ phân giải thấp
̶
Hệ gen người 3.2 tỷ bp và có 4000 cM
=> 1 cM = 800,000 bp
Có sai sót ở những điểm nóng trao đổi tréo
̶
Ưu điểm
̶
Làm cơ sở để xây dựng bản đồ vật lý
Làm thế nào để đọc trình tự tồn bộ nhiễm sắc thể
GIẢI TRÌNH TỰ HỆ GEN NGƯỜI
Figure 20.4
TECHNIQUE
Bacterial plasmid
ampR gene
Hummingbird cell
lacZ gene
Restriction
site
Hệ gen người 2003: phương pháp lập bản đồ
Sticky
ends
Nhắc lại phương pháp:
Ghép lại
Ghép lại
Cắt ADN bằng enzyme giới hạn
Nhân dòng và chọn
lọc vector mang gen
mong muốn
Gene of
interest
Hummingbird DNA
fragments
Nhân dòng DNA
(Vector)
Recombinant plasmids Nonrecombinant
plasmid
Bacteria carrying
plasmids
Ghép nối các đoạn DNA
(Chọn được 1 bộ các đoạn
ADN với số lượng ít nhất)
Giải trình tự từng đoạn 1
RESULTS
Colony carrying nonrecombinant plasmid
with intact lacZ gene
Colony carrying
recombinant
plasmid
with disrupted
lacZ gene
One of many
bacterial
clones
2
6/3/2021
GIẢI TRÌNH TỰ HỆ GEN NGƯỜI
Ghép lại
Cắt ADN bằng enzyme giới hạn
Ghép lại
GIẢI TRÌNH TỰ HỆ GEN
Ghép các đoạn ADN
Hệ gen người 2003: phương pháp lập bản đồ
Nhân dòng DNA
(Vector)
Bản đồ giới hạn
─ Xác định các vị trí cắt enzyme giới hạn
trên ADN
Đoạn ADN 13 (13-kb)
Cắt enzyme giới hạn với EcoRI và BamHI:
Ghép nối các đoạn DNA
(Chọn được 1 bộ các đoạn
ADN với số lượng ít nhất)
Giải trình tự từng đoạn 1
GIẢI TRÌNH TỰ HỆ GEN NGƯỜI
GIẢI TRÌNH TỰ HỆ GEN NGƯỜI
Ghép các đoạn ADN
Phương pháp lai tại chỗ: In situ hybridization
Ghép các đoạn ADN
Bản đồ giới hạn
Sử dụng mẫu dị DNA, RNA có gắn huỳnh quang
– Bước 1: ủ => mẫu dị bám vào vị trí tương đồng
– Bước 2: rửa => rửa các mẫu dò
– Bước 3: Quan sát (kính hiển vi huỳnh quang)
Phương pháp giải trình tự đoạn ADN
3
6/3/2021
CẤU TRÚC HỆ GEN
GIẢI TRÌNH TỰ HỆ GEN NGƯỜI
Bản đồ vật lý : xác định vị trí các gen dựa trên trình tự nucleotit
Ghép các đoạn ADN
• Sử dụng bản đồ di truyền
Ghép lại
Ghép lại
Cắt ADN bằng enzyme giới hạn
Nhân dịng ADN
Giải trình tự hệ gen dựa trên
phương pháp lập bản đồ
Giải trình tự từng đoạn 1
Dự án hệ gen người
Hệ gen người: Giải trình tự
hệ gen thơng qua lập bản
đồ
Chính xác hơn
Tốn kèm hơn
Giải trình tự bằng phương pháp
shotgun sequencing
Kém chính xác
Giá rẻ hơn
Thách thức trong
giải trình tự hệ gen
Loại bỏ các trình tự nhiễu từ
các trình tự ngắn ??
Several assemblers
available, which is best ??
Lắp ráp hệ gen từ các
trình tự ngắn ??
Annotation and validation
of assembled genome ??
6/3/2021
4
6/3/2021
GIẢI TRÌNH TỰ THẾ HỆ MỚI (NGS)
Giải trình tự thế hệ mới NGS (Next generation sequencing)
Giải trình tự thế hệ 2:
GIẢI TRÌNH TỰ THẾ HỆ MỚI (NGS)
• Pyro-sequencing
3’ GCGCCGTCCGGAAGCA3’
5’ CGCGG.………………….5’
(giải trình tự song song lượng lớn)
o Roche (454 pyrosequencing)
o Illumina (MiSeq/HiSeq)
o Life Technologies (Ion Proton/SOLiD)
o BGI (DNA nanoball)
Một số công nghệ thế hệ 3
o Pacific biosciences (Single-molecule real-time sequencing)
o Oxford Nanopore Technologies (Nanopore)
dGTP
dGTP
Một số công nghệ khác
o Giải trình tự bằng kính hiển vi điện tử
Electron microscopy
image of DNA
6/3/2021
GIẢI TRÌNH TỰ THẾ HỆ 2
dGMP + Pi
GIẢI TRÌNH TỰ THẾ HỆ 3
Mục tiêu
o Giảm giá thành
o Tăng độ chính xác
o Giải trình tự 1 phân tử
• Pyro-sequencing
Giải trình tự song song lượng lớn
Một số cơng nghệ thế hệ 3
o Pac-bio (Single-molecule real-time sequencing)
o Oxford Nanopore Technologies (Nanopore)
Giải trình tự thế hệ mới (NGS) -giải trình tự thế hệ 2:
Roche (454 pyrosequencing)
Illumina (MiSeq/HiSeq)
Life Technologies (Ion Proton/SOLiD)
BGI (DNA nanoball)
Nhược điểm thế hệ 2: các trình tự ngắn
=> Sai sót với ADN lặp lại
5
6/3/2021
GIẢI TRÌNH TỰ THẾ HỆ 3
Pac-bio (Single-molecule real-time sequencing: SMRT)
6/3/2021
GIẢI TRÌNH TỰ THẾ HỆ 3
Pac-bio (Single-molecule real-time sequencing: SMRT)
1. Tín hiệu huỳnh quang chỉ được thu lại khi ở sát đáy giếng
2. Một nucleotit được gắn vào vị trí sợi mới được tổng hợp => sẽ phải
đến vị trí DNA pol ở đáy giếng.
3. Tín hiệu huỳnh quang sát đáy giếng (gần với phân tử DNA pol) =>
được ghi lại
4. Sau khi hình thành liên kết phosphodiester thì tín hiệu huỳnh quang
được giải phóng và khuếch tán ra ngồi
DNA pol dịch chuyển tới vị trí mới và bắt đầu một lần đọc mới
GIẢI TRÌNH TỰ THẾ HỆ 3
Pac-bio (Single-molecule real-time sequencing: SMRT)
6/3/2021
Khn mạch vịng => có thể đọc nhiều lần 1 khn
GIẢI TRÌNH TỰ THẾ HỆ 3
Pac-bio (Single-molecule real-time sequencing: SMRT)
Có thể giải trình tự dài >50 kb
Đọc sai 10%
6
6/3/2021
GIẢI TRÌNH TỰ THẾ HỆ 3
Nanopore sequencing
GIẢI TRÌNH TỰ THẾ HỆ 3
Nanopore sequencing
-
+
Motor protein: đẩy một mạch DNA
vào kênh xuyên màng
Khi 1 bazơ nitơ (A, T, G, C) đi qua kênh protein xuyên
màng sẽ làm thay đổi khả năng dẫn điện của kênh =>
tín hiệu thay đổi
Đọc trình tự dài tới > 1 Mb
GIẢI TRÌNH TỰ THẾ HỆ 3
Nanopore sequencing
• Phương pháp này có thể đẫn đến đọc sai (mất nu trong q trình đọc)
• Đọc sai 5-10%
Dự án hệ gen người
Kết quả dự án hệ gen người (2003)
Kỳ vọng: bản thiết kế hoàn chỉnh của tế bào và cơ thể
Kết quả: cuốn sách có chữ sắp xếp khơng có quy luật.
Chúng ta biết q ít
về ngơn ngữ tế bào
Đoạn ADN nào là gen?
Vùng nào tham gia vào
điều khiển gen?
̶ Promoter ?
̶ Enhancer ?
̶ Silencer ?
̶ Intron
?
Ngôn ngữ tế bào
7
6/3/2021
Dự án hệ gen người
Dự án hệ gen người
Kết quả dự án hệ gen người (2003)
Kết quả dự án hệ gen người (2003)
Lợi ích:
─ Tạo ra cuộc cách mạng về giải trình tự gen: mục
tiêu($1,000/ genome)
─ Cơng cụ tin sinh phát hiện đa dạng di truyền trong
hệ gen người (liên quan đến tính trạng, bệnh tật
v.v..). Đặc biệt là các SNP (đa hình đơn nucleotit)
Hạn chế:
Lạm dụng thơng tin hệ gen:
Phân biệt đối xử với người mang gen gây bệnh
USA: Cấm các công ty bảo hiểm/ bảo hiểm y tế sử
dụng thông tin hệ gen.
─ Phát hiện các gen liên quan đến các trình phát triển
cơ thể.
─ Nghiên cứu tiến hóa
Bioinformatics
CHÚ GIẢI HỆ GEN
Genomes
CHÚ GIẢI HỆ GEN
Genes
CƠNG CỤ TIN SINH
Trình tự của các gen đã biết
Các khung đọc mở ORF (open reading
frame): Start Stop codon (same frame)
Các trình tự DNA bảo thủ ở các sinh vật
Trình tự Promoter
Trình tự các vị trí cắt nối intron/exon
Dự đốn Trình tự biểu hiện
Trình tự protein
Found a gene => BLAST search to find similar sequences
6/3/2021
8
6/3/2021
Bioinformatics
Bioinformatics
GenBank
DNA DataBank of Japan (DDBJ)
European Molecular Biology Laboratory (EMBL)
GenBank (NCBI)
ĐA HÌNH ĐƠN NUCLEOTIT (SNP)
Hệ gen người: 99.9% giống nhau
ĐA HÌNH ĐƠN NUCLEOTIT (SNP)
SNP phân bố khắp hệ gen: ~1 SNP/1000 bp=> marker
đa dạng di truyền
3.2 109 bp x 0.1 % =3.2 106=> làm cho chúng ta
Đặc biệt (UNIQUE) quy định:
─ Kiểu hình
─ Sức khỏe Cá thể A
─ Trí tuệ
Cá thể B
─ Cá tính
Cá thể C
Cá thể D
single-nucleotide polymorphism (SNP=“snip”)
Là vị trí trên hệ gen mà các cá thể của cùng một
loài khác nhau 1 cặp Nu.
6/3/2021
9
6/3/2021
Single-Nucleotide Polymorphisms
ĐA HÌNH ĐƠN NUCLEOTIT (SNP) TRONG HỆ GEN
Haplotypes
• Là nhóm các SNP
trên 1 nhiễm sắc thể
• Tải tổ hợp các SNP = trao
đổi chéo NST
ĐA HÌNH ĐƠN NUCLEOTIT (SNP) TRONG HỆ GEN
ĐA HÌNH ĐƠN NUCLEOTIT (SNP) TRONG HỆ GEN
Haplotypes
SNPs – gần nhau => liên kết chặt
với nhau và xuất hiện cùng nhau.
Những SNP luôn đi cùng với nhau =>
tag SNPs
Hệ gen người có 10 triệu SNPs
Có khoảng 100,000 Tag SNPs—có thể được
sử dụng để xác định các kiểu haplotype của
người.
ĐA DẠNG SỐ BẢN SAO TRONG HỆ GEN
Phân tích được số bản sao của các đoạn DNA (> 1000 bp)
Ứng dụng của SNP
─ Mất đoạn => chỉ có 1 bản sao trong hệ gen
─ Lặp đoạn => có nhiều hơn hai bản sao của gen
Phân bố trên toàn bộ hệ gen=> SNPs là các markers tốt nhất trong
nghiên cứu tính trạng liên kết.
SNP gần các locus gen gây bệnh=> là marker xác định gen gây bệnh
SNPs marker hiệu quả hơn RFLPs marker
=> ảnh hưởng đến mức độ biểu hiện gen
─ Liều lượng gen (Gene dosage)
─ Vị trí của gen (ảnh hưởng đến mức độ biểu hiện gen do
các yếu tố điều hòa nằm cạnh)
Số bản sao của gen=> tự kỷ, rối loạn phát triển, ví dụ: bệnh down
10
6/3/2021
ĐA HỆ GEN(METAGENOMICS)
Metagenomics: nghiên cứu
nhiều hệ gen trong mẫu thu
được từ môi trường.
Rất nhiều vi sinh vật chưa được nghiên
cứu=> không phân lập được
SINH HỌC TỔNG HỢP (Synthetic Biology)
Thiết kế và xây dựng các thực thể sinh học
2002: tạo ra virus poliovirus từ đoạn DNA được tổng hợp hóa học.
2010: Daniel Gibson et al tổng hợp hệ gen vi khuẩn Mycoplasma
mycoides (1.08-million-bp)
Synthesized genome of
Mycoplasma mycoides
NGS => Metagenomics
o Tìm ra các phân tử sinh học mới:
enzyme, sản phẩm chuyển hóa và ứng
dụng.
o Y học: phát hiện tác nhân gây bệnh
trong mẫu bệnh phẩm.
o Y học cá thể
Hệ gen học chức năng
Hệ gen
Hệ phiên mã
Hệ gen học chức năng
Hệ protein
Hệ chất chuyển hóa
11
6/3/2021
NghiênCỨU
cứuHỆ
hệ phiên
NGHIÊN
PHIÊNmã
MÃ
NGHIÊN CỨU HỆ PHIÊN MÃ
• Ứng dụng:
=>biểu hiện của các gen trong 1 mô ở (mức độ phiên mã)
=> So sánh mức độ biểu hiện => chức năng gen (tham gia vào
quá trình nào)
Nghiên cứu hệ protein - Proteomics
Mẫu nghiên cứu
Nghiên cứu hệ protein - Proteomics
Phương pháp điện di 2 chiều
Chiều 1: pH đẳng điện của từng protein
Mẫu nghiên cứu
pH3
Mẫu protein
pH10
Dải pH
pH10
Loại mẫu 1
Vd. Mẫu ung thư
Xếp
trồng 2
mẫu
Loại mẫu 2
Vd. Mẫu bình thường
Xác định tất cả các protein
được biểu hiện ở 2 mơ trên
?
Nhuộm
mầu
khác
nhau
Tìm ra các vị trí protein
khác nhau
Loại mẫu 1
Vd. Mẫu ung thư
Loại mẫu 2
Vd. Mẫu bình thường
Xác định protein liên quan
đến ung thư?
Chiều 2: khối lượng phân tử
Điện di 2 chiều
Loại mẫu 1
Vd. Mẫu ung thư
Độ tính điện
Thêm SDS
Loại mẫu 2
Vd. Mẫu bình thường
12
6/3/2021
Nghiên cứu hệ protein - Proteomics
FUNCTIONAL GENOMICS
Mẫu nghiên cứu
Nghiên cứu hệ protein
Proteomics
Loại mẫu 1
Vd. Mẫu ung thư
Loại mẫu 2
Vd. Mẫu bình thường
Điện di 2 chiều
Xác định tất cả các protein
được biểu hiện ở 2 mơ trên
Nhuộm
mầu
khác
nhau
Kỹ thuật
phối phổ
Xác định chính xác
khối lượng 1 phân
tử (1 dalton)
Protein gì?
Xếp
trồng 2
mẫu
Xác định thời gian bay
=> khối lượng phân tử
Loại mẫu 1
Vd. Mẫu ung thư
Tìm ra các vị trí protein
khác nhau
Loại mẫu 2
Vd. Mẫu bình thường
FUNCTIONAL GENOMICS
Nghiên cứu hệ protein
Proteomics
Kỹ thuật
phối phổ
Tìm ra các vị trí protein
khác nhau
FUNCTIONAL GENOMICS
Cắt bằng trypsin
2017- CryoEM
Structural Proteomics
X-ray crystallography
nuclear magnetic resonance (NMR)
Máy khối phổ
Protein gì?
Tìm ra các vị trí protein
khác nhau
13