Tải bản đầy đủ (.pdf) (20 trang)

Giải mã trình tự toàn bộ bộ gen

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.27 MB, 20 trang )

3/25/2014

TRƢỜNG ĐẠI HỌC CÔNG NGHIỆP THỰC PHẨM TPHCM

KHOA CNSH & KTMT
HỆ ĐẠI HỌC

Chƣơng 5

Giải mã trình tự toàn bộ
bộ gen

ThS. Nguyễn Thành Luân
Email:

NỘI DUNG BÀI HỌC
1.

Khái niệm giải mã bộ gen (genomic sequencing)

2.

Giải mã trình tự theo phương pháp Sanger: định
nghĩa, các bước cơ bản, sản phẩm.

3.

Phương pháp tạo phản ứng cho việc giải mã:
Walking & Shotgun

4.



Ưu & nhược điểm của giải mã trình tự

5.

Các hướng khắc phục: mô hình quỹ cộng đồng &
mô hình cá nhân.

6.

Hướng giải quyết mới trong tương lai.
2

Why do sequencing?

3

1


3/25/2014

Why do sequencing?

Bản hƣớng dẫn cho ngành sinh học

4

Khám phá mỗi gen mã hóa bởi bộ
gen của 1 loài động vật

5

Tại sao cần thiết phải giải mã toàn bộ bộ gen?



Phân biệt các dòng giống từ sự khác biệt
về trình tự

6

2


3/25/2014

Tại sao cần thiết phải giải mã toàn bộ bộ gen?




Khám phá các kiểu di truyền gây ra bởi các
đột biến khác nhau
Khám phá các đột biến gây ra các bệnh di
truyền

7

Giải mã trình tự (Gene Sequencing)




Có bao nhiêu phương pháp giải mã trình tự?



Phương pháp giải mã trình tự nào tối ưu hơn? Tại sao?



Mục đích cuối cùng của giải mã trình tự toàn bộ bộ gen là gì?
8

Các bƣớc của giải mã trình tự SH
 Phƣơng pháp giải trình tự
toàn hệ gen trải qua 3 giai
đoạn:
 Bắt đầu bằng một bản đồ
di truyền tế bào của mỗi
NST
 Thực hiện giải mã qua các
giai đoạn đạt mục đích
cuối cùng là giải mã toàn
bộ từng nucleotide trên
mỗi NST

9

3



3/25/2014

Khi nào sử dụng giải trình tự?

10

Phản ứng giải mã trình tự sinh học

The Nobel Prize in Chemistry
1958. Frederick Sanger
(1918 - 2013)



Được phát minh bởi Fred
Sanger



Sử dụng enzyme DNA
polymerase



Các phản ứng chứa 1 “điểm
đích” để tạm dừng quá trình
tổng hợp
11


Giải mã trình tự Sanger


Hoạt động bằng thực hiện các phản ứng nhẹ
nhàng phá gãy 1 đoạn DNA chuẩn đã tái tạo, xúc
tác bởi enzyme DNA polymerase.

12

4


3/25/2014

Phản ứng giải mã trình tự

13

Các bƣớc cơ bản trong giải mã trình tự

 Thêm đoạn mồi:
 Thêm enzyme cắt DNA polymerase:
 Thêm các nhóm bazơ nitric (4 nitrogenous
bases):
 Thêm 4 nhóm dideoxynucleotide (ddNTPs)

14

Nguyên lý của giãi mã


Phân biệt rõ PCR giải mã trình tự và PCR
khuếch đại trình tự
15

5


3/25/2014

Sản phẩm của các phản ứng giải mã trình tự


Phản ứng diễn ra trên 1000 lần từ sợi DNA khuôn



Mỗi vị trí có thể có đều được đánh dấu rất nhiều
lần

16

Máy giải mã trình tự bộ gen

17

Giải mã trình tự bộ gen



Với việc sử dụng các phần mềm khác nhau, sẽ cung

cấp cho chúng ta 1 hình ảnh gel
Mỗi vạch (band) tương ứng cho 1 mảnh của đoạn DNA
khác nhau về 1 đoạn chiều dài của nucleotide. Màu
sắc trong vạch biểu thị cho việc ddNTPs được kết hợp
trong đoạn DNA

18

6


3/25/2014

Giải mã trình tự bộ gen

Giải mã trình tự trên những khu vực gel để đọc kết quả giải mã

19

Phản ứng giải mã trình tự đầu tiên
(primary sequencing)


Không sử dụng thuốc nhuộm (dyes) & dung dịch
đệm chạy mẫu (loading buffer)



Các ký tự đích (terminator) được đánh dấu bằng
các chất phóng xạ




Thực hiện 4 phản ứng riêng biệt, mỗi phản ứng
khác nhau với 1 ký tự đích khác nhau

20

Quá trình giải mã trình tự

Quá chậm cho Genomics
 Tối đa khoảng 500 base/1 lần giải mã trình tự


Mỗi base phải được đọc trên film X-ray và ghi lại
nhiều lần kết quả bằng cách thủ công (tay, thuê
nhân công..)  Tốn công sức & hiệu quả kinh tế
kém

21

7


3/25/2014

Quá trình giải mã trình tự
Dự tính thời gian:



Bacteriophage chỉ có 5000bp
 Mất 4 năm để hoàn thành việc giải mã



Các loài đơn giản nhất (Vi khuẩn) có bộ
genome khoảng 2,000,000 bp
 Mất khoảng1,600 năm cho việc giải mã
22

Quá trình giải mã trình tự

23

Phƣơng pháp tạo phản ứng trong việc giải mã



Các mục tiêu trong việc giải mã trình tự các
phân mảnh lớn của DNA


PP Walking (PP lặp và phân đoạn)



PP Shotgun (PP ngẫu nhiên)

24


8


3/25/2014

Phản ứng Walking





Phản ứng giải mã trình tự đầu tiên cung cấp 500 bp trình
tự thông tin.
Việc giải mã 500 bp tiếp theo phụ thuộc vào trình tự
thông tin DT của đoạn mã trước đó.
Quy trình phản ứng chỉ đạt tối đa 1kbase/2 ngày. Việc
giải mã trình tự toàn bộ bộ genome mất 6,000,000 ngày.
25

Phƣơng pháp Shotgun






Lấy nhiều đoạn copy DNA
ngẫu nhiên của bộ gen, giải
mã trình tự 500bp từ mỗi
đoạn DNA đó.

Sau đó sắp xếp tất cả trình
tự thành 1 trình tự bộ gen
hoàn chỉnh.
Lƣu ý: Phải giải mã trình tự
gen nhiều lần để chắc chắn
không bị trùng lặp có thể
thực hiện nhiều phản ứng
trình tự đồng thời cùng 1
lúc.
26

So sánh Walking vs Shotgun







Walking hiệu quả hơn – giải mã trình tự chỉ 1 lần
duy nhất
Walking thường chậm hơn, mất đến 2-3 ngày để
thiết kế và tổng hợp các mồi (primer) mới cho
trình tự
Shotgun ít hiệu quả hơn vì là giải mã trình tự
ngẫu nhiên, cần phải giải mã mỗi trình tự ít nhất
10 lần lặp lại
Nhanh hơn Walking – không cần tổng hợp và
thiết kế mồi (primer) – sử dụng 1 loại giống nhau
cho tất cả các phản ứng

27

9


3/25/2014

Giải trình tự ngẫu nhiên (Shotgun)




Do J. Craig Venter
(1992), một nhà sinh
học phân tử tìm ra khi
bỏ qua bản đồ liên kết
và bản đồ vật lý thay
vào việc giải trình tự
các phân đoạn DNA
ngẫu nhiên
Hệ gen của
Haemophilus influenza
lần đầu tiên được công
bố bằng PP này (1995)
28

Vận hành phƣơng pháp Shotgun




Các phân mảnh được phân chia ngẫu nhiên, các trình tự của các
phân mảnh phải được giải mã để đảm bảo độ bao phủ tất cả trình
tự



Một số phân mảnh sẽ chứa nhiều thông tin trình tự đã hiện diện ở
trình tự khác = đoạn lặp (overlaps)
Các đoạn lặp này rất cần thiết cho việc kết nối các phân đoạn DNA
lại với nhau



29

Vận hành phƣơng pháp Shotgun


Quy tắc chung – giải mã ít
nhất 10 lần kích cỡ bộ gen
để đảm bảo độ bao phủ
hoàn toàn trình tự giải mã

VD: 1 bộ genome 5kbase=5000base, máy
giải mã phải giải mã 5000*10/500 trình tự
= 100 đoạn
Để kết hợp lại, phải làm các phép so
sánh 2 đoạn phân mảnh DNA
(comparisons) = C(100,2)
C(100,2) = 4,950 phép so sánh

30

10


3/25/2014

Các phép so sánh


Có quá nhiều phép so sánh cần phải thực hiện,
sẽ phải mất rất nhiều năm để tính toán thời gian
hoàn thành.

31

Triển vọng của giải mã trình tự

Định nghĩa & mô tả cấu trúc hoặc
trật tự di truyền của gen hay protein
Dự đoán đƣợc sự thay đổi di
truyền của thế hệ tiếp theo

32

Các khó khăn khi giải mã trình tự






Phải tiến hành phân mảnh bộ genome trước khi
giải mã
Phải đạt 500 bp cho mỗi trình tự từ đoạn phân
mảnh  Đạt độ chính xác cao
Sau kết thúc giải mã, các trình tự phải được đặt
trở lại thành 1 bộ gen hoàn chỉnh
Mỗi đoạn phân mảnh 500 bp phải liên tục được
so sánh với 1 số đoạn trình tự phân mảnh 500
bp khác  Kiểm tra độ chính xác
33

11


3/25/2014

Khó khăn của giải mã trình tự

Tìm kiếm biện pháp tối ƣu cho việc giải mã trình tự
vừa chính xác, vừa tiết kiệm thời gian
34

CÁC HƢỚNG KHẮC PHỤC



Giải pháp 1: Mô hình huy động quỹ cộng đồng




Giải pháp 2: Mô hình hỗ trợ cá nhân

35

Giải pháp 1: Mô hình huy động quỹ
cộng đồng
Phân chia genome thành các “khúc” (chunks) lớn
hơn theo thứ tự nhất định  PP shotgun
 Những khúc đã được sắp xếp cầu thành 1 bản
đồ vật lý của bộ genome.
 Đặt những khúc vào thứ tự (bản đồ vật lý) sẽ tạo
nên điểm cốt yếu của thời gian
 Quay lại điểm này sau khi giải mã
 Ƣớc lƣợng chi phí: mất 1000 ngƣời làm việc
trong vòng 30 năm = 3 tỷ US dollars


36

12


3/25/2014

Mô hình phân chia và kết hợp

37

Mô hình cộng đồng cho việc giải mã

trình tự Genome ngƣời


BƢỚC I: Cung cấp 1 bản đồ vật chất của
genome



BƢỚC II: Trình diễn (perform) các phản ứng
giải mã trình tự



BƢỚC III: Kết hợp các phân mảnh/miếng
(piece) trình tự với nhau

38

Bản đồ vật lý



Bộ genome người –3.3 gigabase (Gb) (3.3 x 109
bp)
Mỗi NST quá lớn để quan sát và phân tích trình
tự
Khởi đầu genome phải được phân đoạn thành các
miếng/mảnh nhỏ hơn, có thể quan sát và phân tích
trình tự
 Làm bất tử các phân mảnh – tạo nên các nguồn

nguyên liệu vô tận
 Tạo nên 1 bản đồ vật chất để kết hợp những mảnh
nhỏ lại với nhau để xây dựng bản đồ gene.


39

13


3/25/2014

Ứng dụng đang thực hiện

40

Sự phân đoạn



Quyết định trong việc phát sinh ra các đoạn
DNA lặp (overlapping)
Nguyên liệu khởi đầu là hàng triệu bản sao của
mỗi NST
– Sự phân cắt bằng enzyme cắt hạn chế (RE
disgestion)
– Sự dịch chuyển cơ học (Mechanical shearing)
– Sự phân mảnh NST (Chromosomal
separation)
41


Sự phân đoạn
Enzyme cắt hạn chế (RE Digestion)
 Phân cắt bằng enzyme cắt hạn chế (RE): mục
tiêu là cung cấp các phân mảnh 10-150 kbase,
các RE có chiều dài khác nhau:
–Nhóm RE 4-base cắt 1 lần khoảng 256
bases/trình tự
–Nhóm RE 6-base cắt 1 lần khoảng 4096
bases/trình tự
–Nhóm RE 8-base cắt 1 lần khoảng 65
kbases/trình tự
 Tuy nhiên, trong thực tế, các phần cắt mảnh
DNA chủ yếu chỉ dùng nhóm RE 4 base.

42

14


3/25/2014

Sự phân đoạn

43

Sự phân đoạn









Sự chia cắt vật chất ở NST thường sử dụng
FACS (máy phân đoạn các tế bào hoạt động gắn
huỳnh quang – Fluorescent Active Cell Separator)
Vạch đích huỳnh quang gắn vào NST & số lượng
vạch đánh dấu đích cân xứng với kích cỡ của
NST
Các giọt nhỏ giọt, mỗi loại chứa 1 NST di chuyển
qua các đầu điện cực. Sự di chuyển điện cực phổ
biến thành các giọt nhỏ nếu đủ tiêu chí về kích cỡ
ở vạch nhuộm đích (dye)
Một số giọt nhỏ có thể bị lệch và chia cắt từ 1 số
NST khác.
44

Bất tử các phân mảnh


Bằng việc xây dựng 1 ngân hàng genome
– Đặt mỗi phân mảnh DNA vào trong 1 sợi DNA ở
cơ thể VSV trong phòng thí nghiệm
– Một phân mảnh/1 Vi khuẩn
– Phân lập mỗi loại VSV
– Có 1 quá trình chuẩn bị thuần cho mỗi phân
mảnh
– Có thể phát triển vi khuẩn trong mỗi môi trường

nuôi cấy để cung cấp 1 số lượng lớn các phân
mảnh đó
45

15


3/25/2014

Cloning

46

Cloning

Mỗi đoạn DNA có thể đƣợc phân lập bằng cách cấy đĩa
mỗi loại vi khuẩn riêng lẻ. Thực tế, mỗi phân mảnh đƣợc
mã hóa (số hóa) cho việc theo dõi thuận tiện hơn.
47

Tìm kiếm các đoạn lặp


Đòi hỏi một số cách tính toán trình tự của mỗi
đoạn phân mảnh



Sử dụng quá trình cắt hạn chế (Restriction
digest)




Xử lý qua điện di các phân mảnh (gel agarose)

48

16


3/25/2014

Gel điện di agarose
đƣợc sử dụng để
chia cắt phân đoạn
của DNA dựa vào
kích cỡ (size). Các
đoạn lặp sẽ có 1 số
vạch chung trên
các giếng khác
nhau.

49

Mô hình hỗ trợ cá nhân


Kế hoạch giải mã trình tự toàn bộ bộ genome bằng
PP Shotgun




Bỏ qua giai đoạn lập bản đồ vật chất & di truyền



Phân mảnh bộ genome, giải mã trình tự rất nhiều
mảnh 500 bp sau đó cố gắng đặt chúng lại với
nhau.



Sử dụng 1 phát minh mới –mô hình các cặp bạn bè
(mate-pair) và mô hình khung giáo (scaffold)
50

Mô hình “Mate-Pair” và “Scaffold”





Mã hóa 1 mảnh thông tin bổ sung bằng cách đọc
các khoảng cách chính xác giữa các cặp trình tự
Genome được phân mảnh thành các đoạn lặp đã
biết được chiều dài như
–2 kbase
–10 kbase
–50 kbase
–150 kbase

Giải mã trình tự cả 2 đầu của các đoạn phân mảnh
DNA
51

17


3/25/2014

Mô hình Shotgun thông thƣờng


Ngẫu nhiên phân mảnh và giải mã đoạn DNA
500 bp, và xác định các đoạn lặp



Mỗi nhóm của phân đoạn lặp sẽ đƣợc gọi là 1
đoạn tiếp giáp (contig)= 1 phân mảnh liền kề
của trình tự DNA

52

Mô hình Shotgun qua Mate-Pair
 Phân mảnh các sợi
DNA thành các đoạn lặp
giống hệt nhau về kích
thước và trọng lượng
(VD: 50 kbase)
 Các đoạn phân mảnh

giống hệt nhau về chiều
dài và trọng lượng như
anh em nên được gọi là
“Mate-Pair”
53

Mô hình Shotgun

Mỗi nhóm đoạn tiếp giáp riêng lẻ có thể có
các phân đoạn “bạn bè” bởi vì cả 2 đầu của mỗi
đoạn DNA 50 kb đều đƣợc giải mã trình tự.
54

18


3/25/2014

Mô hình giàn khung (Scafffold)

 Scaffold thay thế cho việc lập bản đồ vật chất – do quy trình
thực hiện nhanh hơn. Về lý thuyết, chúng ta có thể kết nối thành bộ
gen hoàn chỉnh từ các trình tự giải mã sử dụng mô hình giàn khung
 Trình tự bộ genome cuối cùng được kết nối hướng về việc chứa
các đoạn khoảng trống (gaps) đầu tiên bởi các trình tự lặp. Mô hình
kết hợp sẽ giúp cho việc bù đắp các đoạn gaps
 Vì thế, mô hình hỗ trợ cá nhân sẽ sử dụng thông tin bản đồ vật
chất được thiết kế trong mô hình gây quỹ cộng đồng để giúp cho
việc bù đắp các đoạn gap.


55

Mô hình giàn khung (Scafffold)




Các đoạn tiếp giáp có thể gia nhập nhóm DNA bạn bè
nên được gọi là mô hình nhóm bạn bè (Mate-pairs)
hướng theo và đặt các nhóm tiếp giáp liên quan với
các nhóm khác.
Khi ngày càng nhiều cặp bạn bè (mate-pair) được so
sánh, 1 mô hình giàn khung (scaffold) từ từ được xây
dựng.

56

Mất bao lâu?



Dự đoán đầu tiên: 30 năm
Với các ứng dụng KHKT hiện nay với máy giải mã trình
tự tự động (automated sequencer) và bỏ qua việc tìm
hiểu bản đồ vật lý cho bộ genome người hoàn chỉnh
 Một robot giải mã trình tự ở phòng TN có thể giải mã
trình tự 4.96 x 106 bases mỗi ngày
 Bộ genome người 3.3 x 109 bases NHƯNG cần sự
đảm bảo độ bao phủ nên phải được 3.3 x 1010 bases
 Tốn mất 6,653 ngày cho 1 phòng thí nghiệm = 18 năm

 Xây dựng 20 phòng thí nghiệm có quy mô như PTN
trên
 Giải mã toàn bộ bộ genome chỉ mất khoảng 330 ngày
57

19


3/25/2014

Các hƣớng giải quyết mới
Một nhà máy giải mã trình tự tự động hóa

58

Tài liệu tham khảo

/>
/>
59

KẾT THÚC CHƢƠNG V

THANK YOU FOR YOUR ATTENTION!
60

20




×