Tải bản đầy đủ (.pdf) (19 trang)

TIỂU LUẬN CUỐI kì môn DI TRUYỀN VI SINH vật tên CHỦ đề TRÌNH tự lặp lại có KHẢ NĂNG mã HOÁ

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.23 MB, 19 trang )

ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN

BÀI TIỂU LUẬN CUỐI KÌ
MƠN: DI TRUYỀN VI SINH VẬT

TÊN CHỦ ĐỀ: TRÌNH TỰ LẶP LẠI CĨ KHẢ NĂNG MÃ HỐ

GVHD: PGS.TS. Phan Thị Phượng Trang

Thành viên nhóm
Trương Thị Kim Ngân
Phan Thị Ngọc
Hà Ý Khánh Nguyên

Tp. Hồ Chí Minh, ngày 19 tháng 7 năm 2021

1

18150210
18150218
18150220


MỤC LỤC
I . Retrons ở vi khuẩn..............................................................................................................3
I.1. Lịch sử phát hiện Retrons vi khuẩn..........................................................................3
I.2. Con đường sinh tổng hợp msDNA............................................................................6
I.4. Chức năng sinh học msDNA......................................................................................8
II . Locus CRISPR..................................................................................................................8
II.1 Cấu trúc điển hình của một locus CRISPR.............................................................8


II.2 Nguồn gốc của các trình tự đệm.............................................................................10
II.3 Hệ thống miễn dịch CRISPR...................................................................................10
II.4. Sự hình thành của một đơn vị CRISPR mới........................................................11
II.5. Mơ hình đơn giản hoá cho hoạt động của CRISPR.............................................13
II.6. Hoạt động Endoribonuclease của protein Cas6 ở Pyrococcus furiosus..............13
II.7. CRISPR cung cấp khả năng miễn dịch ở sinh vật nhân sơ.................................14
II.8. CRISPR- Cas9 – công cụ chỉnh sửa gene phổ biến hiện nay...............................16
Tài liệu tham khảo.................................................................................................................19

2


I . Retrons ở vi khuẩn
I.1. Lịch sử phát hiện Retrons vi khuẩn
Retrons là các trình tự DNA riêng biệt mã hố cho một enzyme phiên mã ngược (Reverse
Transcriptase, kí hiệu: RT) tương tự như các RT được tạo ra bởi các retrovirus và các loại
retroelements khác. DNA Retron thường được liên kết với DNA prophage và được tìm thấy
trong bộ gen của nhiều loại vi khuẩn khác nhau. Retron RT được sử dụng để tổng hợp một
DNA vệ tinh lạ được gọi là msDNA. msDNA thực tế là một phức hợp của DNA, RNA và
có thể là protein. Nó được cấu tạo bởi một DNA sợi đơn nhỏ , được liên kết với một phân
tử RNA sợi đơn nhỏ. Phần cuối 5’ của phân tử DNA được nối với phần dư guanosine bên
trong của phân tử RNA bằng liên kết phosphodiester 2’ -5’ duy nhất . msDNA được tạo ra
với hàng trăm bản sao trên mỗi tế bào, nhưng chức năng của nó vẫn chưa được biết đến.
Mặc dù retrons khơng có trong bộ gen của hầu hết các thành viên của quần thể vi khuẩn có
liên quan , nhưng retrons có thể khơng hồn tồn là DNA lành tính. Các bằng chứng đang
bắt đầu cho thấy rằng các phần tử retron có thể tạo ra những tác động nhỏ nhưng có khả
năng gây ảnh hưởng lớn đến tế bào chủ. Điều này bao gồm việc tạo ra các bản sao lặp lại
của trình tự msDNA trong bộ gen và làm tăng tần số xuất hiện đột biến. Bởi vì những sự
kiện này liên quan đến retron RT, điều này có thể đại diện cho một nguồn phiên mã ngược
trong tế bào vi khuẩn. Do đó, q trình phiên mã ngược, một lực ảnh hưởng đến nội dung

và cấu trúc của hầu hết các bộ gen sinh vật nhân chuẩn , cũng có thể là nguyên nhân dẫn
đến những thay đổi trong một số bộ gen nhân sơ.[1]
msDNA được phát hiện lần đầu tiên trong vi khuẩn myxobacterium, Myxococcus xanthus
và là tên viết tắt của DNA sợi đơn đa sao chép (multi-copy single-stranded DNA). Thật
vậy, phân tử msDNA được tạo ra bởi vi khuẩn này , được kí hiệu là msDNA-Mx162, chứa
một phân tử DNA sợi đơn gồm 162 nucleotide và có tới 500 đến 700 bản sao được tạo ra
trên mỗi tế bào. Tuy nhiên, từ các thí nghiệm đơn giản, chẳng hạn như sự không ổn định
của các phân tử được đánh dấu 5’ khi tiếp xúc với natri hydroxit và sự thay đổi tính linh
động điện di của phân tử sau khi xử lý với RNase, người ta nhanh chóng nhận ra rằng RNA
liên kết với msDNA. Trên thực tế, ARN được liên kết cộng hóa trị với phân tử ADN sợi
đơn bằng liên kết phosphodiester 2’-5’ duy nhất.[1]

3


Một msDNA, được chỉ định là
msDNA-Ec73, từ E.coli, mô phỏng
cấu trúc nhánh bất thường của
msDNA cũng như các cấu trúc được
bảo tồn khác của phân tử vệ tinh này
(Hình 1). Đầu tiên, msDNA-Ec73
chứa một chuỗi đơn DNA gồm 73
nucleotide có thể gấp lại thành một
cấu trúc mạch vòng dài, ổn định.
Trong số hàng chục msDNA đã
được đặc trưng từ vi khuẩn, tất cả
đều chứa một DNA sợi đơn (từ 48
đến 165 nucleotide) được cho là có
thể gấp lại thành một cấu trúc bậc
hai ổn định. Liên kết cộng hoá trị với

đầu 5’ của phân tử DNA này là một
sợi đơn của RNA (trình tự đóng hộp
trong Hình 1). Có nghĩa là, tại một
phần dư guanosine cụ thể ở giữa sợi
RNA, phân tử DNA được nối với vị
trí 2’ của phần dư guanosine này của
RNA. Do đó, msDNA là một phân
tử duy nhất có chứa liên kết 2’ -5’
phosphodiester giữa các sợi RNA và
DNA. Liên kết nhánh trong phân tử
RNA luôn xảy ra ở phần dư G cụ thể
bên trong thường nằm trong trình tự
AGC. Cấu trúc được bảo tồn cuối
cùng trong msDNA là một vùng
ngắn của sự bắt cặp cơ sở giữa đầu
3’ của sợi DNA và 3’ cuối của chuỗi
RNA (Hình 1). Ngồi các cấu trúc
thứ cấp được bảo tồn này, trình tự
nucleotide cơ bản của cả phân tử
DNA và RNA thường rất khác nhau
giữa hai msDNA khác nhau. Có
những nhóm retrons liên quan tạo ra
msDNA với một số mức độ tương tự
trình tự sơ cấp.[1]
Hình 1. Cấu trúc của msDNA. msDNA, ví dụ msDNA-Ec73, là một DNA có trọng lượng
phân tử nhỏ (mũi tên màu trắng trong ảnh) dễ dàng quan sát được sau khi điện di trên gel
4


các chiết xuất DNA plasmid từ E.coli. MsDNA này bao gồm một phân tử RNA 76

nucleotide ( trình tự đóng hộp ) được nối với một phân tử DNA mạch đơn 73 nucleotide.
Đầu 5’ của chuỗi DNA được nối, thông qua liên kết 2’,5’ phosphodiester, với một gốc
guanosine cụ thể của phân tử RNA (khoanh tròn G). Cả chuỗi RNA và chuỗi DNA đều gấp
lại thành cấu trúc mạch vòng ổn định. Một số msDNA bị thay đổi (xử lý) sau khi chúng
được tổng hợp. Ví dụ, khoảng 16 nucleotide được cắt khỏi đoạn 5’ cuối của chuỗi RNA
trong msDNA-Mx162 từ M. xanthus, dẫn đến một dạng msDNA trưởng thành với một
phân tử RNA nhỏ hơn. Tương tự như vậy, đối với một số msDNA, toàn bộ chuỗi RNA bị
loại bỏ (cũng như 4 nucleotide từ đầu 5’ của phân tử DNA) bởi sự phân cắt endonucleolytic
ở đầu 5’ của sợi DNA. [1]
Các cấu trúc thứ cấp được bảo tồn trong msDNA, liên kết nhánh , các vòng thân gấp khúc,
và vùng lai RNA-DNA hiện diện do cách thức tổng hợp msDNA. Tuy nhiên, sau khi tổng
hợp hoàn tất, trong một số retrons, msDNA được sửa đổi thêm. Ví dụ, msDNA- Mx162 từ
M. xanthus ban đầu được tổng hợp với một phân tử RNA 77 base nối với phân tử DNA 162
base. Tuy nhiên, dạng tiền thân này sau đó được chuyển đổi thành dạng msDNA trưởng
thành nhỏ hơn bằng cách loại bỏ 16 nucleotide từ đầu 5’ của chuỗi RNA. Đối với một số
phần tử retron , quá trình xử lý sau sản xuất msDNA dẫn đến việc loại bỏ hoàn toàn toàn bộ
phân tử RNA bao gồm cả cấu trúc nhánh. Ví dụ, trong trường hợp msDNA-Ec83 (từ
E.coli), sự phân cắt endonucleolytic của phân tử DNA giữa nucleotide thứ tư và thứ năm
loại bỏ chuỗi RNA 84 base cộng với bốn deoxyribonucleotide tham gia vào đoạn G phân
nhánh. Điều này dẫn đến một msDNA trưởng thành chỉ bao gồm một phân tử DNA sợi đơn
. Có một số suy đốn rằng msDNA này có thể có hoạt động tự xúc tác hoặc retron RT có
thể chịu trách nhiệm cho sự phân cắt của phân tử DNA trong quá trình xử lý . Tuy nhiên,
khơng rõ nguồn gốc của hoạt động endonuclease này. Dường như có một nhóm các yếu tố
retron có liên quan đến phát sinh lồi tạo ra các msDNA trưởng thành, msDNA không
mang RNA . Chúng bao gồm Ec78 và Ec83 từ E.coli, Vc 95 từ Vibrio cholerae và St85 từ
Salmonella typhimurium. Các msDNA được tạo ra bởi các retrons này cũng có vẻ giống
nhau ở một mức độ nào đó về độ giống nhau của nucleotide sơ cấp trong các phân tử DNA
và RNA của chúng.[1]
Một khía cạnh cuối cùng của cấu trúc msDNA . msDNA ban đầu được phát hiện vì nó
giống như một dải DNA vệ tinh nhỏ nhưng nổi bật sau khi điện di trên gel tổng số DNA

được tách chiết từ các tế bào M. xanthus. Tuy nhiên, trong tất cả các khả năng msDNA có
thể tồn tại ngồi nhiễm sắc thể như một phức hợp nucleoprotein trọng lượng phân tử lớn
bao gồm nhiều bản sao của msDNA liên kết với các thành phần protein. Chắc chắn, retron
RT rất có thể là protein chính liên kết với msDNA trong phức hợp này. Khi RT từ retronEc67 được tinh chế, nó đồng phân đoạn với msDNA như một phức hợp trọng lượng phân
tử lớn. Các protein khác, do tế bào chủ tạo ra, cũng có thể liên kết với phức hợp msDNA.
Ví dụ, RNase H do tế bào chủ tạo ra có thể liên kết với msDNA, ít nhất là trong thời gian
ngắn, vì nó dường như tham gia vào q trình tổng hợp msDNA. Ngoài ra, các protein sửa

5


chữa khớp sai như MutS, do tế bào chủ tạo ra, cũng có thể nhận ra và liên kết với msDNA.
[1]
I.2. Con đường sinh tổng hợp msDNA
msDNA về cơ bản là một bản sao cDNA, được tạo ra bằng cách phiên mã ngược , của một
vùng ngắn của khuôn mẫu mRNA. Tuy nhiên, đối với msDNA, một phần của khuôn mẫu
RNA không được phiên mã ngược và vẫn liên kết với cDNA sau quá trình phiên mã ngược.
Liên kết 2’ -5’ duy nhất trong msDNA được tạo ra bởi retron RT để bắt đầu tổng hợp
cDNA. Ở đây, nhóm 2’ -OH của một gốc guanosine đặc biệt trong khuôn mẫu RNA được
sử dụng để bắt đầu quá trình tổng hợp cDNA. Do đó, một vùng của bản sao mRNA mã hóa
các locus msr-msd đóng vai trị vừa là đoạn mồi vừa là khuôn mẫu để tổng hợp cDNA bởi
RT.
Trước khi tổng hợp msDNA có thể bắt đầu phiên mã RNA của vùng msr-msd của DNA
retron phải được tạo ra để đóng vai trị là mồi và khn mẫu để phiên mã ngược. RNA mẫu
mồi này có nguồn gốc từ bản phiên mã mRNA dài hơn của operon retron msr-msd-ret được
mô tả trước đó. Điều quan trọng để bắt đầu tổng hợp cDNA là khả năng của RNA mẫu để
gấp thành một cấu trúc thứ cấp cụ thể. Cấu trúc thứ cấp cụ thể này cho phép RNA khuôn
mồi bắt đầu tổng hợp cDNA bởi retron RT. Gấp RNA phân tử được trung gian bằng cách
bắt cặp bazơ nội phân tử giữa hai trình tự lặp lại đảo ngược trong RNA, được chỉ định là a1
và a2. Cấu trúc thân cây do đó hình thành, cùng với các vịng cuống, dường như liền kề với

một guanosine đặc biệt bên (được gọi là phân nhánh G) trong RNA gấp lại để nhóm 2'-OH
của G phân nhánh này có thể đóng vai trị là mồi để bắt đầu tổng hợp cDNA. Retron RT
nhận biết và liên kết với cấu trúc vòng đặc hiệu trong RNA khuôn mẫu mồi cùng với phân
nhánh G được định vị đúng vị trí ở cuối cấu trúc thân a1-a2. Điều này cho phép RT sử dụng
2'-OH của sự phân nhánh G làm mồi để bắt đầu tổng hợp cDNA.
Sau khi hình thành liên kết 2'-5 'phosphodiester với deoxyribonucleotide đầu tiên (dNTP),
việc kết hợp các dNTPs theo hướng khuôn mẫu tiếp theo xảy ra theo cách thông thường để
tiếp tục tổng hợp cDNA. Kết hợp chặt chẽ với sự mở rộng của phân tử cDNA là việc loại
bỏ khuôn mẫu RNA trễ nhờ hoạt động RNase H, dường như được cung cấp bởi tế bào chủ.
Tại một vị trí cụ thể trên RNA, q trình trùng hợp khn mẫu cDNA và q trình loại bỏ
khn mẫu RNA qua trung gian RNase H dừng lại, dẫn đến phân tử msDNA được hình
thành. Đó là, một phân tử cDNA ngắn liên kết cộng hóa trị với phần cịn lại của phân tử
RNA đóng vai trị như một khn- mồi cho sự tổng hợp của nó.[1]

6


Hình 2. Tổng hợp msDNA.
Sau khi phiên mã operon
retron msr -msd-ret, một
phần nhỏ của mRNA đóng
vai trị là khn mẫu và
mồi để tổng hợp bản sao
cDNA của vùng msd bằng
cách phiên mã ngược. Việc
gấp RNA thành một cấu
trúc bậc hai cho phép nhóm
2’-OH của phần gốc G
phân nhánh (G nằm trong
I.4. Chức năngmột

sinhvịng
học trịn với nhóm 2’
-OH được hiển thị bằng
msDNA
đường ngắn) để dùng
Chức năng củamột
retrons
như
mộtvẫn
đoạn mồi để bắt
cũng như của msDNA
hợp cDNA bởi
chưa được xác đầu
định tổng

retroncứuRT. Sau khi tổng
ràng. Nhiều nghiên
hợp cDNA
cũng đã chỉ ra retrons
liên (đường đứt nét)
hồn
tất,
quan đến cơ chế phịng vệ một phần của
bảo vệ vi khuẩnkhuôn
chốngmẫu
lại RNA được nối
với phage.
đầu 5’ của phân tử
sự xâm nhiễm của
cDNA

để tạo ra msDNA.
[10]
[1]
II . Locus CRISPR
Hệ thống CRISPR-Cas
bao gồm các trình tự lặp
lại Palindromic ngắn xen
kẽ thường xuyên và các
protein Cas liên kết. Hệ
thống này tồn tại ở sinh
vật nhân sơ, khoảng một
nửa số vi khuẩn và hầu hết các vi khuẩn cổ. Những trình tự này hình thành từ các đoạn
DNA của những thể thực khuẩn (bacteriophage) từng tấn cơng vào sinh vật nhân sơ đó.
Chúng được dùng để phát hiện và phá hủy DNA của những loại thực khuẩn tương tự trong
các lần tấn công về sau. Do đó, chúng đóng vai trị quan trọng trong hệ thống phòng thủ của
sinh vật nhân sơ. Định nghĩa chuỗi CRISPR được phát hiện năm 1987 ở E.coli bởi Ishino

7


và cộng sự. Qua quan sát thấy có 14 lần lặp của 29 bp (base pair) được xen kẽ với trình tự
đệm (spacer) 32-33 bp khơng lặp lại và nằm cạnh gene iap (isozyme-converting alkaline
phosphatase). Năm 2005, các nghiên cứu báo cáo rằng spacer thường bao gồm plasmid
hoặc DNA của phage, và cho rằng CRISPR là hệ thống phòng thủ chống lại DNA của
phage và plasmid xâm nhập (hệ thống miễn dịch bắt buộc). Qua các phân tích đánh giá,
phát hiện ra rằng CRISPR được tìm thấy ở xấp xỉ 40% trình tự bộ gen vi khuẩn và 90%
trình tự bộ gen vi khuẩn cổ.
II.1 Cấu trúc điển hình của một locus CRISPR
Chuỗi CRISPR và CAS gene cùng nhau tạo nên một hệ thống CRISPR có tính đa dạng
giữa các lồi vi sinh vật. Kích thước của đoạn repeat đa dạng từ 24-47 bp. Kích thước đoạn

spacer từ 26-72 bp. Số lượng đoạn repeat trên mỗi chuỗi có thể đa dạng từ 2 đến 249 (được
ghi nhận ở Verminephrobacter eiseniae). Nhiều bộ gen bao gồm một locus CRISPR đơn,
riêng ở M.jannaschii có 18 locus. Cuối cùng, ở một vài hệ thống CRISPR chỉ có 6 gene
CAS hoặc ít hơn, những hệ thống khác có tới hơn 20.
Repeat: Trong một chuỗi đơn, đoạn repeat hầu như giống nhau về kích thước và trình tự.
Mặc dù có sự đa dạng giữa các lồi, repeat có thể hình thành các nhóm, dựa trên sự tương
đồng về trình tự, chia thành 12 nhóm chính. Một số nhóm lớn bao gồm một đoạn
palindrome (5-7 bp). Các trình tự palindrome này được dùng để tạo cấu trúc RNA thứ cấp
stem-loop. Giả thuyết này được ủng hộ nhờ sự hiện diện của đột biến trong đoạn repeat
giúp duy trì cấu trúc và sự quan sát thấy chuỗi repeat- spacer được phiên mã thành RNA.
Spacer: Trong bất kì hệ thống CRISPPR nào, spacer thường là duy nhất, ngoại trừ trường
hợp xảy ra lặp đoạn spacer. Qua so sánh tương dồng của các hệ thống CRISPR đa dạng, chỉ
ra rằng nhiều spacer thường có trình tự giống với phage và các yếu tố di truyền ngồi.
Leader: Một trình tự lên tới 550 bp có vị trí ở đầu 5’ trong hầu hết các locus CRISPR, liên
kết trực tiếp với đoạn repeat đầu tiên. Trình tự này được kí hiệu là ‘leader’ và thường xuyên
giàu AT. Tương tự đoạn repeat, đoạn leader thiếu khung đọc mở (open reading frame) và
không bảo tồn giữa các loài. Tuy nhiên, một vài locus CRISPR được tìm thấy ở các nhiễm
sắc thể giống nhau có trình tự leader có thể được bảo tồn. Một đơn vị repeat-spacer mới hầu
như luôn được chèn vào giữa đoạn leader và đơn vị có trước, đoạn leader có thể là vùng
nhận diện cho việc thêm đoạn spacer. Đoạn leader cũng có thể đóng vai trị là promoter cho
q trình phiên mã CRISPR.
CAS genes: Hệ thống CRISPR có thể được phân loại thành 7 hoặc 8 subtype (kiểu phụ),
mỗi kiểu phụ bao gồm 2-6 CAS gene đặc hiệu khác nhau. Thêm vào đó, 6 lõi CAS gen
(Cas1-6) được liên kết với nhiều subtype đa dạng. Gene Cas1 (NCBI COGs database code:
COG1518) đặc biệt đáng chú ý, hoạt động như một marker đánh dấu phổ biến của hệ thống
CRISPR (liên kết với tất cả các hệ thống CRISPR, ngoại trừ Pyrococcus abyssii). Các gen
được thêm vào liên kết lỏng lẻo với CRISPR, cũng như các thành viên của họ protein liên
kết bí ẩn với đoạn repeat (RAMP), chỉ xảy ra ở bộ gen có bao gồm hệ thống CRISPR,
nhưng khơng cần thiết nằm gần CRISPR. Các miền chức năng cụ thể được xác định trong
8



protein Cas bao gồm các miền endonuclease và exonuclease, helicase, các miền liên kết
RNA và DNA, và các miền liên quan đến điều hịa phiên mã.[4]

Hình 3. Một locus (vị trí) CRISPR cấu thành từ các đoạn lặp (repeats) dài 21 đến 48 bp xen
kẽ bởi các trình tự dài 26 đến 72 bp gọi là các đoạn đệm (spacers). Trong một locus thì kích
thước của đoạn lặp và đoạn đệm rất ổn định. Mỗi locus CRISPR được đặc trưng bởi trình
tự của đoạn lặp điển hình trong locus đó. Một locus CRISPR chỉ chứa các đoạn lặp và các
đoạn đệm, khơng có khung đọc mở (open reading frame). Thường thì trong một locus
CRISPR, hầu hết các đoạn lặp có tính palindromic một phần (nghĩa là một phần trình tự
xi và ngược giống nhau), dẫn đến khả năng hình thành nên cấu trúc thứ cấp ổn định cao.
CRISPR thường nằm trong nhiễm sắc thể, nhưng cũng có trường hợp nằm trong plasmid.
Hệ thống của một locus CRISPR bao gồm leader region (là trình tự đánh dấu sự bắt đầu của
một CRISPR array; CRISPR array là trình tự bao gồm các đoạn đệm và lặp) dài từ 20 đến
534 bp. CRISPR array được phiên mã do một promoter nằm trong leader region. Ngồi ra,
ln tìm thấy vài gen đi kèm CRISPR (CRISPR-associated – Cas) ở vùng lân cận, tạo
thành hệ thống CRISPR-Cas (bao gồm locus CRISPR và các gen Cas lân cận). Một hệ
thống CRISPR-Cas thường gồm 4 đến 20 gen cas khác nhau. Các gen cas mã hóa một họ
protein lớn và đa dạng có các domain điển hình của nuclease, helicase, polymerase và các
protein gắn polynucleotide. Các gen cas này có thể nằm ở phía thượng nguồn hay hạ nguồn
của vùng lặp/đệm.[4]
II.2 Nguồn gốc của các trình tự đệm
Vùng đệm nguồn gốc từ những trình tự tồn tại trước đó: Bộ nhiễm sắc thể của vật liệu di
truyền có thể truyền được thể thực khuẩn hoặc plasmid liên hợp. Bất kỳ DNA ngoài nhiễm
sắc thể nào cho dù là bên trong hay bên ngồi vùng nhân đều khơng thể sát nhập vào các
đoạn đệm. Các điểm tương đồng cao nhất với một trình tự đệm nhất định được tìm thấy
trong các yếu tố di truyền của các chủng có liên quan chặt chẽ với trình tự đệm đó.
Các trình tự đệm bắt nguồn từ các yếu tố đó có Khoảng 65% vùng đệm tương đồng với
trình tự ở phage và plasmid tiếp hợp, và 35% cịn lại giống trình tự bộ nhiễm sắc thể vi

khuẩn.
Qua nhiều tìm hiểu trình tự đệm không liên quan trực tiếp đến DNA ngoại lai. Điều này tỷ
lệ DNA nhiễm sắc thể rất có thể được đánh giá quá cao. Thực tế là chỉ có 88 trình tự đệm
trong số khoảng 4500. Các đặc điểm nhận dạng quan trọng đã được thăm dị có thể được

9


hiểu là chỉ ra một lượng lớn các yếu tố di truyền không được xác định trong tự nhiên.
Trường hợp của S. pyogenes SF370 là đặc biệt. Tám trong số chín trình tự đệm cho thấy
hơn 90% sự đồng nhất với các trình tự bên trong các prophage khác, cho thấy bảo tồn trình
tự của các gen tương ứng giữa các phage. Đồng thời, gợi lên sự liên quan về chức năng đối
với các gen được nhắm mục tiêu bằng các trình tự đệm.
Các trình tự đệm thể hiện sự tương đồng với gen của phage hoặc plasmid bao gồm các chức
năng: chuyển plasmid; sao chép DNA; lắp ráp phage ; bảo vệ DNA chống lại sự hạn chế;
sao chép phân vùng; tổng hợp phage; phân giải bản sao; vận chuyển hoặc tích hợp phage và
sự cắt bỏ. [2]
II.3 Hệ thống miễn dịch CRISPR
Khi bị nhiễm DNA virus thông qua phage hoặc thông qua sự chuyển gene, phức hợp
protein cas sẽ cắt một đoạn DNA virus tạo thành đoạn spacer và chế biến tạo nên một đơn
vị repeat-spacer, sau đó tiến hành chèn một đơn vị repeat-spacer vào chuỗi CRISPR. Như
vậy, vi khuẩn sẽ có khả năng miễn dịch với sự xâm nhiễm của virus vào lần sau.
Chuỗi CRISPR sẽ phiên mã tạo ra pre-crRNA, phức hợp protein cas sẽ tiến hành chế biến
pre-crRNA tạo thành các đơn vị cr-RNA. Các đơn vị crRNA này kết hợp với phức hợp
protein cas bắt cặp bổ sung với DNA virus có mang proto-spacer và PAM. Khi khơng có
trình tự PAM trong chuỗi CRISPR sẽ ngăn cản khả năng tự miễn dịch của vi khuẩn

10



Hình 4. Hoạt động của hệ thống CRISPR / cas diễn ra theo bốn bước: Bước 1. Các bộ đệm
tương ứng với các đoạn DNA từ một thể thực khuẩn hoặc một nguồn khác được kết hợp
vào CRISPR. Ít được biết về q trình này. Tuy nhiên, nó được cho là liên quan đến các
protein Cas1 và Cas2. Ngoài ra, các bộ đệm mới được thêm vào ở đầu cuối của chuỗi
CRISPR. (HÌNH A). Bước 2. Các locus CRISPR phải được phiên mã thành pre-crRNA.
Một chuỗi khơng mã hóa ở đầu CRISPR, giàu adenine và thymine, hoạt động như một chất
xúc tiến cho mục đích này. Bước 3. Pre-crRNA sau đó phải được xử lý thành crRNA. Mỗi
đoạn crRNA bao gồm một đoạn đệm đơn giữa hai nửa lần lặp lại. Bước 4. Sau khi xử lý,
crRNA được sử dụng để vơ hiệu hóa vật liệu di truyền ngoại lai.[9]
II.4. Sự hình thành của một đơn vị CRISPR mới
Cas1 là một loại protein có tính bảo tồn cao, được tìm thấy ở tất cả 6 loại CRISPR. Cas1
tương tác với Cas2 để tạo thành phức hợp giúp gắn chèn các đoạn spacer. Phức hợp
heterohexameric [(Cas12-Cas2)2] bao gồm vùng liên kết với proto-spacer và vùng còn lại
liên kết với chuỗi CRISPR.[5]
Khi đã có spacer, phức hợp Cas1-Cas2 xúc tác 2 phản ứng cắt-nối. Phản ứng thứ nhất tại
đầu leader của đoạn repeat đầu tiên của chuỗi CRISPR, phản ứng thứ hai tại đầu spacer của
đoạn repeat. Sản phẩm tạo ra có đầu 3’ của dsDNA proto-spacer liên kết với ssDNA của
đoạn repeat. Những chỗ còn trống của ssDNA repeat sẽ được tổng hợp nhờ DNA
polymerase và nối lại. Kết quả là spacer mới được chèn vào chuỗi CRISPR và đoạn repeat
được nhân đôi.[5]

11


Hình 5. Sơ đồ minh hoạ quá trình chèn đoạn spacer vào chuỗi CRISPR [5]
II.5. Mơ hình đơn giản hố cho hoạt động của CRISPR
Chuỗi repeat-spacer được phiên mã thành đoạn RNA dài, và đoạn repeat tạo thành cấu trúc
bậc 2. Cas protein nhận diện trình tự và cấu trúc đoạn repeat và biến đổi RNA tạo thành
nhiều đoạn sRNA (small RNA), mỗi đoạn sRNA bao gồm một đoạn spacer và hai nửa của
đoạn repeat ở hai đầu. sRNA sẽ kết hợp với Cas protein, bắt cặp bổ sung với các nucleic


12


acid của phage và phá huỷ chúng. Quá trình này có sự tham gia bởi một hoặc nhiều Cas
protein. [4]

Hình 6. Mơ hình đơn giản hố cho hoạt động của CRISPR [4]

II.6. Hoạt động Endoribonuclease của protein Cas6 ở Pyrococcus furiosus
Hình 7. A .Sản phẩm được phiên mã từ chuỗi CRISPR sẽ được Cas6 phân cắt tại vùng
repeat để tạo thành các đoạn crRNA, các đoạn crRNA tiếp tục được cắt bỏ đi 3’. B. Mơ
hình một crRNA hồn chỉnh bao gồm đi 5’ tag có nguồn gốc từ đoạn repeat của tế bào
chủ (8 nucleotide) và tồn bộ trình tự chỉ đường (Guide sequence, 37 nucleotide) có nguồn
gốc từ virus xâm nhiễm. C. Cas6 là một endoribonuclease rất quan trọng cho sự hình thành
của crRNA. Cas6 tương tác với vùng 5’ của CRISPR repeat RNA (khung màu đỏ), và cắt ở
ngồi bìa sử dụng vị trí hoạt hố bao gồm 3 amino acid chính (His, Lys và Tyr). Vùng liên
kết với Cas6 trên crRNA tương tác với khe tích điện dương của protein Cas6. [6]
Để Cas6 nhận diện được crRNA và cắt đúng vị trí đặc hiệu, Cas6 nhận diện theo chiều
ngược của trình tự repeat vị trí nucleotide 2-9 và cắt theo chiều xi ở vị trí giữa nu 22 và
23. Trong các thí nghiệm in vivo, Cas6 liên kết ổn định với các sản phẩm cắt nhưng khơng
liên kết với crRNA hồn chỉnh vì crRNA hồn chỉnh đã được cắt bỏ các trình tự ở đầu 3’,
dẫn đến mất khả năng nhận diện và bám của Cas6.[6]

13


Hình 7. Hoạt động Endoribonuclease của protein Cas6 ở Pyrococcus furiosus [6]
II.7. CRISPR cung cấp khả năng miễn dịch ở sinh vật nhân sơ
Streptococcus thermophilus là một vi khuẩn Gram dương có tỉ lệ G+C thấp. Phân tích bộ

gen của các chủng S. thermophilus có liên quan gần cho thấy đa hình di truyền xảy ra chủ
yếu ở các locus siêu biến như eps và rps operon, cũng như tại hai CRISPR locus. CRISPR
locus điển hình bao gồm một vài đoạn repeat thẳng không liền mạch bị phân chia bởi các
trình tự đa dạng gọi là spacer và vùng repeat/spacer thường nằm cạnh các gen cas.
Các phân tích in silico về trình tự spacer tiết lộ rằng trình tự các đoạn spacer tương đồng
với các yếu tố ngoại lai bao gồm phage và plasmid. Dựa trên các nghiên cứu sâu rộng cho
thấy vai trò của CRISPR và gen cas bao gồm khả năng miễn dịch chống lại các yếu tố di
truyền bên ngồi thơng qua cơ chế dựa trên RNA interference.
Khi phân tích trình tự CRISPR của các chủng S. thermophilus đa dạng bao gồm các chủng
hoang dã (WT) và các chủng kháng phage. Sự khác nhau về số lượng và phân loại của
spacer được quan sát chủ yếu tại locus CRISPR1. Rõ ràng, tính nhạy với phage có mối
tương quan với CRISPR1 spacer. Đặc biệt, spacer có thành phần gần giống bố mẹ và có
nguồn gốc kháng phage, ngoại trừ spacer xuất hiện sau cùng. Phát hiện này đã gợi lên mối

14


quan hệ tiềm năng giữa sự có mặt của spacer được thêm vào với sự khác nhau về tính nhạy
cảm phage giữa các chủng.
Chủng WT DGCC7710: mơ hình mẫu nhạy cảm với phage và hai phage gây độc với vi
khuẩn được phân lập từ các mẫu yogurt công nghiệp là phage 858 và phage 297.
9 đột biến kháng phage được tạo ra độc lập bằng cách thử thách chủng WT với phage 858
và phage 2972 hoặc cùng lúc với cả hai phage, sau đó phân tích các CRISPR locus thu
được. Sự khác nhau được quan sát ở CRISPR1 locus, với spacer 1-4 được chèn vào bên
cạnh 32 soacer đã có của chủng WT. Giải trình tự các đoạn spacer được chèn vào locus
CRISPR1 của các thể đột biến kháng phage cho thấy sự giống nhau với trình tự tìm thấy
trong bộ gen của phage được sử dụng để thử nghiệm. Điều thú vị là những trình tự tương
đồng được quan sát trong bộ gen thực khuẩn, trong hầu hết các mo-đun chức năng, cả trên
chuỗi mã hố và khơng mã hố, khơng có trình tự, gen hay nhóm chức năng được nhắm
mục tiêu cụ thể. Kết quả cho thấy để trở nên đề kháng với phage, locus CRISPR1 được

biến đổi bằng cách chèn spacer mới, có nguồn gốc từ DNA của phage.
Chúng ta quan sát thấy có một vài chủng kháng cả hai loại phage, trong khi các chủng còn
lại chỉ kháng với phage được sử dụng để thử nghiệm. Khả năng kháng phage có mối tương
quan với thành phần spacer, ở các chủng có spacer giống nhau 100% trình tự bảo tồn ở cả
hai phage sẽ kháng được cả hai phage (spacer S3, S6, S7). Mặt khác, khi có đa hình
nucleotide giữa spacer và trình tự phage (từ 1- 15 nucleotide đa hình đến 29 hoặc 30
nucleotide), spacer khơng còn tạo ra khả năng kháng phage, như ở spacer S1, S2, S4, S5,
S8. Thêm vào đó, khi một vài spacer được chèn (S9-S14) khả năng kháng phage ở mức độ
cao hơn.
Phát hiện này chỉ ra rằng CRISPR1 locus là đối tượng thúc đẩy sự tiến hố nhanh chóng
được gây nên bởi sự phơi nhiễm bởi phage.
Tổng hợp lại, những kết quả trên cho thấy các locus CRISPR có thể thực sự bị thay đổi
trong suốt quá trình tạo nên các đột biến kháng phage và có mối liên hệ giữa tính nhạy cảm
với phage và thành phần spacer. Phát hiện này chỉ ra rằng sự hiện diện của đoạn spacer
giống với một trình tự phage sẽ cung cấp khả năng kháng lại phage có mang trình tự đó.[7]

15


Hình 8. Sơ đồ minh hoạ cho sự khác nhau giữa thành phần các đoạn CRISPR tác động lên
tính nhạy cảm với phage của các thể đột biến.[7]
II.8. CRISPR- Cas9 – công cụ chỉnh sửa gene phổ biến hiện nay
Chỉnh sửa bộ gen bằng CRISPR-Cas9. Nguyên tắc của chỉnh sửa bộ gen là sự phân cắt của
DNA sợi kép tại một vị trí đã định trên bộ gen. Loại II là loại đơn giản nhất làm nuclease
được nhắm mục tiêu trong số các hệ thống CRISPR-Cas. CRISPR RNA (crRNA), có trình
tự tương đồng với vị trí đích và CRISPR RNA chuyển hóa kích hoạt (tracrRNA) đủ để đưa
nuclease Cas9 đến vị trí đích. Sự liên kết nhân tạo của crRNA và tracrRNA thành một
chuỗi RNA (RNA dẫn đường đơn [sgRNA]) không ảnh hưởng đến chức năng. Một khi
phức hợp Cas9-sgRNA phân cắt gen mục tiêu, rất dễ làm phá vỡ chức năng của gen do đột
biến xóa hoặc chèn. Phương pháp cực kỳ đơn giản này hiện đang nhanh chóng lan rộng như

một kỹ thuật chỉnh sửa bộ gen thực tế.[8]

Hình 9. Chỉnh sửa bộ gene bằng hệ thống CRISPR-Cas9 [8]
Cấu trúc đơn giản của các phức hợp effector đã làm cho hệ thống CRISPR-Cas lớp 2 trở
thành một sự lựa chọn hấp dẫn để phát triển một thế hệ công nghệ chỉnh sửa bộ gene mới.
Một số effector laoij2 khác biệt đã được báo cáo, bao gồm Cas9 ở loại II, Cas12a (trước
đây là Cpf1), Cas 12b (C2c1) ở loại V, và Cas13a (C2c2) và Cas13b (C2c3) ở loại VI.
Protein effector đa miền phổ biến nhất và được nghiên cứu tốt nhất là Cas9, một
endonuclease phụ thuộc crRNA, bao gồm hai miền nuclease RuvC và HNH, có vai trò phân
cắt các sợi DNA bị dịch chuyển (nontarget) và DNA mục tiêu. Locus CRISP- cas loại II
cũng mã hoá tracrRNA (trans-activating crRNA) phát triển từ CRISPR tương ứng. Phân tử
16


tracrRNA cần thiết cho quá trình xử lý tiền crRNA và nhận dạng mục tiêu trong hệ thống
CRISPR loại II. Cơ chế phân tử của sự phân cắt DNA đích bởi phức hợp Cas9-crRNA đã
được làm sáng tỏ ở cấp độ nguyên tử bằng phân tích cấu trúc tinh thể của phức hợp DNACas9-crRNA. [8]

Hình 10. Cơ chế phân cắt DNA mục tiêu bằng crRNA-tracrRNA-Cas9. Phức hợp Cas9crRNA-tracrRNA liên kết với DNA ngoại lai có chứa PAM, nơi Cas9 liên kết và bắt đầu
tháo sợi kép của DNA ngoại lai để tạo ra sự hình thành phức hợp giữa crRNA và DNA
ngoại lai. Cas9 bao gồm hai vùng, được gọi là thùy REC (nhận biết) và thùy NUC
(nuclease). Thùy REC chịu trách nhiệm nhận dạng axit nucleic. Thùy NUC chứa miền
nuclease HNH và RuvC và vùng đầu cuối C chứa miền tương tác PAM (PI). Miền HNH và
miền RuvC phân cắt sợi DNA, tạo thành một đoạn kép tương ứng với crRNA và sợi DNA
khác, do đó sự đứt gãy sợi kép xảy ra trong DNA đích.[8]

17


Tài liệu tham khảo

[1] Lampson, B. C., Inouye, M., & Inouye, S. (2005). Retrons, msDNA, and the bacterial
genome. Cytogenetic and Genome Research, 110(1-4), 491–499. doi:10.1159/000084982 
[2] Mojica, F. J. M., D�ez-Villase�or, C., Garc�a-Mart�nez, J., & Soria, E.
(2005). Intervening Sequences of Regularly Spaced Prokaryotic Repeats Derive from
Foreign Genetic Elements. Journal of Molecular Evolution, 60(2), 174–
182. doi:10.1007/s00239-004-0046-3 
[3] Golubov, A. (2016). CRISPR. Genome Stability, 87–98. doi:10.1016/b978-0-12803309-8.00006-9
[4] Sorek, R., Kunin, V., & Hugenholtz, P. (2008). CRISPR — a widespread system that
provides acquired resistance against phages in bacteria and archaea. Nature Reviews
Microbiology, 6(3), 181–186. doi:10.1038/nrmicro1793 
[5] McGinn, J., & Marraffini, L. A. (2018). Molecular mechanisms of CRISPR–Cas spacer
acquisition. Nature Reviews Microbiology. doi:10.1038/s41579-018-0071-7 
[6] Terns, R. M., & Terns, M. P. (2013). The RNA- and DNA-targeting CRISPR–Cas
immune systems ofPyrococcus furiosus. Biochemical Society Transactions, 41(6), 1416–
1421. doi:10.1042/bst20130056
[7] Barrangou, R., Fremaux, C., Deveau, H., Richards, M., Boyaval, P., Moineau, S., …
Horvath, P. (2007). CRISPR Provides Acquired Resistance Against Viruses in Prokaryotes.
Science, 315(5819), 1709–1712. doi:10.1126/science.1138140 
[8] Ishino, Y., Krupovic, M., & Forterre, P. (2018). History of CRISPR-Cas from
Encounter with a Mysterious Repeated Sequence to Genome Editing Technology. Journal
of Bacteriology, 200(7). doi:10.1128/jb.00580-17 
[9] Barrangou, R., Horvath, P. (2009). The CRISPR system protects microbes against
phages, plasmids. Micrope,  4(5):224-230 . DOI:10.1128/microbe.4.224.1
[10] Millman et al., 2020. Bacterial Retrons Function In Anti-Phage Defense. Cell 183, 1–
11. DOI: />
18


Bảng đánh giá các thành viên trong nhóm
Họ và tên

Phan Thị Ngọc
Hà Ý Khánh Nguyên
Trương Thị Kim Ngân

Phân công
Chịu trách nhiệm
nội dung slides 6872
Chịu trách nhiệm
nội dung slides 7376
Chịu trách nhiệm
nội dung slides 7782

19

Đánh giá
8/10
8/10
9/10



×