Tải bản đầy đủ (.pdf) (72 trang)

Tổng quan cấu trúc chuỗi xoắn tứ ADN (G4) của virus và ứng dụng trong thiết kế thuốc kháng virus mới

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.47 MB, 72 trang )

BỘ Y TẾ
TRƯỜNG ĐẠI HỌC DƯỢC HÀ NỘI

LÊ MINH NGỌC

TỔNG QUAN CẤU TRÚC CHUỖI XOẮN
TỨ ADN (G4) CỦA VIRUS VÀ ỨNG DỤNG
TRONG THIẾT KẾ THUỐC KHÁNG
VIRUS MỚI
KHÓA LUẬN TỐT NGHIỆP DƯỢC SĨ

HÀ NỘI – 2019


BỘ Y TẾ
TRƯỜNG ĐẠI HỌC DƯỢC HÀ NỘI

LÊ MINH NGỌC
Mã sinh viên: 1401431

TỔNG QUAN CẤU TRÚC CHUỖI XOẮN
TỨ ADN (G4) CỦA VIRUS VÀ ỨNG DỤNG
TRONG THIẾT KẾ THUỐC KHÁNG
VIRUS MỚI

KHÓA LUẬN TỐT NGHIỆP DƯỢC SĨ

Người hướng dẫn: TS. Phạm Thế Hải
Nơi thực hiện: Bộ môn Hóa Dược

HÀ NỘI – 2019




LỜI CẢM ƠN
Trong suốt quá trình thực hiện khóa luận tốt nghiệp, tôi đã nhận được rất
nhiều sự chỉ bảo, những lời khuyên hữu ích cũng như sự động viên từ các thầy cô,
gia đình và bạn bè.
Đầu tiên, tôi xin bày tỏ lòng biết ơn sâu sắc tới TS. Phạm Thế Hải, giảng
viên Bộ môn Hóa Dược, Đại học Dược Hà Nội – người thầy đã tận tâm hướng dẫn,
chỉ bảo tôi trong suốt thời gian thực hiện khóa luận này. Thầy không những là
người truyền cảm hứng khoa học cho tôi, mà thấy còn dạy cho tôi những kiến thức
sâu rộng và phương pháp làm việc đầy hiệu quả., đưa ra những lời khuyên rất hữu
ích với tôi trong định hướng phát triển bản thân khi làm nghiên cứu khoa học.
Tôi cũng gửi lời cảm ơn tới các thầy cô của Bộ môn Hóa Dược, trường Đại
học Dược Hà Nội. Các thầy cô đã luôn tạo điều kiện thuận lợi cho tôi được nghiên
cứu, học tập và hoàn thành khóa luận này.
Tôi xin cảm ơn gia đình và bạn bè, những người đã luôn ủng hộ tôi trên mọi
con đường tôi đã chọn, cũng là những người đã luôn sát cánh và cho tôi những góp
ý chân thành trong quá trình hoàn thiện khóa luận.
Cuối cùng, tôi xin cảm ơn tới Ban giám hiệu cùng toàn thể các thầy cô giáo
Trường Đại học Dược Hà Nội đã dạy dỗ và tạo điều kiện giúp tôi hoàn thành quá
trình học tập cũng như hoàn thiện quá trình bảo vệ khóa luận này.
Trân trọng cảm ơn!

Hà Nội, ngày 20 tháng 05 năm 2019
Sinh viên

Lê Minh Ngọc


MỤC LỤC

LỜI CẢM ƠN
MỤC LỤC
DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT
DANH MỤC CÁC BẢNG
DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ
ĐẶT VẤN ĐỀ ........................................................................................................... 1
CHƯƠNG 1. TỔNG QUAN VỀ G-QUADRUPLEX – CẤU TRÚC CHUỖI
XOẮN TỨ ADN VÀ CHỨC NĂNG CỦA CHÚNG TRONG VIRUS ................ 2
1.1. Tổng quan về gen .......................................................................................... 2
1.1.1. Gen, ARN, chromosome, nucleosome và telomere ................................ 2
1.1.2. Cấu trúc của một gen .............................................................................. 3
1.2. Cấu trúc của G4............................................................................................. 4
1.3. Vị trí của G4 trong hệ gen ............................................................................ 5
1.4. Một số protein người có tương tác với G4 ADN và chức năng................. 6
1.5. G4 trong virus: Sự tồn tại và chức năng ..................................................... 9
1.5.1. Virus gây suy giảm miễn dịch ở người................................................. 12
1.5.2. Virus herpes ........................................................................................... 14
1.5.3. Các loại virus khác ................................................................................ 18
1.5.3.1 Virus ADN ....................................................................................... 18
1.5.3.2. Virus ARN ...................................................................................... 20


CHƯƠNG 2. PHÂN TÍCH LIÊN QUAN GIỮA CẤU TRÚC VÀ TƯƠNG
TÁC VỚI G4 CỦA CÁC PHỐI TỬ G4 ĐÃ ĐƯỢC NGHIÊN CỨU ................ 23
2.1. BRACO-19 ................................................................................................... 23
2.1.1. Liên quan giữa cấu trúc và tương tác với G4 ...................................... 23
2.1.2. Tác dụng dược lý ................................................................................... 25
2.2. TMPyP4........................................................................................................ 28
2.2.1. Liên quan giữa cấu trúc và tương tác với G4 ...................................... 28
2.2.2. Tác dụng dược lý .................................................................................. 29

2.3. Perylenes và naphthalene diimides ............................................................ 30
2.3.1. Liên quan giữa cấu trúc và tương tác với G4 ...................................... 30
2.3.2. Tác dụng dược lý ................................................................................... 31
2.3.3. Một số dẫn xuất đã được tổng hợp ....................................................... 33
2.4. Pyridostatin .................................................................................................. 34
2.4.1. Liên quan giữa cấu trúc và tương tác với G4 ...................................... 34
2.4.2. Tác dụng dược lý ................................................................................... 34
2.4.3. Một số dẫn xuất đã được tổng hợp ....................................................... 34
2.5. Dẫn xuất bisquinolinium ............................................................................ 35
2.5.1. Liên quan giữa cấu trúc và tương tác với G4 ...................................... 35
2.5.2. Tác dụng dược lý .................................................................................. 35
CHƯƠNG 3. PHƯƠNG PHÁP PHÁT TRIỂN CÁC PHỐI TỬ G4: PHƯƠNG
PHÁP PHÁT HIỆN THUỐC DỰA TRÊN MẢNH PHÂN TỬ......................... 37
3.1. Tổng quan phương pháp ............................................................................ 37
3.2. Quy trình chung thực hiện phương pháp ................................................. 37


3.2.1. Sàng lọc ban đầu các mảnh phân tử có trọng lượng phân tử thấp.... 38
3.2.2. Thiết kế, Tổng hợp và Phân tích các phối tử đã được chọn ............... 39
3.2.3. Thiết kế, tổng hợp và phân tích các hợp chất kết quả cuối cùng ....... 39
3.3. Các nghiên cứu đã sử dụng phương pháp này để thiết kế phối tử G4 .. 40
3.3.1. Nghiên cứu thiết kế phối tử G4 chống ung thư................................... 40
3.3.2. Nghiên cứu thiết kế phối tử G4 kháng virus HIV-1 ............................ 41
BÀN LUẬN ............................................................................................................. 43
KẾT LUẬN VÀ ĐỀ XUẤT ................................................................................... 47
TÀI LIỆU THAM KHẢO ....................................................................................... 1


DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT


Chữ viết tắt

Giải thích tiếng Anh

Giải thích tiếng Việt

G4

G-quadruplexes

Cấu trúc chuỗi xoắn tứ

Guanine tetrad

Mặt phẳng 4 base guanine

G4- sequencing

Giải trình tự G4

Chromatin

Phương pháp nhiễm sắc thể

Immunoprecipitation

miễn dịch

mARN


Messenger ARN

ARN thông tin

UTR

untranslated region

Vùng không được dịch mã

chromosome 1 open reading

Khung 63 đọc mở nhiễm sắc

frame 63

thể 1

BRD3

bromodomain containing 3

Vùng chứa bromo 3

FGF12

fibroblast growth factor 12

G-tetrad, Gquartet
G4-seq

ChIP

C1orf63

HIV

AIDS

LTR

Nef

Yếu tố tăng trưởng nguyên
bào sợi 12

human immunodeficiency

Virus gây suy giảm miễn dịch

viruses

ở người

acquired immune deficiency

Hội chứng suy giảm miễn dịch

syndrome

mắc phải


long terminal repeat
(protein) Negative Regulatory
Factor

Đoạn lặp kéo dài ở cuối nhiễm
sắc thể
Yếu tố điều hòa giảm

NF-kB

Nuclear Factor-kappa B

Yếu Tố Nhân kappa B

NMR

Nuclear magnetic resonance

Cộng hưởng từ hạt nhân


Chữ viết tắt

Giải thích tiếng Anh

Giải thích tiếng Việt

hnRNP


human ribonucleoprotein

ribonucleoprotein của người

HSV-1 và
HSV-2

virus herpes simplex 1 và 2

EBV

Epstein–Barr virus
Kaposi's sarcoma-associated

virus herpes liên quan đến

herpesvirus

Kaposi’s sarcoma

Human Herpesvirus 6

virus herpes 6 ở người

EBV- encoded nuclear

kháng nguyên nhân mã hóa

antigen-1


EBV

HPV

Human papillomavirus

Virus papilloma ở người

HBV

Hepatitis B virus

Virus viêm gan B

AAV

Adeno-associated viruses

Virus liên quan đến Adeno

NPM1

Nucleophosmin 1

KSHV
HHV-6
EBNA1

SARS-CoV
HCV


kết ADN

Severe acute respiratory

Coronavirus gây hội chứng hô

syndrome-related coronavirus

hấp cấp tính nặng

Hepatitis C virus

Virus viêm gan C

ZIKV
SUD

Protein nucleophosmin liên

Zika virus
SARS-Unique Domain

miền SARS duy nhất

EBOV

Ebola virus

MARV


Marburg virus

B19,

N,N’-(9-((4-(dimethylamino)phenyl)amino)acridine3,6-

BRACO-19

diyl)bis(3-(pyrrolidin-1yl)propan-amide)

SAR

Structure-Activity
Relationship

Liên quan cấu trúc – tác dụng


Chữ viết tắt
EBNA2
TMPyP4
PIPER

Giải thích tiếng Anh

Giải thích tiếng Việt

Epstein–Barr virus nuclear


Kháng nguyên nhân virus

antigen 2

Epstein–Barr 2

porphyrin 5,10,15,20-tetrakis-(Nmethyl-4-pyridyl)porphine
N,N’-bis[2-(1-piperidino)- ethyl]3,4,9,10perylenetetracarboxylic diimide

NDI
c-exNDIs

naphthalene diimide
core extended naphtalene
diimide

PDS
FBDD

FRET

dẫn xuất NDI cốt lõi mở rộng

Pyridostatin
Fragment-based drug

Phương pháp phát triển thuốc

discovery approach


dựa trên mảnh phân tử

Fluorescence Resonance

Năng lượng cộng hưởng

Energy Transfer

huỳnh quang


DANH MỤC CÁC BẢNG

Bảng 1. 10 trong số hơn 9000 protein người liên kết với G4 [77] ............................ 7
Bảng 2. Tóm tắt về các báo cáo của G4 trong bộ gen của virus ............................. 11


DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ

Hình 1. Cấu trúc gen và mARN ................................................................................ 3
Hình 2. Cấu trúc chuỗi xoắn tứ G-quadruplexes. ...................................................... 4
Hình 3. Chức năng của các protein người liên kết với G4 ........................................ 8
Hình 4. Sơ đồ biểu diễn vòng đời của virus ............................................................ 10
Hình 5. Vùng giàu guanin của vùng khởi đầu phiên mã HIV-1. ............................ 13
Hình 6. Sơ đồ biểu diễn sự phân bố các trình tự hình thành G4 giả định trong virus
herpes ở người. ......................................................................................................... 16
Hình 7. Cấu trúc của hai trong số các loại virus ADN phổ biến ở người. .............. 19
Hình 8. Cấu trúc của ba trong số các loại virus ARN phổ biến ở người................. 20
Hình 9. Cấu trúc của A: EBOV; B: MARV ............................................................ 22
Hình 10. Cấu trúc hóa học của các phối tử G4 được báo cáo có hoạt tính chống

virus .......................................................................................................................... 24
Hình 11. Cấu trúc tinh thể của phức chất giữa B19 và hai G4 trong vùng telomere
ở người ..................................................................................................................... 25
Hình 12. Đề xuất cơ chế chống virus của B19. ....................................................... 27
Hình 13. Cấu trúc tinh thể của phức chất giữa TMPyP4 và G4 trong vùng telomere
ở người. .................................................................................................................... 28
Hình 14. Cấu trúc tinh thể của phức chất giữa PhenDC3 và vùng khởi đầu phiên
mã của c-myc G4 người. .......................................................................................... 36
Hình 15. Sơ đồ tổng quát Phương pháp phát hiện thuốc dựa trên mảnh cấu trúc... 38
Hình 16. Sự phát triển các mảnh để tạo PLX4032 ................................................. 41
Hình 17. Phương pháp phát hiện thuốc dựa trên mảnh cấu trúc ............................ 42


ĐẶT VẤN ĐỀ
G-quadruplexes (G4 – cấu trúc chuỗi xoắn tứ) là các cấu trúc thứ cấp của
acid nucleic không điển hình, hình thành trong các chuỗi giàu guanin ở các đoạn
gen điều hòa. G4 đã được mô tả rộng rãi trong bộ gen của con người, đặc biệt là
trong các trình tự khởi đầu phiên mã của telomeres và gen gây ung thư; trong
những năm gần đây, sự hiện diện của các G4 trong các loại virus đã ngày càng thu
hút sự chú ý. Thật vậy, G4 đã được báo cáo ở một số loại virus, bao gồm cả những
loại liên quan đến các dịch bệnh gần đây, chẳng hạn như virus Zika và Ebola. Các
G4 virus thường nằm trong các khu vực điều hòa của bộ gen và có liên quan đến
việc kiểm soát các quá trình quan trọng của virus; trong một số trường hợp, chúng
cũng liên quan đến độ trễ của virus (giai đoạn tiềm tàng). Trong bối cảnh này, các
phối tử của G4 đã được cả phát triển và thử nghiệm như công cụ để nghiên cứu sự
phức tạp của các cơ chế qua trung gian của G4 trong vòng đời của virus, và cũng
như các tác nhân trị liệu. Nhìn chung, các phối tử của G4 cho thấy hoạt tính chống
virus đầy hứa hẹn, với các cơ chế hoạt động qua trung gian của G4 cả ở cấp độ hệ
gen và phiên mã.
Để có cái nhìn tổng quan và cập nhật, cận cảnh về hướng nghiên cứu này, đề

tài “Tổng quan cấu trúc chuỗi xoắn tứ ADN (G4) của virus và ứng dụng trong
thiết kế thuốc kháng virus mới” được thực hiện với các mục tiêu sau:
1. Trình bày tổng quan cấu trúc chuỗi xoắn tứ ADN và chức năng của chúng
trong virus.
2. Phân tích liên quan giữa cấu trúc và tương tác với G4 của các phối tử G4 đã
được nghiên cứu về hoạt tính chống virus.
3. Tìm hiểu thiết kế các phối tử liên kết G4 dựa trên Phương pháp phát hiện
thuốc dựa trên mảnh phân tử: Tổng quan, Quy trình chung và Ứng dụng

1


CHƯƠNG 1. TỔNG QUAN VỀ G-QUADRUPLEX – CẤU TRÚC CHUỖI
XOẮN TỨ ADN VÀ CHỨC NĂNG CỦA CHÚNG TRONG VIRUS

1.1. Tổng quan về gen
1.1.1. Gen, ARN, chromosome, nucleosome và telomere
Trong sinh học, gen là một chuỗi các nucleotid trong ADN hoặc ARN mã
hóa cho một phân tử có chức năng. Trong quá trình biểu hiện gen, đầu tiên ADN sẽ
được phiên mã thành ARN. Các ARN này có thể có chức năng trực tiếp hoặc sẽ trở
thành khuôn trung gian để thực hiện quá trình dịch mã, tạo protein thực hiện chức
năng [65].
Tổng số tất cả các gen trong một sinh vật hoặc tế bào được gọi là bộ gen của
nó, có thể được lưu trữ trên một hoặc nhiều nhiễm sắc thể. Một nhiễm sắc thể trần
(chromosomes) bao gồm một chuỗi xoắn ADN rất dài, trên đó có hàng ngàn gen
được mã hóa. Các nhiễm sắc thể trần này sẽ được đóng gói rất phức tạp trong nhân
tế bào bởi các protein histones để tạo thành nhiễm sắc thể (nucleosome) [65].
Telomere là vùng được hình thành bởi các chuỗi TTAGGG lặp lại kế tiếp
nhau, bao trùm các đầu của nhiễm sắc thể và ngăn chặn sự suy giảm của các vùng
mã hóa và điều hòa trong quá trình sao chép ADN. Độ dài của telomere sẽ bị giảm

đi mỗi lần bộ gen được sao chép (sự cố đầu mút) và điều này có liên quan đến quá
trình lão hóa. Một enzym tên là telomerase, cấu trúc bao gồm cả ARN lẫn protein,
có vai trò giúp các phân tử ADN sao chép toàn bộ nhiễm sắc thể mà không bị mất
đi đoạn cuối cùng. Enzym này được tìm thấy dưới dạng có hoạt tính trong tế bào
gốc và tế bào ung thư, được cho là nguyên nhân khiến cho các tế bào này phân chia
liên tục và có cuộc sống vĩnh cửu.

2


1.1.2. Cấu trúc của một gen
Một gen có cấu trúc gồm rất nhiều thành phần, trong đó vùng có thể mã hóa
tạo protein chỉ là vùng rất nhỏ (Hình 1). Đa phần trên gen chứa những vùng không
được phiên mã hoặc không được dịch mã sau khi phiên mã tạo ARN.
Ngay trước khung đọc mã là vùng điều hòa, rất quan trọng cho quá trình biểu
hiện gen. Phần đầu tiên của vùng điều hòa là trình tự khởi đầu phiên mã
(promoter). Tại đây, các yếu tố phiên mã sẽ nhận ra và gắn vào trình tự này, khơi
mào cho sự liên kết của ARN polymerase với gen để bắt đầu phiên mã. Các gen
được phiên mã nhiều là những gen có trình tự khởi đầu mạnh, có ái lực cao với các
yếu tố phiên mã khiến gen được phiên mã với mức độ cao hơn và ngược lại [65]
mARN sau khi được tạo thành sẽ chứa nhiều trình tự không được dịch mã
(UTR) ở cả 2 đầu gen, bao gồm vị trí gắn ribosome, trình tự kết thúc phiên mã
(terminator), và cả các codon mở đầu và kết thúc. Ngoài ra, ở sinh vật nhân thực,
các mARN đều chứa các vùng không mã hóa (intron: vùng không được dịch mã và
sẽ bị loại bỏ khỏi mARN để tạo mARN trưởng thành) và vùng mã hóa (exon: vùng
được dịch mã tạo protein) [65].

Hình 1. Cấu trúc gen và mARN
3



1.2. Cấu trúc của G4
G-quadruplexes (cấu trúc chuỗi xoắn tứ - G4) là cấu trúc thứ cấp của acid
nucleic, được hình thành từ các các chuỗi giàu guanin của ADN [17] hoặc ARN
[42], khi hai hoặc nhiều G-tetrad chồng lên nhau, cùng với sự kết hợp của các
cation hóa trị I như K+ và Na+. Mỗi G-tetrad (guanine tetrad hoặc G-quartet) được
cấu tạo từ bốn phân tử guanines, liên kết với nhau thông qua liên kết Hydro kiểu
Hoogsteen tạo thành một cấu trúc phẳng vuông. Các G4 có thể được tạo thành do
gấp nội phân tử từ một chuỗi giàu guanin đơn lẻ hoặc gấp liên phân tử thông qua
quá trình dimer hoặc tetramer hóa các sợi riêng biệt (tức là một G4 có thể được
hình thành từ 1, 2 hoặc 4 sợi khác nhau) [39] (Hình 2).

Hình 2. Cấu trúc chuỗi xoắn tứ G-quadruplexes.
A. Cấu trúc hóa học (bên trái) và cấu trúc mô phỏng bằng sơ đồ (bên phải) của Gtetrad. M+ đại diện cho cation hóa trị I nằm ở trung tâm cấu trúc vuông phẳng.
B. Cấu trúc liên kết khác nhau của G4 gấp nội phân tử.

4


Nghiên cứu về mặt sinh học của G4 chủ yếu tập trung vào các đơn phân tử
G4 [72,100]; tuy nhiên, các G4 cấu tạo từ nhiều sợi đang ngày càng thu hút sự chú
ý [70,146,148]. Định hướng của sợi sẽ xác định cấu trúc song song, phản song song
hoặc hỗn hợp của G4, tương quan trực tiếp với trạng thái cấu tạo (anti hoặc syn)
của liên kết glycosid giữa gốc G base và đường [17]. Cấu hình anti đặc trưng bởi
một nếp gấp song song, trong khi các G4 phản song song được phát hiện ra có thể
có định hướng cả syn và anti [59] (Hình 2). Các ARN G4 hầu hết mang cấu trúc
song song do nhóm 2 -hydroxyl của đường chỉ cho phép định hướng anti [42], còn
các ADN G4 có nhiều cấu trúc đa dạng hơn, mặc dù phần lớn chúng cũng có cấu
trúc liên kết song song.


1.3. Vị trí của G4 trong hệ gen
Phân tích máy tính sử dụng nhiều thuật toán khác nhau [10,61] chỉ ra rằng
300 000 đến khoảng 3 000 000 trình tự tạo G4 có tiềm năng có thể hình thành trong
bộ gen của người, liên quan tới các chức năng gen cụ thể [38]. Những dữ liệu này
đã được chứng thực bằng phương pháp giải trình tự thông lượng cao “G4-seq”,
phương pháp đã xác định khoảng 700 000 G4 [21]. Tuy nhiên, việc lập bản đồ của
các G4 trong nhiễm sắc thể bằng phương pháp giải trình tự ChIP (phương pháp
nhiễm sắc thể miễn dịch - ChIP-sequencing) thông qua một kháng thể chống G4
[52] chỉ thu được khoảng 10 000 G4 trong các vùng điều hòa nucleosome bị suy
yếu cao (highly transcribed regulatory nucleosome-depleted chromatin regions).
Những dữ liệu này chỉ ra rằng các G4 hầu hết bị ức chế trong nhiễm sắc thể và do
đó, chúng có thể ảnh hưởng đến mức độ hoạt động của các nhiễm sắc thể.

5


Nhìn chung, các chuỗi G4 được phân phối không ngẫu nhiên mà chủ yếu tập
trung ở các vùng gen quan trọng, cụ thể là telomere, trình tự khởi đầu phiên mã của
gen và gen gốc trong quá trình sao chép ADN [115]. Hơn nữa, các trình tự hình
thành giả định đã được tìm thấy ở các vùng mã hóa và không mã hóa của bản phiên
mã (các mARN) của con người, ví dụ như các khung được đọc để phiên mã và các
vùng không được dịch mã (UTR) và trong các ARN có chứa các đoạn telomere lặp
lại [42]. Bằng chứng này gợi ý rằng G4 có khả năng liên quan đến việc điều hòa
các con đường sinh học khác nhau như sao chép, phiên mã, dịch mã và sự không ổn
định của hệ gen.
Trong những năm qua, việc phân giải của các cấu trúc G4 [99,108] và việc
sử dụng các phương pháp trực quan hóa mới [12,56,73] đã giúp xác thực các dự
đoán bằng máy tính trước đó, mở ra các khía cạnh mới trong nghiên cứu về G4, ví
dụ như chức năng của các G4 trong các mô ung thư có nguồn gốc từ bệnh nhân
[13] hoặc vai trò chính của chúng trong sinh bệnh học của hai bệnh thoái hóa thần

kinh chưa có phương pháp chữa trị: bệnh xơ cứng teo cơ bên và bệnh sa sút trí tuệ
trán-thái dương [125]. Thật vậy, sự hiện diện của G4 trong bộ gen người và tiềm
năng của chúng trong điều trị bệnh đã được nghiên cứu rộng rãi, tạo ra nhiều đánh
giá tốt và toàn diện tập trung vào cấu trúc của G4 [17,59,60,147] và vai trò sinh học
của chúng, đặc biệt là ở telomere [64,91,126,134] và các trình tự khởi đầu phiên mã
của gen gây ung thư [8,11,16,22,24,117].
1.4. Một số protein người có tương tác với G4 ADN và chức năng
Theo một nghiên cứu gần đây [77], có tới gần 9500 protein ở người có mối
liên quan tới G4. Một số protein đặc biệt tương tác với G4 ở cả hai nồng độ 2.5µM
và 25µM có thể kể tới như C1orf63, BRD3, FGF12… (Bảng 1) đều là những
protein quan trọng trong quá trình tăng trưởng và tăng sinh tế bào.
6


Bảng 1. 10 trong số hơn 9000 protein người liên kết với G4 [77]
STT

Protein

Database ID

Tên cụ thể, mô tả

1

C1orf63

NM_020317.2

nhiễm sắc thể 1 khung đọc mở 63


2
3
4

GABARAP NM_007278.1
PHF20L1

Protein liên quan đến thụ thể GABA (A)

NM_198513.1

PHD finger protein 20-like 1, phiên bản 3

FBR-MuSV NM_001997.2

Finkel-Biskis-Reilly murine sarcoma virus
(FBR-MuSV) ubiquitously expressed (FAU)

5

BRD3

BC032124.1

Miền chứa brom 3

6

ASXL1


BC064984.1

additional sex combs like 1 (Drosophila)

7

NOL7

NM_016167.3

nucleolar protein 7, 27kDa

8

SERPINF1

BC000522.1

Chất ức chế peptidase serpin, nhóm F (alpha2 antiplasmin, yếu tố dẫn xuất biểu mô sắc
tố), thành viên 1

9

FGF12

BC022524.1

yếu tố tăng trưởng nguyên bào sợi 12


10

EIF3S4

BC000733.1

yếu tố khởi đầu dịch mã eukaryote 3, tiểu
đơn vị G

Chức năng của các phân tử protein tham gia tương tác này chủ yếu là liên kết
và xúc tác, một số ít tham gia hoạt động truyền tín hiệu trong tế bào [77] (Hình 3).
Chính vì vậy, trên con đường tìm ra các phối tử G4 để làm thuốc điều trị bệnh, cần
đặc biệt lưu ý những mắt xích cuối của các mạng lưới chức năng protein gắn kết
này, tránh gây ra nhiều tác dụng không mong muốn.

7


Hình 3. Chức năng của các protein người liên kết với G4
A. Mạng lưới chức năng phân tử của các protein liên kết có ý nghĩa với G4-2 và
G4-3 (nồng độ 25μM), P = 5%.
B. Mạng lưới chức năng phân tử của các protein liên kết có ý nghĩa với G4-1 (cả
nồng độ 2,5 và 25μM), P = 5%.
8


1.5. G4 trong virus: Sự tồn tại và chức năng
Bên cạnh con người, các trình tự được cho là hình thành G4 đã được tìm thấy
trong bộ gen của các động vật có vú khác [142], nấm men [57], động vật nguyên
sinh [128], vi khuẩn [9,104] và virus. Điều này gợi ý về mối liên quan của G4 với

nhiều bệnh truyền nhiễm ở người. Một đánh giá đã được công bố vào năm 2015 về
vai trò có thể có của G4 trong hệ thống biến đổi kháng nguyên của vi khuẩn và
động vật nguyên sinh và trong sự ngừng hoạt động của hai loại virus [53]. Vai trò
có thể có của G4 trên virus và việc sử dụng các oligonucleotide tạo G4 làm tác
nhân chống virus đã được thảo luận vào năm 2014 [83].
Vì số lượng báo cáo mô tả sự hiện diện của G4 trong bộ gen virus đã gia tăng
một cách đáng kể trong 2 năm qua và việc điều trị sử dụng một số phối tử của G4
đã cho thấy hoạt động trị liệu tiềm năng, bài tổng quan này sẽ trình bày, tổ chức và
thảo luận về một tài liệu cập nhật, cận cảnh về các G4 trong virus và các nhóm
phân tử đã cho thấy hoạt động kháng virus thông qua các đích là G4 của virus. Cụ
thể, trước tiên chúng ta sẽ tập trung vào sự tồn tại và chức năng được đề xuất của
G4 trong bộ gen của virus. Sau đó, các lớp phối tử của G4 đã được báo cáo là có
hoạt động kháng virus thành công sẽ được đề cập tới ở chương tiếp theo, đặc biệt
nhấn mạnh vào các đặc tính cấu trúc và hóa lý đặc trưng cho tương tác giữa phối tử
G4 và G4 của virus. Một vòng đời virus đơn giản hóa nói chung được mô tả bằng
sơ đồ hóa trong Hình 4; một bản tóm tắt về các loại virus đã được báo cáo là có G4
và các G4 tương ứng được trình bày trong Bảng 2. Kể từ khi việc sử dụng các
oligonucleotide tạo G4 làm tác nhân kháng virus đã được Musumeci và cộng sự
gần đây làm sáng tỏ hơn. [89,111], chủ đề này vẫn chưa được xem xét trong các
đánh giá hiện tại.

9


Hình 4. Sơ đồ biểu diễn vòng đời của virus
Virus nhận ra và liên kết các thụ thể bề mặt tế bào chủ (bước 1) để xâm nhập vào tế
bào (bước 2). Sau khi xâm nhập, bộ gen của virus được giải phóng khỏi vỏ (bước 3)
và tùy thuộc vào bản chất ADN hoặc ARN, virus sẽ có vị trí và cách thức bộ gen
được nhân lên khác nhau (bước 4): hầu hết các virus ADN sao chép trong nhân tế
bào, trong khi phần lớn các virus ARN sao chép trong tế bào chất của các tế bào bị

nhiễm bệnh. Sau khi sản xuất mARN của virus, protein virus được biểu hiện trong tế
bào chất (bước 5 - 6). Bộ gen và protein mới được tổng hợp sau đó được tập hợp
thành hạt virus mới (bước 7), được giải phóng ra bên ngoài tế bào (bước 8).

Bảng 2 bên dưới thể hiện các thông tin đã được báo cáo về G4 trong bộ gen
của virus [39]. Mỗi virus có các thông tin sau: cấu trúc, kích thước hạt virus, kích
thước và tổ chức bộ gen; sơ đồ của vị trí G4 (chấm tròn) trong bộ gen virus hoặc
trong các protein liên kết với mARN G4; số lượng G4 được đánh giá thông qua
phân tích tin sinh học; Các phối tử G4 được báo cáo cho đến nay có tác dụng chống
virus.
10


Bảng 2. Tóm tắt về các báo cáo của G4 trong bộ gen của virus

11


1.5.1. Virus gây suy giảm miễn dịch ở người
Virus gây suy giảm miễn dịch ở người (HIV) là tác nhân căn nguyên của hội
chứng suy giảm miễn dịch mắc phải (AIDS), đến nay đã ảnh hưởng đến hơn 35
triệu người trên toàn thế giới. Mặc dù liệu pháp chống retrovirus hiện tại giữ cho sự
tiến triển của bệnh trong tầm kiểm soát, con người vẫn chết vì các nguyên nhân liên
quan đến HIV; do đó cần phải tìm các mục tiêu chống virus thay thế và hiệu quả
hơn. HIV thuộc họ Retroviridae; bộ gen ARN chuỗi đơn được xử lý bởi
retrotranscriptase của virus và ADN chuỗi kép mới được hình thành được tích hợp
vào nhiễm sắc thể của tế bào chủ để tạo thành bộ gen provirus, nơi mà mARN của
virus và bộ gen mới cùng được phiên mã.
Nghiên cứu về các gen tạo G4 trong bộ gen HIV-1 đã cho nhiều kết quả khả
quan, quan tâm tới không chỉ hai bản sao bộ gen virus ARN, mà còn cả bộ gen

provirus tích hợp, đặc biệt là ở khu vực trình tự khởi đầu phiên mã kéo dài (long
terminal promoter - LTR) [3,105,124] và trong vùng mã hóa nef [106], như được
đánh giá riêng bởi Metifiot và cộng sự. [83].
Tóm lại, LTR được đặc trưng bởi trình tự giàu G được bảo tồn cao ở vùng
U3, tương ứng với các vị trí liên kết Sp1 và NF-B (Hình 5), nơi mà ba cấu trúc G4
có tác động ngược nhau có thể hình thành, đó là LTR-II, LTR-III và LTR- IV
[105]. LTR-IV là một G4 song song có đoạn phình ra nằm ở đầu 3’, được xác định
bằng đặc tính cộng hưởng từ hạt nhân (NMR) [31]. LTR-III và LTR-IV gây tác
dụng ngược lại trên hoạt động của LTR (bị bất hoạt khi LTR-III được gấp lại và
được kích thích nhờ sự ổn định của LTR-IV) [31]. Ngoài ra, vùng LTR G4 nằm
dưới sự kiểm soát của hai protein nhân: nucleolin, khi liên kết làm tăng tính ổn định
của LTR G4 và do đó làm dừng quá trình phiên mã [140] và ribonucleoprotein của
con người (hnRNP) A2 / B1, protein làm tháo xoắn vùng LTR, làm giảm hoạt động
12


của trình tự khởi đầu phiên mã của nó [123]: những dữ liệu này cho thấy sự cân
bằng giữa các G4 hoạt động như một cơ chế điều hòa hoạt động của trình tự khởi
đầu phiên mã HIV-1. Điều thú vị là, các trình tự hình thành của G4 có mặt trong
LTR của tất cả các lentiviruses (các nhóm thuộc retroviruses) trên động vật có vú
và đóng vai trò là các vị trí liên kết cho các yếu tố phiên mã có liên quan đến điều
hòa G4 [112, 139], điều này càng củng cố vai trò của G4 là các yếu tố kiểm soát
quan trọng đối với phiên mã virus, được bảo tồn trong suốt quá trình tiến hóa [103].

Hình 5. Vùng giàu guanin của vùng khởi đầu phiên mã HIV-1. Được tạo ra bởi
phần mềm weblogo và dựa trên cơ sở dữ liệu của 1684 trình tự HIV-1
(www.hiv.lanl.gov) [3].
Các G4 cũng được chứng minh có trong vùng U3 của bộ gen HIV1 ARN,
nơi nhiều G4 song song có độ ổn định cao có thể hình thành [101]. Các chuỗi ARN
có thể được dimer hóa thông qua một tương tác liên phân tử của G4 [130], cho thấy

rằng vùng U3 có thể đại diện cho một điểm tiếp xúc bổ sung giữa hai bản sao bộ
gen của virus. Ngoài ra, các ARN G4 này dường như có vai trò trong sự gia tăng
tốc độ tái tổ hợp di truyền quan sát được trong U3 [109].

Nef, một protein phụ của virus, là một yếu tố thiết yếu trong quá trình tổng
hợp ADN của provirus [1] và trong việc hình thành tình trạng lây nhiễm dai dẳng
[85]. Vùng mã hóa của nó nằm ở đầu 3’ của bộ gen virus và trùng lặp một phần với
3-LTR. Ba trình tự G4 đã được xác định trong khu vực được bảo tồn nhất của gen
[106].
13


Các trình tự giàu G có khả năng hình thành các G4 đã được báo cáo trong
đoạn ADN trung tâm của HIV (đoạn ADN nằm giữa AND vòng của virus sau khi
phiên mã ngược và có vai trò rất quan trọng trong quá trình sao chép bộ gen virus)
và được nhận thấy là để bảo vệ bộ gen trước khi được tích hợp khỏi sự phân giải
acid nucleic do enzyme nuclease [76].
Sự ổn định của G4 HIV thông qua các phân tử nhỏ cho thấy tác dụng chống
virus ở các mức độ khác nhau: phối tử G4 liên kết với ADN LTR G4 làm giảm
phiên mã virus, trong khi nếu nó liên kết với ARN LTR G4 sẽ ức chế quá trình
phiên mã ngược, dẫn đến cả hai trường hợp đều có tác dụng kháng virus mạnh
[101,102,105]. Sự ổn định qua trung gian là phối tử G4 của các nef G4 tạo ra hoạt
động chống virus phụ thuộc nef [106]. Gần đây, các chất ổn định G4 cũng được sử
dụng trong các tế bào bị nhiễm HIV-1 tiềm ẩn, trong đó hoạt động của chúng mang
lại hiệu quả chống virus mạnh, đặc biệt là kết hợp với chất ức chế sửa chữa ADN,
mở ra các hướng đi mới trong điều trị nhiễm HIV-1 tiềm ẩn [110].

1.5.2. Virus herpes
Herpesviridae là một họ virus lớn với bộ gen ADN sợi đôi dài. Trong số chín
loài virus herpes có thể lây nhiễm cho người, có ít nhất năm loài cực kỳ phổ biến,

ví dụ virus herpes simplex 1 và 2 (HSV-1 và HSV-2), varicella zoster virus,
Epstein–Barr virus (EBV) và cytomegalovirus, gây ra bệnh mụn rộp và mụn rộp
sinh dục (orolabial and genital herpes) [137], thủy đậu và bệnh zona [122], bạch
cầu đơn nhân [37] và một số bệnh ung thư [41]. Hơn 90% người trưởng thành đã bị
nhiễm ít nhất một trong số này [137]. Virus herpes cũng có xu hướng tiềm tàng, tái
phát nhờ những virus còn lại ở một phần của sinh vật bị nhiễm bệnh và thường duy
trì bộ gen của nó dưới dạng episome nhân ngoại bào [49].

14


×