Tải bản đầy đủ (.pdf) (47 trang)

Sàng lọc docking tìm kiếm hợp chất làm bền vững cấu trúc chuỗi xoắn tứ ADN (G4) trên tế bào ung thư ở người

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.44 MB, 47 trang )

BỘ Y TẾ
TRƢỜNG ĐẠI HỌC DƢỢC HÀ NỘI

NGUYỄN QUANG HƢNG

SÀNG LỌC DOCKING TÌM KIẾM
HỢP CHẤT LÀM BỀN VỮNG CẤU TRÚC
CHUỖI XOẮN TỨ ADN (G4)
TRÊN TẾ BÀO UNG THƢ Ở NGƢỜI

KHÓA LUẬN TỐT NGHIỆP DƢỢC SĨ

HÀ NỘI - 2019
1


BỘ Y TẾ
TRƢỜNG ĐẠI HỌC DƢỢC HÀ NỘI

NGUYỄN QUANG HƢNG
Mã sinh viên: 1401298

SÀNG LỌC DOCKING TÌM KIẾM
HỢP CHẤT LÀM BỀN VỮNG CẤU TRÚC
CHUỖI XOẮN TỨ ADN (G4)
TRÊN TẾ BÀO UNG THƢ Ở NGƢỜI

KHÓA LUẬN TỐT NGHIỆP DƢỢC SĨ
Người hướng dẫn:
TS. Phạm Thế Hải
Nơi thực hiện:


Bộ môn Hoá Dƣợc

HÀ NỘI - 2019
2


Lời cảm ơn
Trước hết, tôi xin bày tỏ lòng biết ơn sâu sắc và gửi lời cảm ơn chân
thành nhất tới người thầy của tôi – TS. Phạm Thế Hải, người đã đồng hành
cùng tôi vượt qua khó khăn, ân cần quan tâm, động viên, tận tình hướng dẫn,
chỉ bảo cho tôi từ những bước đi chập chững đầu tiên trên con đường nghiên
cứu khoa học và trong suốt quãng thời gian tôi thực hiện khóa luận.
Tôi cũng vô cùng biết ơn và xin được chân thành cảm ơn các thầy cô Bộ
môn Hóa dược đã hết sức nhiệt tình, tạo điều kiện thuận lợi giúp đỡ tôi trong
quá trình thực hiện khóa luận.
Tôi cũng xin được cảm ơn những người bạn đã đồng hành cùng tôi trong
suốt thời gian làm khóa luận.
Cuối cùng, tôi xin dành sự biết ơn sâu sắc nhất tới bố mẹ tôi và tất cả
những người thân trong gia đình, những người đã luôn yêu thương, ủng hộ để
tôi có được ngày hôm nay!
Hà Nội, Ngày 19 tháng 5 năm 2019
Sinh Viên
Nguyễn Quang Hƣng


MỤC LỤC

DANH MỤC CÁC KÝ HIỆU VIẾT TẮT ........................................................ 0
DANH MỤC CÁC BẢNG .................................................................................. 1
DANH MỤC CÁC HÌNH VẼ............................................................................. 2

ĐẶT VẤN ĐỀ ...................................................................................................... 1
CHƢƠNG 1. TỔNG QUAN ............................................................................... 2
1.1.

Tổng quan về Chuỗi xoắn tứ ADN (G4)......................................... 2

1.1.1. Khái niệm Chuỗi xoắn tứ ADN .......................................................... 2
1.1.2. Phân loại các Chuỗi xoắn tứ ADN ..................................................... 4
1.1.3. Chuỗi xoắn tứ ADN và vai trò trong ung thư..................................... 5
1.2.

Kỹ thuật Protein docking. ............................................................... 6

1.2.1. Đại cương về phương pháp Protein docking ..................................... 6
1.2.2. Quy trình Docking .............................................................................. 8
1.3.

Dự đoán đặc điểm dƣợc động học của các hợp chất tiềm năng ... 9

CHƢƠNG 2. NGUYÊN LIỆU, THIẾT BỊ, NỘI DUNG VÀ PHƢƠNG
PHÁP NGHIÊN CỨU ....................................................................................... 11
2.1.

Nguyên liệu và thiết bị ................................................................... 11

2.2.

Nội dung nghiên cứu ...................................................................... 11

2.3.


Phƣơng pháp nghiên cứu ............................................................... 11

2.3.1. Dock lại ............................................................................................ 11
2.3.2. Mô phỏng protein docking 36 hợp chất ........................................... 13
2.3.3. Dự đoán đặc điểm dược động học ................................................... 13
CHƢƠNG 3. KẾT QUẢ VÀ BÀN LUẬN ...................................................... 14
3.1.

Dock lại BRACO-19 ....................................................................... 14

3.2.

Cơ chế phân tử làm ổn định cấu trúc chuỗi xoắn tứ ADN ......... 16

3.2.1. Cơ chế làm ổn định trên protein 1KF1 ............................................ 16


3.2.2. Cơ chế làm ổn định trên protein 143D ............................................ 17
3.3.

Docking 36 hợp chất với protein ................................................... 18

3.3.1. Dock 36 chất với protein 1KF1 ........................................................ 27
3.3.2. Dock 36 chất với protein 143D ........................................................ 28
3.4.

Dự đoán đặc điểm dƣợc động học của hợp chất tiềm năng ....... 30

3.5.


Bàn luận........................................................................................... 33

3.5.1. Về tối ưu hoá năng lượng hợp chất .................................................. 33
3.5.2. Về sàng lọc ảo bằng Autodock Vina ................................................ 33
3.5.3. Về ưu điểm của phương pháp........................................................... 34
3.5.4. Về hạn chế của phương pháp ........................................................... 34
3.5.5. Về các nghiên cứu trong nước cùng hướng ..................................... 34
KẾT LUẬN VÀ KIẾN NGHỊ .......................................................................... 35
TÀI LIỆU THAM KHẢO ................................................................................ 36


DANH MỤC CÁC KÝ HIỆU VIẾT TẮT

A

Adenine

ADN

Acid deoxyribo-nucleic – phân tử mang thông tin di truyền

ARN

Acid ribo-nucleic

C

Cytosine


CSDL

Cơ sở dữ liệu

G4

G-quadruplex (Cấu trúc ADN bậc 2 gồm 4 guanin trên mặt phẳng)

NMR

Nuclear magnetic resonance – cộng hưởng từ hạt nhân

NST

Nhiễm sắc thể

G

Guanine

IC50

The half maximal inhibitory concentration (Nồng độ ức chế 50%,
thường dùng đối với các chất ức chế enzym, chất đối vận
receptor,…)

PDB

Protein Data Bank (Ngân hàng dữ liệu Protein)


QSAR

Quantitative structure-activity relationships (Quan hệ định lượng
giữa cấu trúc và tác dụng sinh học)

RMSD

Root mean square deviation (Độ lệch căn quân phương)

T

Thymine


DANH MỤC CÁC BẢNG
Bảng 1: Phân loại chuỗi xoắn tứ ADN ............................................................................4
Bảng 2: So sánh các tương tác giữa BRACO-19 gốc và BRACO-19 dock lại .............15
Bảng 3: Kết quả docking (G và tương tác) của 36 chất với 1KF1 và 143D ...............19
Bảng 4: Thông số dược động học của 3 hợp chất tiềm năng: 8, 16 và 20 ....................31


DANH MỤC CÁC HÌNH VẼ

Hình 1. 1: Cấu trúc ADN .................................................................................................2
Hình 1. 2: Telomere được sao chép bởi telomerase ........................................................3
Hình 1. 3: Cấu trúc sợi G và G-tetrad..............................................................................4
Hình 1. 4: Các cấu dạng phổ biến của chuỗi xoắn tứ ADN ............................................5
Hình 1. 5: Vai trò telomerase trong tế bào ung thư .........................................................6
Hình 1. 6: Bản chất của phương pháp protein docking ...................................................8


Hình 3. 1: Cơ chế ức chế protein 3CE5 của cấu tử BRACO-19 ...................................14
Hình 3. 2: Cấu dạng BRACO-19 dock lại và BRACO-19 mẫu trong protein 3CE5 ....15
Hình 3. 3: Cấu trúc và trung tâm hoạt động của 1KF1 .................................................17
Hình 3. 4: Cấu trúc protein 143D ..................................................................................18
Hình 3. 5:Hình ảnh tổng thể cấu trúc 36 hợp chất sau khi dock protein 1KF1 .............27
Hình 3. 6: Mô tả tương tác hợp chất 8, 16, 20 với protein 1KF1 ..................................28
Hình 3. 7: Hình ảnh tổng thể cấu trúc 36 hợp chất sau khi dock protein 143D ............29
Hình 3. 8: Mô tả tương tác hợp chất 8, 16, 20 với protein 143D ..................................30


ĐẶT VẤN ĐỀ
Chuỗi xoắn tứ ADN (G4) là một cấu trúc ADN hoàn toàn mới, không xoắn kép
và không tuân theo nguyên tắc bổ sung A-T G-C. Chuỗi xoắn tứ ADN gồm những
đoạn giàu guanine và có mặt ở những vị trí quan trọng trong gen như telomere, ARN
và vùng gen khởi động. Chuỗi xoắn tứ ADN (G4) thường xuất hiện trong telomere, là
một cấu trúc nằm ở hai đầu của nhiễm sắc thể và có vai trò ngăn chặn sự tiêu biến của
nhiễm sắc thể và làm ổn định bộ gen. Những khám phá trên cùng với sự quan sát in
vivo ở tế bào người đã cho thấy vai trò quan trọng của chuỗi xoắn tứ G4 ADN ở tế
bào.
Nhiều nghiên cứu và bằng chứng đã cho thấy những phân tử nhỏ có thể gắn với
chuỗi xoắn tứ G4 ADN để ức chế quá trình sao chép và nhân lên của tế bào ung thư.
Cho đến nay, một số hợp chất đã được xác định và tương tác của chúng với chuỗi xoắn
tứ G4 đã được nghiên cứu rộng rãi như BRACO-19, RHPS4 và Telomestatin. Tuy
nhiên, sự đa hình của chuỗi xoắn tứ – G4 tồn tại rất nhiều cấu dạng không gian, phụ
thuộc vào chuỗi acid nucleic và điều kiện một trường (Na+ hoặc K+) là một thách thách
lớn trong việc tìm kiếm hợp chất làm bền vững chuỗi xoắn tứ G4 nhằm ức chế tế bào
ung thư.
Trong nghiên cứu và tìm kiếm thuốc mới, docking là một trong những phương
pháp được sử dụng phổ biến nhất vì có khả năng dự đoán với độ chính xác khá cao sự
hình thành liên kết của cấu tử với receptor trong túi liên kết. Ra đời từ những năm

1980, docking phân tử đã trở thành một công cụ thiết yếu trong nghiên cứu và phát
triển thuốc [18].
Vì vậy, chúng tôi tiến hành khoá luận ―Sàng lọc docking tìm kiếm hợp chất làm
bền vững cấu trúc chuỗi xoắn tứ ADN (G4) trên tế bào ung thư ở người ‖ với ba mục
tiêu chính như sau:
- Tìm hiểu cơ chế phân tử làm bền vững chuỗi xoắn tứ ADN (G4) trên tế bào ung thư
ở người
- Sàng lọc docking tìm kiếm hợp chất làm bền vững cấu trúc chuỗi xoắn tứ ADN (G4)
trên tế bào ung thư ở người
- Dự đoán đặc điểm dược động học của các hợp chất tiềm năng ức chế tế bào ung thư
ở người.
1


CHƢƠNG 1. TỔNG QUAN
1.1.

Tổng quan về Chuỗi xoắn tứ ADN (G4)

1.1.1. Khái niệm Chuỗi xoắn tứ ADN
ADN là phân tử mang thông tin di truyền, được cấu tạo từ hai mạch polyme
sinh học xoắn đều quanh một trục tưởng tượng tạo thành chuỗi xoắn kép. Hai mạch
ADN này được gọi là các polynucleotide, bao gồm các đơn phân nucleotide. Mỗi
nucleotide được cấu tạo từ một trong bốn loại nucleobase chứa nitơ - cytosine (C),
guanine (G), adenine (A), hay thymine (T)—liên kết với đường deoxyribose và một
nhóm phosphat.
Khung xương chính của mạch ADN hình thành từ các nhóm phosphat và phân
tử đường luân phiên nhau. Các phân tử đường liên kết với nhau thông qua trung gian
nhóm phosphat tạo thành liên kết phosphodieste giữa nguyên tử cacbon thứ 3 với
nguyên tử cacbon thứ 5 trên hai mạch vòng của hai phân tử đường kế cận. Các đầu

không đối xứng kết thúc của chuỗi ADN là đầu 5′ (năm phẩy) và đầu 3′ (ba phẩy), với
đầu 5′ kết thúc bởi nhóm phosphat và đầu 3′ kết thúc bởi nhóm hydroxyl (OH) [5].
Rãnh ADN là những khoảng trống nằm cách nhau giữa hai mạch polynucleotid.
Những rãnh này nằm liền kề với các cặp base và có thể hình thành túi liên kết. Vì hai
mạch đơn không đối xứng nhau nên dẫn đến các rãnh có kích thước không đều, trong
đó rãnh lớn rộng 22 Å và rãnh nhỏ rộng 12 Å. Độ rộng của rãnh giúp cho các cạnh của
base trở nên dễ tiếp cận hơn trong rãnh lớn so với rãnh nhỏ [24].

Hình 1. 1: Cấu trúc ADN
(a) Chuỗi polynucleotid
(b) Rãnh ADN
2


Nucleoprotein telomere bao gồm những chuỗi lặp lại TTAGGG. Telomere hầu
hết có ở trong chuỗi xoắn kép, tuy nhiên ở đầu 3’ của nhiễm sắc thể tồn tại chuỗi đơn
telomere gồm 100-200 base. Sợi đơn telomere ở đầu 3’ có vai trò bảo vệ và chống lại
sự thoái hóa của nhiễm sắc thể [6].
Telomere được sao chép trong quá trình phân bào bởi enzyme phiên mã ngược
telomerase. Telomerase gồm cả ARN và protein. Phần ARN chứa trình tự AAUCCC
và đóng vai trò làm khuôn mẫu tổng hợp telomere trong khi phần protein đảm bảo cho
enzym hoạt động. Enzym này kéo dài đoạn đầu mút và tạo điều kiện để ADN
polymerases (enzym tác động vào quá trình kéo dài chuỗi ADN) thực hiện sao chép
dọc chiều dài cho đến tận điểm cuối NST (Hình 1.2).

Hình 1. 2: Telomere được sao chép bởi telomerase
Sợi G trong Telomere nhô ra ngoài đầu 3’ của telomere và gấp lại để hình thành
G4-ADN (G-quadruplexes) – chuỗi axit nucleic giàu guanine. Mỗi cấu trúc G4-ADN
gồm nhiều G-Quartet (hoặc G-tetrad) xếp chồng lên nhau. Mỗi G-quartet gồm 4
Guanine nằm trên một mặt phẳng, ở giữa là ion kim loại [28] (Hình 1.3).


3


Hình 1. 3: Cấu trúc sợi G và G-tetrad
1.1.2. Phân loại các Chuỗi xoắn tứ ADN
Có hơn 200 loại chuỗi xoắn tứ ADN đã được tìm thấy, trong đó chúng được
phân loại theo số lượng phân tử, cấu dạng không gian theo chiều của mạch và ion
kim loại (Bảng 1).
Bảng 1: Phân loại chuỗi xoắn tứ ADN
Số phân tử

Cấu dạng

Chuỗi

Ion kim loại

PDB ID

d[AG3(T2AG3)3]

Na+

143D

d(G2T2G2TGTG2T2G2)

K+


148D

d[(G3T2A)3G3T]

K+

2KF7

d[AG3(T2AG3)3]

K+

1KF1

d[(T2AG3)4T2]

K+

2JPZ

d[(G3T2A)3G3T]

K+

2KF8

Không

d[G3T2CAG2]


Na+

1F3S

song song

d[G4T4G4]

K+

1JPQ

Song song

r[UAG3U2AG3U]

K+

2KBP

K+

2AQY

K+

139D

Không
song song

Đơn phân tử

Song song
Hỗn hợp

Lưỡng phân
tử

Hỗn hợp
Tứ phân tử

Song song

d[(GIG(T2AG3)2T]
d[(TAG3U]
d[T2G4T]

4


Chuỗi xoắn tứ ADN tồn tại dưới nhiều cấu dạng không gian khác nhau phụ
thuộc vào basơ nitơ, ion làm ổn định cấu trúc và mật độ phân tử [34]. Theo chiều của
mạch, các chuỗi xoắn tứ ADN có 3 cấu dạng chính là song song, khôn song song và
hỗn hợp (Hình 1.4).

Hình 1. 4: Các cấu dạng phổ biến của chuỗi xoắn tứ ADN
Có 2 loại ion trong tế bào là Na+ và K+. Để nghiên cứu sự đa dạng về cấu trúc
của chuỗi xoắn tứ ADN, chúng tôi nghiên cứu 2 PDB ( code 1KF1 và 143D) tương
ứng với 2 loại ion trong mối trường là K+ và Na+ và 2 loại cấu dạng song song và
không song song.

1.1.3. Chuỗi xoắn tứ ADN và vai trò trong ung thư
Telomere bảo vệ các nhiễm sắc thể trong quá trình phân bào, giữ cho các nhiễm
sắc thể không dính vào nhau. Do vậy, độ ổn định và tuổi của tế bào phụ thuộc vào độ
dài của telomere. Khi sao chép nhiễm sắc thể, các enzym sao chép ADN không nhân
bản đến đầu cuối của nhiễm sắc thể, nên trong mỗi lần nhân bản đầu của nhiễm sắc thể
được rút ngắn. Các telomere trở nên ngắn hơn sau mỗi lần tái tạo ADN và cuối cùng
mất khả năng bảo vệ ADN khỏi quá trình phá hủy và đột biến. Sự ngắn đi của
telomere có thể là một lý do cho sự lão hóa, không chỉ ở các tế bào đơn lẻ mà còn ở cả
cơ thể sinh vật.
Đa số tế bào không phân chia một cách thường xuyên nên NST của chúng gặp
ít rủi ro và có vẻ ít cần đến hoạt động của telomere. Ngược lại, tế bào ung thư có khả
năng phân chia vô hạn và phải bảo tồn chuỗi telomere. Một lý do giải thích tại sao tế
bào ung thư không lão hóa và chết theo chương trình là sự hoạt động mạnh mẽ của
telomerase [30].
Sự biểu hiện quá mức của telomerase làm kéo dài đuôi telomere. Các nghiên
cứu trước chỉ ra 80 – 85% tế bào ung thư có sự biểu hiện quá mức telomerase. Có 2
5


cách để nhắm đích telomerase. Một là ức chế trực tiếp telomerase bằng cách chặn hoạt
tính xúc tác của các đơn vị nhỏ hoặc khuôn mẫu ARN, làm ngắn telomere và tế bào
không còn khả năng phát triển. Hai là cách không trực tiếp, làm ổn định cấu trúc G4 để
chặn telomerase gắn vào telomere hoặc ức chế sự liên kết của protein liên quan đến
telomerase, làm telomere mở mũ và chết theo chương trình. Các nghiên cứu gần đây
tập trung vào tìm hợp chất làm ổn định G4-DNA hơn là ức chế tác dụng của
telomerase [19] (Hình 1.5).

Hình 1. 5: Vai trò telomerase trong tế bào ung thư
1.2.


Kỹ thuật Protein docking.

1.2.1. Đại cương về phương pháp Protein docking
Protein docking – ra đời từ những năm 1980 – đã trở thành một trong những
phương pháp được sử dụng phổ biến nhất trong quá trình thiết kế thuốc dựa trên cấu
trúc vì có khả năng dự đoán với độ chính xác khá cao sự hình thành liên kết của cấu tử
với receptor trong túi liên kết. Nó phản ánh sự thành công của việc ứng dụng dữ liệu
về cấu trúc của protein, được tạo bởi tinh thể học tia X và phương pháp cộng hưởng từ
hạt nhân (nuclear magnetic resonance – NMR). Mặc dù kỹ thuật này không thể áp
dụng với mọi protein, tuy nhiên nó đã cung cấp những thông tin giá trị về kiểu liên kết
và tương tác ở nhiều protein [32].
Docking đánh giá những liên kết có ý nghĩa và độ bền cao, và thậm chí còn có
thể định lượng khả năng liên kết bởi các hàm tính điểm, qua đó phân hạng khả năng
liên kết mạnh yếu của các cấu tử [18]. Nhờ ưu điểm thực hiện trên máy tính với tốc độ
6


càng ngày càng nhanh, chính xác và chi phí không quá lớn, protein docking dần được
coi là bước khởi đầu cho nghiên cứu thiết kế thuốc hiện đại.
Docking thực chất một bài toán tối ưu, tìm vị trí và cấu hình phù hợp và đánh
giá tương tác của một cơ chất gắn kết vào túi liên kết của protein. Về mặt nhiệt động
lực học, mục tiêu chính của docking là tìm ra cấu hình mà năng lượng tự do của toàn
hệ là thấp nhất. Để tìm cấu hình phù hợp nhất, cần liên hệ cấu hình không gian với các
trị số đánh giá được khả năng gắn kết của cơ chất lên protein và sau đó áp dụng thuật
toán tìm kiếm [18] (Hình 1.6).
Thuật giải di truyền (Genetic Algorithm - GA) là thuật toán tìm kiếm được ứng
dụng nhiều trong các chương trình docking như Autodock, Autodock Vina, GOLD.
GA áp dụng các lí thuyết liên quan đến học thuyết tiến hoá và chọn lọc tự nhiên. Đầu
tiên, thuật toán sẽ mã hoá tất cả các tham số của cấu trúc ban đầu trong một nhiễm sắc
thế - biểu diễn bằng một vec tơ. Từ nhiễm sắc thể ban đầu này, tạo ngẫu nhiên một

quần thể bao phủ một miền năng lượng. Quần thể này được đánh giá và từ đó các
nhiễm sắc thể thích nghi nhất (tức là có giá trị năng lượng thấp nhất) được chọn làm
khung để tạo ra quần thể tiếp theo. Quy trình này làm giảm năng lượng trung bình của
toàn bộ nhiễm sắc thể bằng cách truyền các đặc tính cấu trúc thuận lợi từ một quần thể
này sang một quần thể khác. Sau một số chu kỳ tìm kiếm và đánh giá, cuối cùng ta sẽ
tìm được một nhiễm sắc thể (cấu dạng) phù hợp với mức năng lượng tối thiểu [23].
Chương trình docking sử dụng các hàm tính điểm (scoring function) để ước
lượng các năng lượng liên kết của phức hợp cấu tử - receptor. Năng lượng này được
cho bởi hằng số liên kết (Kd) và năng lượng tự do Gibbs (ΔGL). Dự đoán về năng
lượng liên kết được thực hiện bằng cách đánh giá những tương tác hóa lý quan trọng
bao gồm: các tương tác liên phân tử, các ảnh hưởng solvat và entropy [18]. Do đó, số
lượng các tham số hoá lý được đánh giá càng lớn thì độ chính xác càng cao. Tuy
nhiên, nếu số lượng biến càng lớn thì thời gian tính toán sẽ lâu. Các hàm tính điểm
hiệu quả nên đưa ra sự cân bằng giữa độ chính xác và tốc độ, đây là một điểm quan
trọng khi làm việc với cơ sỡ dữ liệu lớn.

7


Hình 1. 6: Bản chất của phương pháp protein docking
1.2.2. Quy trình Docking
Quá trình docking được thực hiện thông qua ba bước: chuẩn bị cấu tử, chuẩn bị
protein, mô phỏng docking.
Chuẩn bị cấu tử: cấu trúc các cấu tử có thể được lấy từ hệ thống dữ liệu có sẵn
như Pubchem, Zinc, Asinex database. Trong trường hợp không có sẵn, chúng ta có thể
xây dựng cấu trúc cấu tử bởi các phần mềm như ChemDraw, MarvinSketch… Sau khi
xây dựng được cấu trúc 3D, sử dụng các phần mềm để chuẩn bị cấu tử cho chương
trình mô phỏng docking, các bước chuẩn bị thường được tiến hành gồm: gắn hydro,
gắn trường lực, xây dựng file pdbqt.
Chuẩn bị protein: Cấu trúc 3D của protein thường có sẵn trên ngân hàng dữ

liệu protein (protein data bank) ―‖. Trong trường hợp chưa có
sẵn, chúng ta có thể xây dựng cấu trúc 3D theo phương pháp mô phỏng tính tương
đồng (homology modeling). Sau khi có cấu trúc 3D, sử dùng các phần mềm để chuẩn
bị protein cho chương trình mô phỏng docking. Các bước chuẩn bị thường gồm: loại
nước và các cấu tử (nếu có), thêm hydro, gắn trường lực và xây dựng file pdbqt.
Mô phỏng docking: Trước khi phần mềm tiến hành tìm kiếm vị trí và cấu dạng
phù hợp của cấu tử, cần khoanh vùng tìm kiếm (grid box) cho thuật toán. Kích thước
của vùng tìm kiếm không nên quá lớn vì như thế sẽ tốn kém thời gian và độ lặp lại
không cao, cũng không nên quá nhỏ vì như vậy phần mềm chỉ tìm kiếm được một
vùng rất nhỏ, không có ý nghĩa. Vị trí của vùng tìm kiếm thông thường sẽ được đặt ở
trung tâm hoạt động của protein. Sau khi xác định vị trí và kích thước của vùng tìm
kiếm, phần mềm sẽ tự động tìm kiếm và đưa ra cấu dạng phù hợp với năng lượng thấp

8


nhất. Cấu dạng này cùng với các tương tác của nó với protein sẽ được phân tích bởi
các phần mềm chuyên dụng như: MOE, Pymol, Discovery studio…
1.3.

Dự đoán đặc điểm dƣợc động học của các hợp chất tiềm năng
Các thông số hấp thu (Absorption), phân bố (Distribution), chuyển hóa

(Metabolism), thải trừ (Excretion) có vai trò quan trọng trong việc đánh giá một chất
có phù hợp hay không để làm thuốc phù hợp với cơ thể người. Việc tìm ra một thuốc
mới đòi hỏi hao tổn rất nhiều chi phí cả về thời gian và tiền bạc bao gồm các bước: lựa
chọn đích tác dụng, nhận dạng mục tiêu, tìm kiếm chất có tiềm năng, thử nghiệm tiền
lâm sàng và thử nghiệm lâm sàng.
Trước đây, chỉ có rất ít thuốc mới được phê duyệt và đưa ra thị trường trong số
hàng trăm ngàn các ứng viên. Hai nguyên nhân chính cho sự thất bại này là do tác

dụng sinh học của các hợp chất kém và độc tính của chúng quá cao. Khảo sát nhiều
ứng viên tiềm năng cho thấy có tới 50% các chất có tiềm năng bị loại bỏ do bị loại
khỏi thị trường hoặc thất bại trong việc thử nghiệm lâm sàng do tác dụng phụ quá
nguy hiểm. Ngày nay, khi việc đánh giá thông số ADME được chú ý hơn, chỉ còn gần
10% các thuốc thất bại do không đáp ứng được các thuộc tính ADME, một con số nhỏ
hơn nhiều so với trước đây [9].
Việc chắt lọc và tối ưu hóa các thông số ADME trong giai đoạn đầu thử nghiệm
thuốc được nghiên cứu kĩ lưỡng. Tuy nhiên, với hàng triệu các hợp chất tiềm năng,
việc đánh giá thuộc tính dược động học của tất cả các hợp chất tiêu tốn một số tiền
khổng lồ.
Do đó, kết hợp với các nghiên cứu thử nghiệm in vitro, kỹ thuật tính toán thuộc
tính ADME bằng các server ảo được coi là phương pháp thay thế tối ưu.
Hiện nay có rất nhiều công cụ dự đoán ADME được xây dựng bởi các tổ chức
lớn trên thế giới như các web server: PreADMET ADMET Prediction, PreADMET
Toxicity Prediction, SwissADME, admetSAR,… các phần mềm như chemTree,
Volsurf, ADMET, MDL®Metabolite Database,…
Trong đó, SwissADME [13] là một trong những công cụ phổ biến.
SwissADME là một công cụ trên web cho phép người dùng truy cập miễn phí những

9


mô hình dự đoán nhanh và mạnh mẽ về đặc tính hóa lý, dược động học, và những đặc
tính gần giống thuốc hóa dược.
Bộ công cụ này được thiết kế một cách đơn giản, thân thiện và dễ sử dụng, tích
hợp trên trang web online Việc tính toán thông qua cấu
dạng SMILES (Simplified Molecular Input Line Entry Specification) - là dạng cấu trúc
phân tử số hóa dưới dạng ký tự ASCII. SMILES được sử dụng khá rộng rãi trong danh
pháp hóa học và định dạng cấu trúc dữ liệu trên máy tính.


10


CHƢƠNG 2. NGUYÊN LIỆU, THIẾT BỊ, NỘI DUNG VÀ PHƢƠNG PHÁP
NGHIÊN CỨU
2.1.

Nguyên liệu và thiết bị
Nguyên liệu:
Cấu trúc của 36 hợp chất được sàng lọc bằng phương pháp định lượng quan hệ

cấu trúc – tác dụng từ CSDL Asinex
Cấu trúc tinh thể tia X của chuỗi xoắn tứ ADN (1KF1, 143D và 3CE5) được tải
từ ngân hàng dữ liệu protein (protein data bank), loại nước, gắn hydro và thêm trường
lực.
Thiết bị: Sử dụng các phần mềm trên máy tính Acer V5-471G – Hệ điều hành
Windows 10.
Phần mềm: Danh sách các phần mềm sử dụng bao gồm:
1. ChemBioOffice 2010

7. UCSF Chimera 1.10.2

2. MarvinSketch 17.15.0

8. Microsoft Word 2016

3. MGLtools 1.5.6

9. Microsoft Excell 2016


4. Autodock Vina 1.1.210

10. PyRx 0.8

5. Discovery Studio 2017

11. MOE 2009

6. PyMOL 2.3.0
2.2.

Nội dung nghiên cứu

1. Tìm hiểu cơ chế phân tử làm bền vững chuỗi xoắn tứ ADN trên tế bào ung thư
ở người
2. Mô phỏng protein docking, xác định cấu dạng của các chất có khả năng làm bền
vững chuỗi xoắn tứ ADN trên tế bào ung thư ở người
3. Dự đoán đặc điểm dược động học của các hợp chất tiềm năng ức chế tế bào ung
thư ở người
2.3.

Phƣơng pháp nghiên cứu

2.3.1. Dock lại
Dock lại là phương pháp quan trọng để thẩm định quy trình dock và kiểm tra
khả năng tạo ra các cấu dạng có tương tác gần giống với của cấu tử đã biết có tác dụng
làm ổn định chuỗi xoắn tứ ADN. Quy trình dock được đánh giá là phù hợp nếu sự sai
lệch giữa cấu tử ở vị trí ban đầu trong cấu trúc tinh thể, và cấu tử sau khi dock lại là
11



không đáng kể. Vì không có cấu tử mẫu trong 2 protein 1KF1 và 143D và để mô
phỏng các điều kiện như 2 protein, protein 3CE5 với cấu trúc tinh thể phân giải 2.5 Å
trong môi trường K+ và cấu tử BRACO19 đã được lựa chọn [1]. Các bước dock lại
BRACO19 gồm:
Chuẩn bị hợp chất: Sử dụng Chemdraw để xây dựng cấu trúc 2D của
BRACO19, sau đó xây dựng công thức 3D hợp chất này nhờ phần mềm MarvinSketch.
Sau đó, sử dùng phần mềm MGLtools thêm hydrogen, gắn trường lực gasteiger và xây
dựng file pdbqt.
Chuẩn bị protein: Cấu trúc tinh thể thích hợp của chuỗi xoắn tứ ADN ( PDB
ID 3CE5) [8] được lấy từ ngân hàng dữ liệu protein (Protein data bank). Sau đó, loại
nước, các cấu tử (ligand) ra khỏi cấu trúc của protein và cuối cùng thêm hydro, gắn
trường lực Kollman và xây dựng file pdbqt. Tất cả các bước này đều được tiến hành
trên phần mềm MGLtools
Mô phỏng docking: Dữ liệu các File pdbqt đã xây dựng của hợp chất và của
protein sẽ được tiến hành docking, sử dụng phần mềm Autodock Vina [29] và PyRx
[15]. Trung tâm grid box được đặt ở vị trí giữa trong cấu trúc tinh thể. Kích thước Grid
box : 34 x 34 x 34 Å để bao trùm toàn bộ protein. Số vòng lặp cho chương trình là 4
vòng, còn các tham số khác được cài đặt ở chế độ mặc định. Mỗi cấu tử sẽ được dock
5 lần. Phân tích các kết quả bằng phần mềm PyMOL, Discovery studio và MOE.
Đánh giá kết quả: Chúng tôi đánh giá sự tương đồng của hợp chất gốc và hợp
chất dock lại theo hai chỉ tiêu: Độ lệch căn quân phương (Root mean square deviation
- RMSD), điểm đánh giá tương tác và khả năng tương tác.
 RMSD: RMSD đo khoảng cách trung bình của các nguyên tử giữa 2 cấu dạng
hợp chất. Công thức tính RMSD cho 2 cấu dạng a, b như sau:
RMSD( a ,b ) 



1 n

 (aix  bix ) 2  (aiy  biy ) 2  (aiz  biz ) 2
n i 1



Trong đó n là tổng số nguyên tử; ix, iy, iz là toạ độ không gian của nguyên tử
thứ i.
RMSD càng lớn thì mức độ sai lệch của hai cấu dạng càng lớn.
 Điểm đánh giá tương tác: Điểm số đánh giá theo thuyết ΔG.
Phương trình là tập hợp giá trị các tham số đi kèm với hệ số theo một lý thuyết
áp đặt nhất định. Mỗi loại tương tác, ví dụ như tương tác liên kết hydro, tương
12


tác kị nước,… đều được gán cho 1 miền giá trị. Kết quả cuối phản ánh khả năng
tương tác mạnh hay yếu của phối tử với receptor.
 Khả năng tương tác: sử dụng phần mềm MOE để phân tích các tương tác giữa
BRACO-19 dock lại với protein, các tương tác này được so sánh với các tương tác của
BRACO-19 ban đầu. Các phối tử chỉ có liên kết lỏng lẻo hoặc không có liên kết được
bỏ qua. Mặt khác khả năng tương tác còn được đánh giá thông qua thông số năng
lượng liên kết, năng lượng liên kết càng thấp, khả năng tương tác giữa cấu tử và
protein càng mạnh.
2.3.2. Mô phỏng protein docking 36 hợp chất
Sau khi quy trình dock được thẩm định bởi kết quả dock lại BRACO-19 vào
protein 3CE5 với các điều kiện tương tự, chúng tôi sử dụng quy trình này để mô phỏng
protein docking 36 hợp chất trong cơ sở dữ liệu vào 2 protein 1KF1 và 3CE5. Kết quả
mô phỏng protein docking được phân tích bởi các phần mềm MOE, PyMOL và
Discovery.
2.3.3. Dự đoán đặc điểm dược động học
Các thông số ADME được dự đoán trên server SwissADME [13]. Dữ liệu cấu

trúc được nạp vào server qua cấu dạng SMILES để tính toán các thông số hóa lý và
dược động học của các phân tử.

13


CHƢƠNG 3. KẾT QUẢ VÀ BÀN LUẬN
3.1.

Dock lại BRACO-19
BRACO-19 là cấu tử có nhân Acridine và 3 nhóm thế ở vị trí 3,6,9. Nó ức chế

hoạt động của enzyme telomerase, làm ngắn telomere và đã được chứng minh tác dụng
ức chế hoạt động của tế bào ung thư in vitro và in vivo [7].
Cấu trúc tinh thể 3CE5 gồm BRACO-19 và 2 chuỗi xoắn tứ d(TAG3TTAG3T)
(Chuỗi A và Chuỗi B) tạo thành 3 mặt phẳng G-tetrad. BRACO-19 chỉ stack pi-pi trực
tiếp với 2 guanine trong G-tetrad ở đầu 3’ – G11 ở chuỗi A và G17 ở chuỗi B. Nhóm
thế linh động ở vị trí 3 và 6 gồm cation Nitơ nằm trong rãnh ADN rộng và nông, đối
diện với mặt G-tetrad và được bao bọc bởi khung phosphate mang điện âm và có liên
kết hydro với đầu 3’ T24 của chuỗi B . Nhóm thế anilino ở vị trí 9 nằm trong một túi
hẹp kỵ nước [8] (Hình 3.1).

Hình 3. 1: Cơ chế ức chế protein 3CE5 của cấu tử BRACO-19

14


Cấu dạng BRACO-19 sau khi dock lại được so sánh với cấu dạng ban đầu của
nó trong tinh thể 3CE5. (Hình 3.2)


Hình 3. 2: Cấu dạng BRACO-19 dock lại và BRACO-19 mẫu trong protein 3CE5
(Ghi chú: Màu xanh là BRACO19 gốc, màu vàng là BRACO19 dock lại, hình ảnh
được vẽ trên phân mềm PyMOL)
 RMSD  8Å do đó sự khác nhau giữa 2 cấu dạng của BRACO19 là khác biệt.
 Các tương tác giữa BRACO-19 với protein sau khi dock được so sánh với các
tương tác gốc thể hiện trong bảng

Bảng 2: So sánh các tương tác giữa BRACO-19 gốc và BRACO-19 dock lại
BRACO-19 gốc

BRACO-19 dock lại

Stack pi-pi với G11 và G17

Stack pi-pi với G11 và G17

Hình ảnh
docking

Acridine

15


Nhóm

-

Nằm trong rãnh ADN


thế số 3,6

-

Liên kết hydro với T24

Nhóm
thế số 9

Nằm trong túi hẹp kỵ nước

-

Nằm trong rãnh ADN

-

Không liên kết hydro
T24

Nằm trong túi hẹp kỵ nước

Mặc dù RMSD giữa cấu tử gốc và cấu tử dock lại khá cao, tuy nhiên phân tích
tương tác cho thấy khá tốt khi nhân acridine của BRACO19 redock và BRACO19 gốc
gần như trùng khớp nhau, nằm song song với mặt phẳng G-tetrad ở đầu 3’ và stack pipi với G11 và G17. Bên cạnh đó nhóm thế ở vị trí 3 và 6 nằm trong rãnh ADN bao bọc
bởi khung phosphate mang điện âm tương tự với BRACO-19 ở trong cấu trúc tinh thể
ban đầu. Nhóm thể ở vị trí số 9 cũng nằm trong túi hẹp kỵ nước, đằng sau T12.
Ngoài ra, năng lượng tương tác giữa hợp chất và protein được tính toán bởi
phần mềm Autodock Vina là ΔG = -9,8 Kcal/mol. Kết quả này cho thấy mức độ tương
tác tốt, tương tự với các kết quả docking của một số tác giả trước đó.

Như vậy mặc dù chỉ tiêu đánh giá là RMSD không tốt, tuy nhiên xét khả năng
tương tác và độ trùng khớp cho thấy sự tương đồng giữa cấu trúc của BRACO-19 gốc
và BRACO-19 dock lại. Kết quả này khẳng định quy trình dock là phù hợp, và do đó
chúng tôi tiến hành quy trình dock này cho toàn bộ 36 hợp chất trong CSDL.

3.2.

Cơ chế phân tử làm ổn định cấu trúc chuỗi xoắn tứ ADN

3.2.1. Cơ chế làm ổn định trên protein 1KF1
Để sàng lọc tìm kiếm các chất làm bền vững chuỗi xoắn tứ ADN, việc phân tích
về trung tâm hoạt động và cơ chế làm bền vững nó là cần thiết.
Trong mỗi trường K+, cấu trúc tinh thể hóa 3D của chuỗi xoắn tứ ADN đơn phân
tử, song song bởi Gary N. Parkinson, Michael P. H. Lee và Stephen Neidle năm 2002
(ID 1KF1, độ phân giải 2.1 Å) [26] được tải về từ ngân hàng dữ liệu protein (protein
data bank). Protein gồm 3 mặt phẳng G-quartet, mỗi mặt phẳng gồm 4 Guanine nối
với nhau bởi 3 vòng nối đảo chiều TTA – mỗi vòng nối gồm 3 nucleotid Thymine,
Thymine và Adenine.

16


Hình 3. 3: Cấu trúc và trung tâm hoạt động của 1KF1
(a) Cấu trúc 1KF1
(b) Trung tâm hoạt động của 1KF1
Theo các nghiên cứu trước đó, hầu hết các hợp chất làm ổn định G4 đã biết có
một hệ vòng thơm phẳng với hệ liên kết pi liên hợp stack pi-pi với mặt phẳng Gtetrad của protein. Đồng thời, những chuỗi bên và nhóm thế mang điện dương của
cấu tử làm tăng ái lực liên kết bằng cách tương tác với nhóm phosphate mang điện
âm của khung ADN [4]. Điều kiện cần thiết cho sự ổn định của chuỗi xoắn tứ ADN
là sự tương tác với mặt phẳng G-tetrad ở đầu 3’ gồm 4 guanine: G4, G10, G10, G22

Như vậy, để một cấu tử có thể thể hiện làm ổn định chuỗi xoắn tứ ADN, nó phải có
vòng thơm để stack pi-pi với mặt phẳng G4 bao gồm 4 guanin: G4, G10, G16 và G22.
Đồng thời cấu tử cũng phải có nhóm thế có thể tương tác với rãnh ADN, nhóm
phosphate hoặc vòng TTA để tạo sự ổn định cho cấu tử trong trung tâm hoạt động.
3.2.2. Cơ chế làm ổn định trên protein 143D
Trong mỗi trường Na+, cấu trúc tinh thể hóa 3D của chuỗi xoắn tứ ADN đơn phân
tử, không song song bởi Yong Wang và Dinshaw Patel năm 1993 (ID 143D, solution
NMR) [31] được tải về từ ngân hàng dữ liệu protein (protein data bank). Protein 143D
gồm 4 phần lặp lại AG3, gấp lại tạo thành 3 mặt phẳng G-quartet, mỗi mặt phẳng gồm
17


×