Tải bản đầy đủ (.pdf) (53 trang)

Kết hợp phương pháp protein docking trong xây dựng mô hình tương quan định lượng cấu trúc hoạt tính ức chế histone deacetylase II của một số dẫn xuất acid hydroxamic đã tổng hợp

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.86 MB, 53 trang )

BỘ Y TẾ
TRƯỜNG ĐẠI HỌC DƯỢC HÀ NỘI
**********

HOÀNG VĂN QUÂN
1101417

KẾT HỢP PHƯƠNG PHÁP PROTEIN
DOCKING TRONG XÂY DỰNG MÔ
HÌNH TƯƠNG QUAN ĐỊNH LƯỢNG CẤU
TRÚC - HOẠT TÍNH ỨC CHẾ HISTONE
DEACETYLASE II CỦA MỘT SỐ DẪN
XUẤT ACID HYDROXAMIC ĐÃ TỔNG
HỢP
KHÓA LUẬN TỐT NGHIỆP DƯỢC SĨ

HÀ NỘI - 2017
1


BỘ Y TẾ
TRƯỜNG ĐẠI HỌC DƯỢC HÀ NỘI
**********

HOÀNG VĂN QUÂN
1101417

KẾT HỢP PHƯƠNG PHÁP PROTEIN DOCKING VÀ
QSAR TRONG XÂY DỰNG MÔ HÌNH TƯƠNG QUAN
ĐỊNH LƯỢNG CẤU TRÚC - HOẠT TÍNH ỨC CHẾ
ENZYM HISTONE DEACETYLASE II(HDAC2)


CỦA MỘT SỐ DẪN XUẤT ACID HYDROXAMIC
ĐÃ TỔNG HỢP

KHÓA LUẬN TỐT NGHIỆP DƯỢC SĨ

Người hướng dẫn:

TS. Phạm Thế Hải
Nơi thực hiện:

Bộ môn Hoá Dược

HÀ NỘI - 2017
2


Lời cảm ơn
Trước hết, tôi xin bày tỏ lòng biết ơn sâu sắc và gửi lời cảm ơn chân
thành nhất tới người thầy của tôi – TS. Phạm Thế Hải, người đã đồng hành
cùng tôi vượt qua khó khăn, ân cần quan tâm, động viên, tận tình hướng dẫn,
chỉ bảo cho tôi từ những bước đi chập chững đầu tiên trên con đường nghiên
cứu khoa học và trong suốt quãng thời gian tôi thực hiện khóa luận.
Tôi xin chân thành cảm ơn cô Nguyễn Họa Mi, anh Phạm Trọng Lâm
công tác tại Khoa Hóa học, Trường Đại học KHTN – Đại học Quốc gia Hà
Nội, đã chỉ bảo tận tình cho tôi từ những bước đi ban đầu khi nhận đề tài.
Tôi cũng vô cùng biết ơn và xin được chân thành cảm ơn, các thầy cô
Bộ môn Hóa dược đã hết sức nhiệt tình, tạo điều kiện thuận lợi giúp đỡ tôi
trong quá trình thực hiện khóa luận.
Tôi cũng xin được cảm ơn những người bạn đã đồng hành cùng tôi
trong suốt thời gian làm khóa luận.

Cuối cùng, tôi xin dành sự biết ơn sâu sắc nhất tới bố mẹ tôi và tất cả
những người thân trong gia đình, những người đã luôn yêu thương, ủng hộ để
tôi có được ngày hôm nay!
Hà Nội, Ngày 18 tháng 5 năm 2017
Sinh Viên
Hoàng Văn Quân


MỤC LỤC
DANH MỤC CÁC KÝ HIỆU VIẾT TẮT
DANH MỤC CÁC BẢNG
DANH MỤC CÁC HÌNH VẼ
ĐẶT VẤN ĐỀ ............................................................................................................1
CHƯƠNG 1. TỔNG QUAN .....................................................................................2
1.1.

Tổng quan về Histon Deacetylase (HDAC) ...........................................2

1.1.1. Khái niệm Histon Deacetylase ................................................................2
1.1.2. Phân loại các HDAC. .............................................................................3
1.1.3. Trung tâm hoạt động và cơ chế ức chế HDAC2 ...................................4
1.1.4. Các chất ức chế HDAC 2 ........................................................................5
1.1.5. HDAC2 và vai trò trong ung thư. ...........................................................7
1.2.

Tổng quan về phương nghiên cứu QSAR .............................................8

1.2.1. Lịch sử QSAR ..........................................................................................8
1.2.2. Đại cương về QSAR ................................................................................9
1.2.3. Quy trình xây dựng mô hình QSAR. ....................................................10

1.3.

Kỹ thuật Protein docking. .....................................................................14

1.3.1. Đại cương về phương pháp Protein docking ........................................14
1.3.2. Quy trình Docking ................................................................................15
CHƯƠNG 2. NGUYÊN LIỆU, THIẾT BỊ, NỘI DUNG VÀ PHƯƠNG PHÁP
NGHIÊN CỨU .........................................................................................................15
2.1.

Nguyên liệu và thiết bị ..........................................................................17

2.2.

Nội dung nghiên cứu.............................................................................17

2.3.

Phương pháp nghiên cứu ......................................................................17

2.3.1. Mô phỏng protein docking ....................................................................17
2.3.2. Xây dựng mô hình QSAR ......................................................................19
2.3.3. Thiết kế và dự đoán hoạt tính sinh học một số hợp chất. .....................20
CHƯƠNG 3. KẾT QUẢ VÀ BÀN LUẬN ............................................................23
3.1.

Mô phỏng protein docking....................................................................23


3.1.1. Re-dock SAHA.......................................................................................23

3.1.2. Mô phỏng protein docking 45 hợp chất ................................................25
3.2.

Xây dựng mô hình QSAR .....................................................................27

3.2.1. Kết quả mô hình ....................................................................................27
3.2.2. Đánh giá mô hình .................................................................................27
3.3.

Thiết kế một số hợp chất có khả năng ức chế HDAC2 sử dụng mô

phỏng protein docking và dự đoán hoạt tính của chúng dựa trên mô hình QSAR
xây dựng được. ......................................................................................................30
3.3.1. Danh sách các hợp chất thiết kế ...........................................................30
3.3.2. Mô phỏng protein docking. ...................................................................30
3.3.3. Dự đoán hoạt tính sinh học sử dụng mô hình QSAR. ...........................33
3.4.

Bàn luận về phương pháp nghiên cứu ..................................................34

KẾT LUẬN VÀ KIẾN NGHỊ ................................................................................38
TÀI LIỆU THAM KHẢO


DANH MỤC CÁC KÝ HIỆU VIẾT TẮT
HDAC Histon deacetylase
HDAC2
FDA

Histon deacetylase 2

Food and Drug Administration (Cơ Quan Quản lý Thực phẩm
và Dượcphẩm Hoa Kỳ)

QSAR

Quantitative Structure–Activity Relationship (Tương quan định lượng

cấu trúc – tác dụng)
HAT Enzym Histon Acetyltransferase
His

Histidin

Asp

Aspartic acid

Pro

Prolin

Phe

Phenylalanin

Leu

Leucin

Glu


Glutamic acid

Tyr

Tyrosin

ZBG

Zinc Binding Group (Nhóm gắn kẽm)

SAHA

Suberoylanilide hydroxamic acid

CTCL

Cutaneous T-cell lymphoma ( U lympho da tế bào)

IC50The half maximal inhibitory concentration (Nồng độ ức chế 50%,
thường dùng đối với các chất ức chế enzym, chất đối vận receptor,…)
MoRSE

Molecule Representation of Structures based on Electron diffraction

(Tham số mô tả cấu trúc phân tử dựa trên nhiễu xạ điện tử)
GETAWAYGEometry, Topology, and Atom-Weights AssemblY (Nhóm tham
sốmô tả về hình học, hình học topo và trọng lượng nguyên tử)
GA


Genetic Algorithm(Thuật giải di truyền)

KdHằng số liên kết
ΔGL Năng lượng tự do Gibbs
TrS

Training set (Tập huấn luyện)

TSTest set (Tập kiểm tra)


RMSDRoot mean square deviation (Độ lệch căn quân phương)
MLR Multiple Linear Regression (Phương pháp hồi quy tuyến tính đa biến)
h

Giá trị đòn bẩy

h*

Giá trị đòn bẩy cảnh cáo

Å

Angstrom (Đơn vị đo khoảng cách, chiều dài liên kết)

R2Hệ số xác định
Q2Hệ số tương quan chéo
Q2ext

Hệ số xác định cho tập kiễm tra



DANH MỤC CÁC BẢNG
Bảng 1.1.Tóm tắt về các HDAC kinh điển với các đặc điểm về: kích thước, vị trí
phân bố trong tế bào và chức năng sinh lý. ................................................................3
Bảng 1.2. Các chất ức chế HDAC đang thử nghiệm lâm sàng ..................................6
Bảng 1.3. Các phần mềm tính tham số phân tử thông dụng.....................................11
Bảng 3.1. So sánh các liên kết giữa SAHA gốc và SAHA dock lại với protein ........24
Bảng 3.2. Kết quả đánh giá nội và đánh ngoại mô hình QSAR ...............................28
Bảng 3.3. Kết quả docking 36 hợp chất....................................................................32
Bảng 3.4. Kết quả dự đoán họat tính ức chế HDAC2 của 36 hợp chất thiết kế. ......33


DANH MỤC CÁC HÌNH VẼ
Hình 1.1: Cấu trúc nhiễm sắc thể điều hòa hoạt động phiên mã. ………………….2
Hình 1.2. Cấu tạo trung tâm hoạt động và cơ chế ức chế của HDAC2. ………….5
Hình 1.3. Cấu trúc một số dẫn xuất acid hydroxamic. ………………………………...7
Hình 3.1. Cấu dạngSAHA trong HDAC2 .................................................................23
Hình 3.2. Kết quả mô phỏng protein docking của 45 hợp chất vào HDAC2 ...........25
Hình 3.3.Độ dài liên kết phối trí Zn tới -C=O và OH-NH- .....................................26
Hình 3.4. Năng lượng liên kết của các hợp chất. .....................................................27
Hình 3.4. Miền ứng dụng của mô hình QSAR xác định hợp chất có khả năng ức chế
HDAC2 ......................................................................................................................28
Hình 3.5. Cấu trúc 2D của 36 hợp chất. ..................................................................30
Hình 3.6. Kết quả docking của 36 hợp chất .............................................................31
Hình 3.7.Áp dụng miền ứng dụng cho các hợp chất thiết kế....................................34
Hình 3.8. Kết quả docking của SAHA sau khi tối ưu hoá bởi các phần mềm khác
nhau. ..........................................................................................................................36



ĐẶT VẤN ĐỀ
Histon deacetylase (HDAC)là một đích phân tử quan trọng trong nghiên cứu
các thuốc điều trị ung thư hiện nay[37]. Nhiều chất chất ức chế HDAC với đặc điểm
cấu trúc đa dạng đã được xác định. Trong số đó, bốn hợp chất là Vorinostat,
Romidepsin, Belinostat và Panobinostat đã được Cơ Quan Quản lý Thực phẩm và
Dược phẩm Hoa Kỳ (FDA) phê duyệt thành thuốc điều trị ung thư[17],[18],[28]. Vì
vậy, tổng hợp các chất ức chế HDAChiện đang là hướng đi đầy hứa hẹn trong
nghiên cứu thuốc điều trị ung thư. Tuy nhiên,tổng hợp và thử hoạt tính các hợp chất
là một quá trình tốn kém cả về thời gian và tiền bạc. Nhằm tiết kiệm và nâng cao
hiệu quả tìm kiếm, thiết kế thuốc với sự hỗ trợ của máy tính (Computer-Aided Drug
Design) đã trở thành một hướng chủ đạo của nghiên cứu dược học trên thế giới.
Trong đó, xây dựng mô hình tương quan định lượng cấu trúc – hoạt tính (QSAR) là
một trong những phương pháp được ứng dụng nhiều hiện nay. Mô hình QSAR giúp
dự đoán hoạt tính sinh học của các hợp chất,ngay cả khi chúng chưa được tổng hợp,
nhờ đó giúptiết kiệm thời gian, chi phí và giúp định hướng tổng hợp. Cho tới nay,đã
có nhiều mô hình QSARdự đoán hoạt tính ức chế HDAC được xây dựng. Tuy
nhiên, các mô hình này có hạn chế là: các tham số phân tửchưa thể hiện được vị trí
và cấu dạng của cấu tử khi nó ức chế protein,do đó không phản ánh hết mối tương
quan giữa cấu trúc và hoạt tính[27],[35]. Để khắc phục hạn chế này chúng tôi tiến
hành khoá luận “Kết hợp phương pháp protein docking trong xây dựng mô hình
tương quan định lượng cấu trúc - hoạt tính ức chế Histone Deacetylase II của một số
dẫn xuất acid hydroxamic đã tổng hợp”với ba mục tiêu chính như sau:
- Sử dụng cấu dạng thu được từ mô phỏng protein docking, xây dựng mô hình toán
học mô tả mối tương quan định lượng giữa cấu trúc và hoạt tính (QSAR) ức chế
HDAC2 của một số acid hydroxamic đã tổng hợp.
- Thiết kế và dự đoánhoạt tính cho một sốacid hydroxamic mới.

1



CHƯƠNG 1. TỔNG QUAN
1.1.

Tổng quan về Histon Deacetylase (HDAC)

1.1.1. Khái niệm Histon Deacetylase
Cấu trúc của nhiễm sắc thể gồm 3 thành phần: ADN, protein histon và
protein không phải histon[25]. Đơn vị cơ bản của nhiễm sắc thể là nucleosom. Mỗi
nucleosom gồm 146 cặp base ADN được gói trong một protein histon octame [11]
tạo bởi 4 thành phần: H2A, H2B, H3, H4 [38].
Các đầu amin của protein histon thường bị biến đổi bởi các quá trình methyl
hóa, phosphoryl hóa hoặc acetyl hóa sau dịch mã. Quá trình acetyl hoá là một trong
những cơ chế điều hoà chính của biểu thị gen duới sự cân bằng hoạt động của
enzym Histon Acetyltransferase (HAT) và enzym HDAC [5].

Hình 1.1: Cấu trúc nhiễm sắc thể điều hòa hoạt động phiên mã.
(a) Sự methyl hóa và deacetyl hóa histon dẫn tới hình dạng đóng xoắn nhiễm sắc
thể và ức chế phiên mã. (b) Sự acetyl hóa và demethyl hóa histon làm tháo xoắn
nhiễm sắc thể và cho phép phiên mã.
HAT là enzym acetyl hóa nhóm -NH2 trong gốc lysin (đầu N tận) của
histon, làm trung hòa điện tích dương trên lysin, do đó giảm khả năng tương tác
của histon với ADN (tích điện âm) tạo cấu trúc mở chromatin. Vì vậy, sự acetyl
hóa histon tạo điều kiện cho quá trình phiên mã, dịch mã xảy ra (Hình 1.1b)
[5],[25].
2


HDAC là enzym có tác dụng đối lập với HAT, giúp loại bỏ nhóm acetyl từ
acetyl lysin (Ac-Lys) ở đầu N tận của histon, tạo điều kiện cho sự methyl hoá đuôi
lysin làm cho ADN cuộn xoắn chặt chẽ hơn và ngăn cản các yếu tố phiên mã xâm

nhập vào ADN, dẫn đến ức chế phiên mã (Hình 1.1a) [5],[25].
1.1.2. Phân loại các HDAC.
Hiện nay người ta đã biết đến 18 loại HDAC khác nhau, được chia thành 4
nhóm: I, II, III, IV. HDAC nhóm I, II và IV được gọi là các HDAC “kinh điển”
phụ thuộc vào Zn2+. Đặc điểm của các enzym này được trình bày tóm tắt trong
bảng 1.1.
Bảng 1.1.Tóm tắt về các HDAC kinh điển với các đặc điểm về: kích thước, vị trí
phân bố trong tế bào và chức năng sinh lý.
Nhóm

HDAC

Sốlượng

Vị trí phân

acid amin

bố trong tế

Chức năng sinh lý

bào
HDAC1

483

Nhân tế bào

Điều hoà sự sống sót và nhân

lên của tế bào

HDAC2

488

Nhân tế bào

Điều hoà sự nhân lên của tế bào
và sự kháng insulin

I

HDAC3

428

Nhân tế bào

Điều hoà sự sống sót và nhân
lên của tế bào

HDAC8

377

Nhân tế bào

HDAC4


1084

Nhân tế bào/ Điều hoà sự tân tạo xương và
Tế bào chất

HDAC5

1122

IIa

Điều hoà sự nhân lên của tế bào

tân tạo đường

Nhân tế bào/ Điều hoà chức năng và sự tăng
Tế bào chất

trưởng của các yếu tố tim
mạch, Điều hoà sự tân tạo
đường, Điều hoà chức năng của
tế bào cơ tim và màng tế bào

HDAC7

912

Nhân tế bào/ Biệt hoá tế bào tiền thân tạo

3



Tế bào chất

máu, điều hoà chức năng nội
mô và quá trình tân tạo đường

HDAC9

1069

Nhân tế bào/ Tái tổ hợp tương đồng, Biệt
Tế bào chất

hoá tế bào tiền thân tạo máu,
Điều hoà tăng trưởng và chức
năng của tế bào cơ tim

HDAC6

1215

Chủ yếu Tế Sự di động của tế bào, kiểm
bào chất

soát động lực học khung xương
tế bào

IIb


HDAC10 669

Nhân tế bào/ Tái tổ hợp tương đồng, Điều
Tế bào chất

HDAC11 347
IV

hoà quá trình tự thực

Nhân tế bào/ Nhân bản các DNA liên quan
Tế bào chất

đến hệ miễn dịch

1.1.3. Trung tâm hoạt động và cơ chế ức chế HDAC2
Để thiết kế các dẫn xuất ức chế enzym HDAC2, việc phân tích về trung tâm
hoạt động và cơ chế ức chế nó là cần thiết. Cấu trúc tinh thể hóa3D của enzym
HDAC2 bởi Lauffer năm 2013 (ID 4LXZ, độ phân giải 1,85Å)[33]được tải về từ
ngân hàng dữ liệu protein (protein data bank). Phân tích cấu trúc này bởi phần
mềm Pymol ta thấy: Trung tâm hoạt động gồm túi enzyme và co-factor là Zn2+.
Phần miệng túi rộng hình vành được tạo ra từ các chuỗi acid amin như: Gly32,
His33, Pro34, Glu103, Asp104, Leu276,...Thân túi có chiều dài khoảng 4-6C, tạo
bởi các acid amin: Gly154, Phe155, Phe210,... Đáy túi chứa co-factor Zn2+ đóng
vai trò quan trọng trong cơ chế xúc tác của enzym. Zn2+ tạo các liên kết phối trí
với các acid amin ở đáy như His183, Asp 181, Asp269. Bên cạnh đó các acid amin
như Tyr308, His145, His146 cũng đóng vai trò quan trọng trong việc tạo sự ổn
định cho liên kết phối trí của co-factor (Hình 1.2).

4



Le
u2
76

Pro
34

Phe155

Gly32
Gly154

His33

Glu103

As
p1
04

Ph
e21
0

Hình a: Cấu
ấu tạo miệng túi.
Tyr
30

8

H
Hình
b: Cấu
ấu tạo thân túi.

As
p2
69

Zn2+
His183

Asp181
His145

His146

Hình c: Cấu
ấu tạo đáy túi.

H
Hình
d: Cơ chếế ức chế HDAC2.

Hình 1.2. Cấu
ấu tạo
t trung tâm hoạt động và cơ chếế ức chế của HDAC2.
Như vậy, đểể một cấu tử có thể thể hiện vai trò ức chếenzym HDAC2, nó cần

phải khóa được ion Zn2+ qua đó ức chế quá trình xúc tác của
ủa enzym. Do đó cấu trúc
của
ủa cấu tử phải có các nhóm chức có thể tạo được
đ
liên kết
ết phối trí với Zn2+, đồng
thời cũng
ũng có khả năng tạo liên kết được với các acid
cid amin quan tr
trọng như His145,
His146, Tyr308 đểể tạo sự ổn định
đị cho cấu
ấu tử trong trung tâm hoạt động.
1.1.4. Các chất ứcc chế
ch HDAC 2
1.1.4.1.

Cấu
ấu trúc các chất ức chế HDAC2
HDAC

Cấu
ấu trúc các chất ức chế HDAC2 gồm 3 phần chính[14]::
-

Nhóm khóa hoạt
ạt động (Capping
(
group): là các vòng thơm

ơm ho
hoặc peptid vòng,

thường tham gia vào
ào quá trình nhận
nh diện với bề mặt acid amin

5


-

Vùng cầu nối (Linker): thường là các nhóm sơ nước, gồm các hydrocacbon

thân dầu mạch thẳng hoặc vòng, có thể no hoặc không no, có vai trò tạo liên kết van
der waals với thân túi (kênh enzym).
-

Nhóm gắn với kẽm (Zinc Binding Group - ZBG): có thể là acid hydroxamic,

các thiol, nhóm o-aminoanilin của benzamid, mercaptoceton... Nhóm kết thúc gắn
với kẽm tham gia tạo tương tác với ion Zn2+ tại trung tâm hoạt động của các HDAC.
1.1.4.2.

Các chất ức chế HDAC2 đã biết

Trong các nhóm chất ức chế HDAC, các acid hydroxamic là nhóm chất được
quan tâm chú ý và tập trung nghiên cứu nhiều nhất. Do các acid hydroxamic có cấu
trúc đơn giản, dễ tổng hợp và có nhóm -CONHOH tạo được phức bền với Zn2+ở
trung tâm hoạt động của HDAC mang lại có hoạt tính ức chế enzym mạnh. Hiện

nay, FDA đã phê duyệt một acid hydroxamic ức chế HDAC điển hình là vorinostat
(Suberoylanilide hydroxamic acid - SAHA) vào năm 2006 sử dụng trong điều trị u
lympho da tế bào (Cutaneous T-cell lymphoma - CTCL)]. Bảng 1.2 liệt kê các acid
hydroxamic tiêu biểu, bao gồm SAHA và một số hợp chất hiện đang trong các giai
đoạn nghiên cứu lâm sàng. Cấu trúc của chúng có thể được tham khảo trong Hình
1.3. Hiện nay, nhiều chất ức chế enzym HDAC với đặc điểm cấu trúc khác với acid
hydroxamic cũng đang được thử nghiệm lâm như nhóm benzamid (SNDX-275, CI994 và MGCD-0103 đang nghiên cứu pha II), acid carboxylic (AN-9, Acid valproic
–pha II, Phenyl butyrate –pha I lâm sàng), các peptid vòng (FK228 hiên trong pha II
lâm sàng)[1],[49].
Bảng 1.2. Các chất ức chế HDAC đang thử nghiệm lâm sàng
Hợp chất
SAHA

Pha lâm sàng
Được đưa vào điều trị

Loại ung thư
Ung thư Lympho da tế bào

PXD101

II

Thể rắn, ung thư máu

NVP-LAQ824

II

Ung thư máu


LBH-589

I

Thể rắn, ung thư máu

ITF-2357

III

Thể rắn, AML, ALL, MDS

SB-939

II

U lympho Hodgkin

CRA 024781

I

Thể rắn, ung thư máu
6


O

H

N

N
H

O

OH

O

O O
N S
H

SAHA

N
H

OH

PXD101
O

OH

HN OH
N
H


N

OH
O
NH

HN

N
H

LBH-589

NVP-LAQ824
O
O
O
N

N
H

O
HO

NH
OH

N


N
H

N
N

ITF-2357

SB-939
N

O
H
N

O

N
H

OH

O

O

CRA 024781

Hình 1.3. Cấu trúc một số dẫn xuất acid hydroxamic

1.1.5. HDAC2 và vai trò trong ung thư.
HDAC2 thuộc HDAC nhóm I, hoạt động như một chất ức chế phiên mã
thông qua deacetyl hóa lysine ở đầu N của protein histon (H2A, H2B, H3 và H4).
Tuy nhiên HDAC2 không liên kết với ADN nên chúng sẽ được chọn lọc bởi các
yếu tố phiên mã như YY1, SP1/SP3, gen ức chế khối u p53 và BRCA1. HDAC2
cũng có thể được gắn vào ADN như là một phần của phức hợp CoREST, mSin3
và NuRD. Những phức hợp là mục tiêu với các trình tự gen đặc hiệu bằng các
tương tác với các yếu tố phiên mã trình tự đặc hiệu. Ví dụ, các

7


HDAC2/HDAC1chứa phức hợp Sin3-SAP chọn lọc họ E2F của các yếu tố phiên
mã để ức chế phiên mã [9].
HDAC2 cũng quy định biểu hiện gen thông qua sự deacetyl của yếu tố
phiên mã cụ thể bao gồm STAT3 và SMAD7. HDAC2 là một chìa khóa quan
trọng của gen điều hòa chu kỳ tế bào, quá trình tế bào tự tiêu diệt, kết dính tế bào
và di cư. Cùng với HDAC1, HDAC2 quy định việc phiên mã của các gen liên
quan đến quá trình tạo máu, biệt hóa tế bào biểu mô, phát triển tim và tế bào thần
kinh [12].
Các đột biến có thể có ở HDAC2 xuất hiện ở tế bào soma. HDAC2 bị đột
biến trong các khối u lẻ tẻ và trong các khối u phát sinh ở người có ung thư biểu
mô đại trực tràng không polyp di truyền. Đột biến này do sự cắt bỏ 9 adenin ở
exon1 tạo thành protein không hoạt động. Sự biểu hiện các dạng đột biến của
HDAC2 gây ra sự kháng với tác dụng của các chất ức chế HDAC. Việc thiếu các
biểu hiện và chức năng HDAC2 tạo nên sự tăng điều chỉnh gen thúc đẩy tăng
trưởng khối u [2],[34]. HDAC2 liên quan đến nhiều bệnh ung thư khác nhau: đại
tràng, ung thư vú, ung thư tuyến tiền liệt, ung thư biểu mô tế bào gan, và ung thư
phổi.
1.2. Tổng quan về phương nghiên cứu QSAR

1.2.1. Lịch sử QSAR
Lịch sử phát triển của phương pháp QSAR có thể nói khởi nguồn từ những
nghiên cứu của Crum-Brown và Frasher (1868)khi nhận xét rằng tác dụng sinh học
là hàm số của cấu trúc hóa học[8]. Đến năm 1893, Richet đã cho rằng sự khác nhau
về tác dụng sinh học là do sự thay đổi về tính chất lí hóa[36]. Đến năm 1935, một
phương trình quan trọng của Hammett được coi là mô hình đầu tiên biểu diễn mối
quan hệt hoạt tính và cấu trúc:
Log (1)
Với K, Ko là hằng số acid,  là hằng số Hammett, thông số hóa lý đặc trưng
cho khả năng hút hoặc đấy điện tử của nhóm thế[19].

8


QSAR thực sự được nghiên cứu bởi C.L. Corwin Hansch từ những năm
60 của thế kỉ 20[20],[21]. Mô hình QSAR Hansch thường sử dụng phương pháp hồi
quy tuyến tính đa biến để biểu thị mối tương quan giữa các tham số hóa lí và hoạt
tính sinh học, ví dụ một phương trình của ông như sau:
Log (1/C) = k1+ k22+ k3 (2)
Trong đó: C là nộng độ mol mà tại đó hoạt chất thể hiện hoạt tính sinh học, :
hằng số kỵ nước, : hằng số thế Hammett, k1,k2,k3 là các hệ số hồi quy.
Kể từ đây, đã có nhiều phương trình QSAR cùng với những phương pháp xây
dựng đa dạng đã ra đời và chiếm một vai trò quan trọng trong nghiên cứu và phát
triển dược phẩm.
1.2.2. Đại cương về QSAR
Mô hình QSAR dựa trên giả thuyết là các hợp chất có đặc điểm cấu trúc
tương đồng sẽ có tính chất sinh học tương đồng. Về mặt toán học, mô hình QSAR
biểu diễn mối tương quan định lượng giữa cấu trúc phân tử và hoạt tính thông qua
phương trình:
Y  f (x ) (3)


Trong đó, Y là biến phụ thuộc, phản ánh hoạt tính sinh học của các hợp chất.
Giá trị của Y được xác định thông qua các nghiên cứu thực nghiệm, ví dụ như nồng
độ ức chế 50% hoạt tính của enzyme (IC50). Y cũng có thể nhận giá trị rời rạc, ví dụ
như có hay không có hoạt tính, hoạt tính mạnh hay yếu. Các biến x trong mô hình
QSAR được gọi là các tham số phân tử, mô tả một đặc điểm cấu trúc nào đó của
phân tử hóa học. Theo Todeschini và Consonni [41], tham số phân tử là kết quả
cuối cùng của một quy trình toán học hoặc logic, biến đổi thông tin hóa học (vốn
được đã hóa dưới dạng ký hiệu như C, H, N...) thành một số thực. Tham số phân tử
cũng có thể là kết quả thực nghiệm nào đó, như LogP, độ phân cực, v.v. Hiện nay,
tham số phân tử có thể được chia thành 4 nhóm, dựa trên chiều thông tin
(dimension) mô tả cấu trúc: (i) Tham số 0D mô tả thành phần cấu tạo nên cấu trúc,
còn được gọi là các tham số đếm nguyên tử, như số lượng C, N... (ii) Tham số 1D
mô tả cấu trúc dưới dạng chuỗi, như vân tay cấu trúc (fingerprint), hay số lượng các

9


mảnh cấu trúc, như số lượng nhân thơm, nhóm carboxylic... (iii) Tham số 2D mô tả
cấu trúc dưới dạng hình học topo, cho phép xác định chính xác thứ tự, vị trí của
nguyên tố hay mảnh cấu trúc trong phân tử. Các tham số 2D thường được tính toán
dựa trên lý thuyết về graph. (iii) Tham số 3D mô tả đặc điểm cấu trúc của phân tử
trong không gian. Các tham số 3D có thể được tính toán dựa trên các phương pháp
lý thuyết như MoRSE, GETAWAY, tính toán lượng tử, mô tả bề mặt hoặc thể tích
phân tử... Hiện nay, các nghiên cứu xây dựng mô hình QSAR dựa trên tham số 3D
chủ yếu dựa trên cấu trúc hóa học được tối ưu hóa năng lượng trong môi trường
chân không mà không quan tâm đến cấu dạng của phân tử khi nó nằm trong trung
tâm hoạt động của đích, chịu tác động của các động lực của môi trường gắn kết. Do
đó, mô hình QSAR chưa phản ánh chính xác mối tương quan cấu trúc-tác dụng của
hoạt chất với đích phân tử của chúng.

Hàm f là một hàm mô tả mối tương quan giữa Y và các biến x. Để xây dựng
được hàm f, cần áp dụng các thuật toán thống kê (statistical) hoặc học máy
(machine learning). Một số kỹ thuật thống kê thường được sử dụng trong xây dựng
mô hình QSAR có thể kể đến như bình phương tối thiểu từng phần (Partial Least
Squares), hồi quy đa biến tuyến tính (Multiple Linear Regression),phân tích thành
phần chính (Principal Component Analysis)[6],[12],[50]. Kỹ thuật học máy là một
lĩnh vực của trí tuệ nhân tạo, liên quan đến việc nghiên cứu và xây dựng các kĩ thuật
cho phép các hệ thống "học" tự động từ dữ liệu để giải quyết những vấn đề cụ thể.
Trong xây dựng mô hình QSAR, các phương pháp học máy thường được sử dụng
là: Cây quyết định (Decision Tree), mạng nơron nhân tạo (Artificial Neural
Network),...[3]
1.2.3. Quy trình xây dựng mô hình QSAR.
Xây dựng cơ sở dữ liệu: Cơ sở dữ liệu thường là cấu trúc của các hợp chất
hoá học đã được chứng minh hoạt tính sinh họcin vitro. Để hạn chế các yếu tố gây
sai số cho mô hình, cơ sở dữ liệu thường sẽ được làm sạch dựa trên sự tương đồng
về cấu trúc, về protocol,...

10


Tính toán tham số mô tả phân tử đặc trưng cho cấu trúc: Tiến hành xây
dựng cấu trúc 2D, 3D của các hợp chất thu được, sau đó sử dụng các phần mềm để
tính toán các tham số phân tử. Số lượng tham số phân tử mà phần mềm tính toán
càng nhiều thì càng mô tả chính xác cấu trúc của hợp chất.
Bảng 1.3. Các phần mềm tính tham số phân tử thông dụng
STT

Tên phần

Loại tham số tính được


mềm
1

ADAPT

Số lượng
tham số

Tham số cấu trúc hình học, hình học >260
tô pô, tham số điện tử, tham số lí
hoá...

2

3

ADMET

Tham số điện tử, tham số hàm lượng 297

Predictor

tử, tham số hình học tô pô ..

MOE

Tham số hình học topo, tính chất vật >300
lý..


4

Dragon

Tham số cấu tạo cơ bản, tham số cấu 5270
trúc hình học và hình học tô pô...

Xử lí sơ bộ dữ liệu: Trước khi tiến hành xây dựng mô hình, cần tiến hành xử
lí sơ bộ sô liệu để hạn chế bớt sai số, cũng như công việc cho chương trình xây
dựng mô hình. Công việc này có thể bao gồm loại bỏ các giá trị nằm ngoài phân bố
của dữ liệu (outlier), chuyển đổi hàm thức của hoạt tính sinh học (logarit hóa, mũ
hóa, nghịch đảo...), loại bỏ TSPT không liên quan,...
Xây dựng mô hình QSAR: sử dụng các phương pháp xác xuất thống kê và
các kỹ thuật của trí tuệ nhân tạo để xây dựng mối liên hệ giữa các tham số phân tử
và giá trị đại lượng biểu diễn hoạt tính.
Đánh giá mô hình: Đánh giá mô hình là giai đoạn quan trọng liên quan đến
khả năng ứng dụng của mô hình. Đánh giá mô hình thường sử dụng 5 nguyên tắc
của OECD[43]:

11


-

Nguyên tắc 1: Có đích xác định (defined end-points).
Đích là những giá trị thực nghiệm về hoạt tính sinh học thu được tư cơ sở dữ

liệu. Nếu toàn bộ CSDL đều sử dụng một protocol để xác định giá trị của đích, thì
mô hình xây dựng được có độ tin cậy cao, có thể dùng để dự đoán hoạt tính các hợp
chất mới (nếu thực nghiệm dùng theo quy trình này). Còn nếu CSDL sử dụng nhiều

protocol khác nhau thì mô hình sẽ không có độ tin cậy cao.
-

Nguyên tắc 2: Các thuật toán sử dụng được mô tả rõ ràng.
Các thuật toán sử dụng để xây dựng mô hình cần được mô tả rõ ràng, có khả

năng ứng dụng để xây dựng các mô hình khác. Cần xem xét các yếu tố sau khi đánh
giá thuật toán:
 Dữ liệu về cấu trúc, hoạt tính sinh học đầy đủ, rõ ràng.
 Thuật toán tính toán các tham số phân tử rõ ràng.
 Mô tả về tập huấn luyện và tập quan sát, cách xác định giá trị ngoại lai
(outlier).
 Mô tả thuật toán xây dựng mô hình.
 Mô tả các thông số thống kê đánh giá mô hình.
-

Nguyên tắc 3: Có miền cấu trúc ứng dụng xác định.
Miền cấu trúc ứng dụng là khoảng không gian cấu trúc được xác định bởi các

hợp chất trong tập huấn luyện để xây dựng mô hình. Những hợp chất thuộc tấp huấn
luyện nếu có cấu trúc nằm ngoài miền cấu trúc ứng dụng sẽ ảnh hưởng đến độ chính
xác của mô hình. Những hợp chất thuộc tập dự đoán, nếu cấu có cấu trúc nằm ngoài
miền này sẽ cho kết quả dự đoán không chính xác.Các phương pháp xác định miền
ứng dụng thường gặp như: phương pháp đòn bẩy, phương pháp ba lân cận gần
nhất,...[40],[45].
-

Nguyên tắc 4:Có độ khớp, độ ổn định, và khả năng dự đoán tốt.
 Độ khớp hay độ tuyến tính được đánh giá thông qua giá hệ số xác định R2,


R2 càng cao thì mức độ khớp (tuyến tính) của mô hình với các giá trị thực nghiệm
càng tốt.R2> 0,6 thì mô hình mới có ý nghĩa. Công thức tính hệ số xác định như sau:

12


2

^
 n

  ( y i  yi ) 
 (4)
R 2  1   i n1


  ( yi  y ) 
 i 1

^

Trong đó n là số các quan sát của tập huấn luyện; yi, y ,lần lượt là giá trị thực tế, giá
trị dự đoán của biến phụ thuộc ở quan sát thứ i; y là giá trị thực tế trung bình của
biến phụ thuộc.
 Độ ổn định được đánh giá thông qua hệ số tương quan chéo Q2, Q2 được
đánh giá dựa trên phương pháp tham số chéo (cross validation leave one out) bằng
cách lần lượt loại 1 quan sát ra khỏi tập huấn luyện, giữ nguyên các biến đã lựa
chọn và tính toán lại các thông số của mô hình. Q2 càng gần 1, tính tổng quát hóa
của mô hình càng cao, mô hình càng ổn định. Thông thường, yêu cầu Q2 > 0,5 thì
mô hình mới bền vững.Công thức hệ số tương quan chéo tính như sau:

2

^
 n

  ( y i  yi / i ) 
 (5)
Q 2  1   i 1n


  ( yi  y ) 
 i 1


Trong đó n là số các quan sát tập huấn luyện; yi, là giá trị thực tế của quan sát
^

thứ i; yi / i giá trị dự đoán của biến phụ thuộc ở quan sát thứ i sử dụng mô hình đã
loại biến i; y là giá trị thực tế trung bình của biến phụ thuộc.

13


 Khả năng dự đoán ngoại
Khả năng dự đoán ngoại được đánh giá thông qua giá trị Q2ext, Q2ext càng lớn
mô hình cho thấy độ tuyến tính của tập kiễm tra và do vậy chứng tỏ khả năng dự
đoán của mô hình cao.
2

2

Qext

^
 n

  ( y i  yi ) 
 (6)
 1   i n1


  ( yi  y) 
 i 1

^

Trong đó n là số các quan sát tấp kiểm tra; yi, y , lần lượt là giá trị thực tế, giá
trị dự đoán của biến phụ thuộc ở quan sát thứ i; y là giá trị thực tế trung bình của
biến phụ thuộc.
-

Nguyên tắc 5: Giải thích được cơ chế (nếu có thể).
Mô hình cần được giải thích về vai trò của các biến trong mô hình, qua đó giúp

định hướng thiết kế các hợp chất mới. Tuy nhiên việc giải thích các biến này nhiều
khi gặp phải khó khăn vì cơ chế của chúng phức tạp đòi hỏi những hiểu biết chuyên
sâu về hóa lượng tử. Bên cạnh đó có nhiều biến chưa có các tài liệu tham khảo, do
đó chưa đủ cơ sở để giải thích.
1.3.

Kỹ thuật Protein docking.


1.3.1. Đại cương về phương pháp Protein docking
Protein docking là một trong những phương pháp được sử dụng phổ biến
nhất trong quá trình thiết kế thuốc dựa trên cấu trúc vì có khả năng dựđoán với độ
chính xác khá cao sự hình thành liên kết của cấu tử với receptor trong túi liên kết.
Ra đời từ những năm 1980[23], docking phân tử đã trở thành một công cụ thiết yếu
trong nghiên cứu và phát triển thuốc. Không những chỉ ra các liên kết có ý nghĩa,
docking còn có thể định lượng khả năng liên kết bởi các hàm tính điểm, qua đó
phân hạng khả năng liên kết mạnh yếu của các cấu tử[24]. Docking trở thành một
bài toán tối ưu, tìm vị trí và cấu hình phù hợp nhất của một cơ chất gắn kết lên
protein. Về mặt nhiệt động lực học, mục tiêu chính của docking là tìm ra cấu hình
mà năng lượng tự do của toàn hệ là thấp nhất. Để tìm cấu hình phù hợp nhất, cần

14


liên hệcấu hình không gian với các trị số đánh giá được khả năng gắn kết của cơ
chất lên protein và sau đó áp dụng thuật toán tìm kiếm [24].
Thuật giải di truyền (Genetic Algorithm - GA) là thuật toán tìm kiếm được
ứng dụng nhiều trong các chương trình docking như Autodock, Autodock Vina,
GOLD[11],[19],[36]. GA áp dụng các lí thuyết liên quan đến học thuyết tiến hoá và
chọn lọc tự nhiên. Đầu tiên, thuật toán sẽ mã hoá tất cả các tham số của cấu trúc ban
đầu trong một nhiễm sắc thế - biểu diễn bằng một vec tơ. Từ nhiễm sắc thể ban đầu
này, tạo ngẫu nhiên một quần thể bao phủ một miền năng lượng. Quần thể này được
đánh giá và từ đó các nhiễm sắc thể thích nghi nhất (tức là có giá trị năng lượng
thấp nhất) được chọn làm khung để tạo ra quần thể tiếp theo. Quy trình này làm
giảm năng lượng trung bình của toàn bộ nhiễm sắc thể bằng cách truyền các đặc
tính cấu trúc thuận lợi từ một quần thể này sang một quần thể khác. Sau một số chu
kỳ tìm kiếm và đánh giá, cuối cùng ta sẽ tìm được một nhiễm sắc thể (cấu dạng)
phù hợp với mức năng lượng tối thiểu[17]

Chương trình docking sử dụng các hàm tính điểm (scoring function) để ước
lượng các năng lượng liên kết của phức hợp cấu tử - receptor. Năng lượng này được
cho bởi hằng số liên kết (Kd) và năng lượng tự do Gibbs (ΔGL). Dự đoán về năng
lượng liên kết được thực hiện bằng cách đánh giá những tương tác hóa lý quan
trọng bao gồm: các tương tác liên phân tử, các ảnh hưởng solvat và entropy[24]. Do
đó, số lượng các tham số hoá lý được đánh giá càng lớn thì độ chính xác càng cao.
Tuy nhiên, nếu số lượng biến càng lớn thì thời gian tính toán sẽ lâu. Các hàm tính
điểm hiệu quả nên đưa ra sự cân bằng giữa độ chính xác và tốc độ, đây là một điểm
quan trọng khi làm việc với cơ sỡ dữ liệu lớn.
1.3.2. Quy trình Docking
Quá trình docking được thực hiện thông qua ba bước: chuẩn bị cấu tử, chuẩn
bị protein, mô phỏng docking.
Chuẩn bị cấu tử: cấu trúc các cấu tử có thể được lấy từ hệ thống dữ liệu có
sẵn như Pubchem,Zinc[16],[22]. Trong trường hợp không có sẵn, chúng ta có thể
15


xây dựng cấu trúc cấu tử bởi các phần mềm như ChemDraw, Chemsketch…Sau khi
xây dựng được cấu trúc 3D, sử dụng các phần mềm để chuẩn bị cấu tử cho chương
trình mô phỏng docking, các bước chuẩn bị thường được tiến hành gồm: gắn hydro,
gắn trường lực, xây dựng file pdbqt.
Chuẩn bị protein: Cấu trúc 3D của protein thường có sẵn trên ngân hàng dữ
liệu protein (protein data bank). Trong trường hợp chưa có sẵn, chúng ta có thể xây
dựng cấu trúc 3D theo phương pháp mô phỏng tính tương đồng (homology
modeling)[38]. Sau khi có cấu trúc 3D, sử dùng các phần mềm để chuẩn bị protein
cho chương trình mô phỏng docking. Các bước chuẩn bị thường gồm: loại nước và
các cấu tử (nếu có), thêm hydro, gắn trường lực và xây dựng file pdbqt.
Mô phỏng docking: Trước khi phần mềm tiến hành tìm kiếm vị trí và cấu
dạng phù hợp của cấu tử, cần khoanh vùng tìm kiếm (grid box) cho thuật toán. Kích
thước của vùng tìm kiếm không nên quá lớn vì như thế sẽ tốn kém thời gian và độ

lặp lại không cao, cũng không nên quá nhỏ vì như vậy phần mềm chỉ tìm kiếm được
một vùng rất nhỏ, không có ý nghĩa. Vị trí của vùng tìm kiếm thông thường sẽ được
đặt ở trung tâm hoạt động của protein. Sau khi xác định vị trí và kích thước của
vùng tìm kiếm, phần mềm sẽ tự động tìm kiếm và đưa ra cấu dạng phù hợp với
năng lượng thấp nhất. Cấu dạng này cùng với các tương tác của nó với protein sẽ
được phân tích bởi các phần mềm chuyên dụng như: MOE, Pymol, Discovery
studio…

16


×