Tải bản đầy đủ (.pdf) (54 trang)

Ứng dụng phương pháp thiết kế và phân tích dữ liệu in silico (ISIDA) trong thiết kế hợp chất acid hydroxamic mới ức chế HDAC2​

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.73 MB, 54 trang )

,V
NU

ĐẠI HỌC QUỐC GIA HÀ NỘI

Ph
ar
m

ĐOÀN VIỆT NGA

ac
y

KHOA Y DƢỢC

ol

of

Me
d

ici

ne

an
d

ỨNG DỤNG PHƢƠNG PHÁP THIẾT KẾ VÀ


PHÂN TÍCH DỮ LIỆU IN SILICO (ISIDA)
TRONG THIẾT KẾ HỢP CHẤT
ACID HYDROXAMIC MỚI ỨC CHẾ HDAC2

Co

py
ri

gh
t

@

Sc

ho

KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC NGÀNH DƢỢC HỌC

Hà Nội – 2018


,V
NU

Ph
ar
m


Người thực hiện: ĐOÀN VIỆT NGA

ac
y

ĐẠI HỌC QUỐC GIA HÀ NỘI
KHOA Y DƢỢC

Me
d

ici

ne

an
d

ỨNG DỤNG PHƢƠNG PHÁP THIẾT KẾ VÀ
PHÂN TÍCH DỮ LIỆU IN SILICO (ISIDA)
TRONG THIẾT KẾ HỢP CHẤT
ACID HYDROXAMIC MỚI ỨC CHẾ HDAC2

ol

of

KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC NGÀNH DƢỢC HỌC

2. TS. PHẠM THẾ HẢI


Co

py
ri

gh
t

@

Sc

ho

Khóa: QH.2013.Y
Người hướng dẫn: 1. TS. LÊ THỊ THU HƢỜNG

Hà Nội – 2018


,V
NU

LỜI CẢM ƠN

ac
y

Trước hết, tơi xin tỏ lịng biết ơn sâu sắc và gửi lời cảm ơn chân thành tới

TS. Lê Thị Thu Hƣờng, công tác tại bộ môn Dược liệu và Dược học cổ truyền khoa Y Dược Trường Đại học Quốc gia Hà Nội là người thầy tận tình trực tiếp chỉ

Ph
ar
m

bảo, động viên, hướng dẫn để tơi hồn thành luận văn của mình.
Tơi xin chân thành cảm ơn TS. Phạm Thế Hải công tác tại Trường Đại học
Dược Hà Nội đã giúp đỡ tôi trong suốt thời gian qua.
Bên cạnh đó, tơi cũng xin gửi lời cảm ơn tới lãnh đạo, thầy cô Khoa Y Dược,
Đại học Quốc gia Hà Nội đã giúp đỡ, tạo điều kiện để tơi được làm khóa luận, được

an
d

học tập, nghiên cứu, rèn luyện tại Khoa suốt 5 năm học qua.
Sau cùng, tơi xin bày tỏ lịng biết ơn sâu sắc tới gia đình, anh chị em và bạn

ne

bè ln sát cánh, đồng hành, ủng hộ động viên tơi trong q tình học tập, nghiên
cứu hoàn thành luận văn.
Dù đã rất cố gắng nhưng kiến thức, kỹ năng và thời gian thực hiện cịn hạn
hẹp, tơi khó tránh khỏi những thiếu sót. Tơi rất mong nhận được những ý kiến đóng

ici

góp của các thầy cơ để khóa luận của tơi được hồn thiện hơn.

Co


py
ri

gh
t

@

Sc

ho

ol

of

Me
d

Tôi xin chân thành cảm ơn.

Hà Nội, Ngày 25 tháng 4 năm 2018
Sinh viên

Đoàn Việt Nga


Tính phù hợp hệ số tương quan


CSDL

Cơ sở dữ liệu

HDAC

Histone deacetylase

HDAC2

Histone deacetylase 2

IC50

Nồng độ ức chế 50%

MAE

Sai số tuyệt đối

MLR

Phương pháp hồi quy tuyến tính đa biến

PS

Tập kiểm tra

Q2


Hệ số tương quan chéo

Q2LOO

Hệ số xác định cho tập kiểm tra

@

TSPT

gh
t

Ph
ar
m

of
ol

Sc

ho

SAHA

py
ri

an

d

ne

ici

Me
d

Tương quan định lượng giữa cấu trúc – tác
dụng
Sai số toàn phương

RMSE

TS

ac
y

CCC

QSAR

Co

,V
NU

GIẢI THÍCH CHỮ VIẾT TẮT


Suberoylanilide hydroxamic acid
Tập huấn luyện
Tham số phân tử


,V
NU

DANH MỤC CÁC HÌNH

ac
y

Hình1.1: Q trình acetyl hóa histone / deacetyl hóa được điều chỉnh bởi các
enzyme HAT và HDAC. ............................................................................................ 5
Hình 1.2: Cấu tạo trung tâm hoạt động của HDAC .................................................... 5

Ph
ar
m

Hình 1.3: Mối liên quan của các dạng HDAC khác nhau tới quá trình sinh trưởng
phát triển của tế bào . .................................................................................................. 9
Hình 1.4: Cấu trúc một số dãy acid hydroxamic được tổng hợp .............................. 13
ở Việt Nam ................................................................................................................ 13
Hình 2.1: Cấu trúc hóa học của 45 dẫn xuất của acid hydroxamic ........................... 20

an
d


thu thập được ............................................................................................................. 20
Hình 2.2: Các bước xây dựng mơ hình QSAR và ứng dụng mơ hình trong thiết kế

ne

và dự đốn ................................................................................................................ 22
Hình 2.3: Cơ chế đếm mảnh cấu trúc trong mô tả phân tử ISIDA ........................... 23
Hình 2.4: Biểu di n cơng thức N- 5-hydroxypyridin-2-yl acetamide theo chương
trình tơ màu và gắn nhãn .......................................................................................... 24

ici

Hình 2.5: Hai loại mảnh cấu trúc theo chuỗi và nhánh với các phân loại: nguyên tử

Co

py
ri

gh
t

@

Sc

ho

ol


of

Me
d

và liên kết, chỉ nguyên tử, chỉ liên kết ...................................................................... 25
Hình 3.1: Các mảnh cấu trúc sử dụng trong mơ hình QSAR.................................... 29
Hình 3.2: Các mảnh cấu trúc quan trọng được lựa chọn trong mơ hình M1, M2 và
M3 phản ánh mối tương quan định lượng giữa cấu trúc và hoạt tính sinh học ức chế
enzyme HDAC2 ........................................................................................................ 34


,V
NU

DANH MỤC CÁC BẢNG

ac
y

Bảng 1.1: Các chất ức chế HDAC đang thử nghiệm lâm sàng ................................. 11
Bảng 2.1: Giá trị IC50 thực nghiệm của 45 hợp chất trong CSDL ............................ 21
Bảng 3.1: Các thông số đánh giá chéo và độ thích hợp của các mơ hình tuyến tính

Ph
ar
m

trên tập TS ................................................................................................................. 31

Bảng 3.2: Tính tốn khả năng dự đốn của mơ hình tuyến tính trên tập PS ............. 32
Bảng 3.3: Cấu trúc và giá trị dự đoán IC50 của các hợp chất mới thiết kế ................ 36

Co

py
ri

gh
t

@

Sc

ho

ol

of

Me
d

ici

ne

an
d


Bảng 3.4: Dẫn xuất của khung 4a ............................................................................. 37


,V
NU

MỤC LỤC

ac
y

MỞ ĐẦU .................................................................................................................... 1
CHƢƠNG 1. TỔNG QUAN ..................................................................................... 3
1.1. Thực trạng mắc bệnh ung thư và tử vong do ung thư .......................................... 3

Ph
ar
m

1.1.1. Thực trạng mắc bệnh ung thư và tử vong do ung thư trên thế giới .................. 3
1.1.2. Thực trạng mắc bệnh ung thư và tử vong do ung thư ở Việt Nam .................... 3
1.2. Tổng quan HDAC .............................................................................................. 4
1.2.1. Khái niệm histon deacetylase .......................................................................... 4
1.2.2. Phân loại các histon deacetylase ...................................................................... 6

an
d

1.2.3. Mối liên quan giữa ung thư và hoạt động bất thường của HDAC2 ................. 7

1.3. Các chất ức chế histon deacetylase ................................................................. 10

ne

1.3.1 Trên thế giới ..................................................................................................... 10
1.3.2. Tại Việt Nam ................................................................................................... 11
1.3.3. Cấu trúc các chất ức chế HDAC ..................................................................... 13
1.3.4. Cơ chế tác dụng của các chất ức chế HDAC ................................................ 14

ici

1.4. Mơ hình tƣơng quan định lƣợng tính chất – tác dụng (QSAR) ................... 15

of

Me
d

1.4.1. Lịch sử QSAR .................................................................................................. 15
1.4.2. Đại cương về QSAR ........................................................................................ 15
1.4.3. Quy trình xây dựng mơ hình QSAR ................................................................. 16
CHƢƠNG 2. NGUYÊN LIỆU VÀ PHƢƠNG PHÁP NGHIÊN CỨU .............. 20
2.1. Nguyên liệu ....................................................................................................... 20

ho

ol

2.1.1. Cơ sở dữ liệu (CSDL) ...................................................................................... 20
2.2. Phương pháp nghiên cứu .................................................................................... 21


Co

py
ri

gh
t

@

Sc

2.2.1. Phương pháp thiết kế và dự đoán hợp chất thiết kế mới bằng mơ hình QSAR
từ mảnh cấu trúc ....................................................................................................... 21
2.2.2. Tính tốn tham số phân tử .............................................................................. 23
2.2.3. Thiết kế tập huấn luyện và tập kiểm tra .......................................................... 25
2.2.4. Xây dựng mơ hình ........................................................................................... 26
2.2.5. Đánh giá mơ hình ............................................................................................ 26
CHƢƠNG 3. KẾT QUẢ VÀ BÀN LUẬN ............................................................ 27
3.1. Kết quả ............................................................................................................... 27
3.1.1. Các mơ hình QSAR thu được .......................................................................... 27
3.1.2. Đánh giá mơ hình ............................................................................................ 30
3.1.3. Ứng dụng trong thiết kế hợp chất mới và dự đoán hoạt tính .......................... 34


,V
NU

3.2. Bàn luận ............................................................................................................. 37

3.2.1. Về phương pháp tính tốn tham số phân tử .................................................... 37

ac
y

3.2.2. Về mơ hình QSAR ............................................................................................ 37
3.2.3. Về thiết kế hợp chất mới .................................................................................. 38
3.2.4. Kết quả dự đoán khả năng ức chế HDAC2 của các hợp chất acid

Ph
ar
m

hydroxamic mới ........................................................................................................ 38
CHƢƠNG 4. KẾT LUẬN VÀ KIẾN NGHỊ ......................................................... 40

Co

py
ri

gh
t

@

Sc

ho


ol

of

Me
d

ici

ne

an
d

TÀI LIỆU THAM KHẢO


,V
NU

MỞ ĐẦU

ac
y

Theo báo cáo thống kê của tổ chức Y tế giới WHO , ung thư là căn bệnh
giết người hàng đầu thế giới mỗi năm với khoảng 14 triệu ca mới phát hiện và 8,2
triệu trường hợp tử vong số liệu tính đến hết năm 2012, theo báo cáo số 297, cập

Ph

ar
m

nhật tháng 6 năm 2014 . Dự báo, số lượng bệnh nhân mắc mới sẽ tăng lên hơn
70% trong 2 thập kỷ tới. So với thế giới, Việt Nam thuộc nhóm các nước đứng thứ
2 vì tỉ lệ mắc ung thư [27].
Trước tình hình đó, việc nghiên cứu và phát triển các thuốc mới chống lại
ung thư luôn là mối quan tâm hàng đầu của các nhà khoa học, trong đó có Việt

an
d

Nam. Tuy nhiên, q trình nghiên cứu phát triển thuốc nói chung và các thuốc
điều trị ung thư nói riêng hiện nay vẫn chủ yếu dựa trên các phương pháp thực

ne

nghiệm thử-lỗi với nhược điểm là tốn thời gian, tiền bạc và cho hiệu quả thấp [30].
Ngoài ra, các thuốc điều trị ung thư hiện đang cịn nhiều hạn chế. Do đó u cầu cấp
bách đặt ra là phải nghiên cứu và phát triển thuốc chống ung thư mới, có tác dụng
chọn lọc trên đích phân tử nhằm phát huy tối đa hiệu quả, ít độc hơn.

ici

Nhờ những tiến bộ trong di truyền học và sinh học phân tử, Histon

of

Me
d


deacetylase (HDAC) được chỉ ra là một trong những đích tác dụng phân tử cho điều
trị ung thư, trong đó HDAC2 thuộc nhóm I được đánh giá là một đích phân tử quan
trọng do có biểu hiện q mức trong q trình deacetyl hố các histon xảy ra ở hầu
hết các dòng tế bào ung thư người [14, 66]. Vì vậy, các chất ức chế HDAC2 đang
trở thành các tác nhân chống ung thư đầy triển vọng [6, 8, 43].

ho

ol

Hiện nay, trên thế giới và Việt Nam đã có nhiều nghiên cứu xác định, phát
hiện và thử hoạt tính của hợp chất ức chế HDAC2 có nguồn gốc tự nhiên và tổng

Co

py
ri

gh
t

@

Sc

hợp hóa học [3-5]. Trong các nhóm chất ức chế HDAC2, các acid hydroxamic là
nhóm chất được quan tâm chú ý và tập trung nghiên cứu nhiều nhất vì có cấu trúc
đơn giản, có khả năng tổng hợp với điều kiện của Việt Nam. Acid hydroxamic có
nhóm –NHOH tạo được phức bền với Zn2+ ở trung tâm hoạt động của HDAC2

mang lại hoạt tính ức chế enzyme mạnh. Để vừa tiết kiệm thời gian công sức cũng
như tính đặc hiệu, nghiên cứu đã lựa chọn thực hiện theo phương pháp thiết kế
thuốc hợp lý dựa trên khung cấu trúc acid hydroxamic.
Trong những năm gần đây, nghiên cứu sàng lọc hợp chất ức chế HDAC2
dựa trên các phương pháp trợ giúp bởi máy tính, hay cịn gọi là phương pháp in
silico đã trở thành một hướng đi mới, đầy tiềm năng [48]. Các mơ hình in silico là
các mơ hình tốn học thể hiện mối quan hệ định lượng giữa cấu trúc và hoạt tính

1


,V
NU

(QSAR – Quantitive Structure Activity relationships), được ứng dụng chủ yếu
trong dự đốn hoạt tính và cơ chế tác dụng, sàng lọc virtual screening các hợp

ac
y

chất có hoạt tính từ các cơ sở dữ liệu hợp chất. Tuy nhiên ngày nay, thay vì phải
sàng lọc hàng triệu hợp chất từ các thư viện để tìm ra hợp chất dẫn đường-điểm
khởi đầu cho thiết kế thuốc, phương pháp dựa trên mảnh cấu trúc FBDD-

Ph
ar
m

Fragment based drug discovery bắt đầu với tập hợp các phân tử cấu trúc nhỏ dựa
trên cấu tạo của đích và đồng thời các mảnh cấu trúc này sẽ được ứng dụng trong

thiết kế hợp chất mới. Một trong số các FBDD sử dụng phổ biến hiện nay là mơ tả
phân tử thiết kế và phân tích dữ liệu in silico (ISIDA-In Silico design and Data
Analysis . Với mơ tả phân tử ISIDA, q trình thiết kế thuốc mới trong điều trị ung

an
d

thư sẽ được tối ưu hóa do ứng dụng linh hoạt mô tả trong sàng lọc, dự đoán và thiết
kế hợp chất mới.
Từ các vấn đề nêu trên, mục tiêu chung của nghiên cứu này là “Ứng dụng

ne

mô tả phân tử ISIDA trong thiết kế các hợp chất ức chế enzyme histone
deacetylase 2 trong điều trị ung thư”. Với mục tiêu cụ thể:
- Xây dựng được các mơ hình tốn học QSAR sử dụng mơ tả phân tử

ici

ISIDA định lượng giữa cấu trúc và hoạt tính ức chế HDAC2.

Co

py
ri

gh
t

@


Sc

ho

ol

of

Me
d

- Đánh giá mơ hình QSAR theo các thơng số thống kê
- Ứng dụng mơ hình xây dựng được trong sàng lọc, dự đoán và thiết kế hợp
chất mới.

2


,V
NU

CHƢƠNG 1. TỔNG QUAN

ac
y

1.1.Thực trạng mắc bệnh ung thƣ và tử vong do ung thƣ
1.1.1. Thực trạng mắc bệnh ung thư và tử vong do ung thư trên thế giới
Ung thư đang là một trong những căn bệnh dẫn đến tử vong hàng đầu trên


toàn thế giới. Theo báo cáo của Tổ chức Y tế Thế giới-WHO, trong năm 2012, có

Ph
ar
m

khoảng 14 triệu trường hợp ung thư được phát hiện mới và có đến 8,2 triệu ca tử
vong liên quan đến ung thư . Trong số đó, các ca tử vong do các ung thư chủ yếu là:
ung thư phổi 1,59 triệu ca , ung thư gan 745000 ca , ung thư dạ dày 723000 ca ,
ung thư đại trực tràng 694000 ca , ung thư vú 521000 ca , ung thư thực quản

an
d

(400000 ca) [33].
Dự kiến, số lượng các ca ung thư mới sẽ có khả năng tăng khoảng 70% trong
vòng hai thập kỉ tới, số trường hợp ung thư hàng năm sẽ tăng từ 14 triệu trong 2012

ne

lên 22 triệu trong vòng hai thập kỉ tới . Hơn 60% số các ca ung thư mới hàng năm
trên thế giới xảy ra ở Châu Phi, Châu Á, Trung và Nam Mỹ, chiếm 70% số các ca

Me
d

ici

tử vong ung thư thế giới [33].

5 yếu tố nguy cơ hàng đầu về hành vi và chế độ ăn uống có liên quan đến
30% trường hợp tử vong do ung thư đó là: chỉ số khối cơ thể cao béo phì , ăn
ít rau quả tươi, ít tập thể dục, nghiện thuốc lá hoặc rượu. Ngoài ra, các bệnh
nhi m virus HBV, HCV và một số type Human Papilloma Virus HPV là

of

nguyên nhân của trên 20% số các ca tử vong ung thư ở các nước thu nhập thấp
và thu nhập trung bình [38].

gh
t

@

Sc

ho

ol

1.1.2. Thực trạng mắc bệnh ung thư và tử vong do ung thư ở Việt Nam
Vào năm 2012, số lượng các ung thư gặp phổ biến ở Việt Nam trên nam giới
là gan 16.815 ca, phổi 16.082 ca, dạ dày 9.406 ca, đại trực tràng 4.561 ca và mũi
họng 3.301 ca; các ung thư gặp phổ biến ở nữ giới là: vú 11.067 ca, phổi 5.783 ca,
gan 5.182 ca, cổ tử cung 5.146 ca và dạ dày 4.797 ca [64]. Tổng số ca tử vong do
ung thư là 91.600 ca, trong đó: số nam giới tử vong do ung thư là 58.200 ca: ung
thư gan chiếm 26,9%, phổi 24,4%, dạ dày 14,5%, miệng - thực quản 5,8%, đại trực
tràng 5,2% và do ung thư khác là 23,2%; số nữ giới tử vong do ung thư là 33.400
ca: ung thư phổi chiếm 14,5%, gan 13,7%, vú 12,5%, dạ dày 12,1%, đại trực tràng


Co

py
ri

8% và do ung thư khác là 39,3% [64].

3


,V
NU

1.2. Tổng quan HDAC

ac
y

1.2.1. Khái niệm histon deacetylase
Nhi m sắc thể được cấu thành bởi: ADN, protein histon và protein không
phải histon [29]. Đơn vị cơ bản của nhi m sắc thể là nucleosom. Mỗi nucleosom
gồm 146 cặp base ADN được gói trong một protein histon octame [34] tạo bởi 4

Ph
ar
m

thành phần: H2A, H2B, H3, H4 [15].
Vào năm 1964, Allfrey VG, Faulkner R, Mirsky AE [7] đã khám phá ra q

trình acetyl hóa thuận nghịch của protein histone và ý nghĩa của biến đổi sau phiên
mã này với điều hòa biểu hiện gen. Các nhà khoa học đã chỉ ra rằng các đầu amino
của protein histon thường bị biến đổi bởi các q trình methyl hóa, phosphoryl hóa

an
d

hoặc acetyl hóa sau dịch mã. Q trình acetyl hố là một trong những cơ chế điều
hồ chính của biểu thị gen, là chìa khóa làm thay đổi cấu trúc nhi m sắc thể và biến

ne

đổi sau phiên mã. Deacetyl hóa histone là q trình ngược lại của acetyl hóa, làm
tăng tương tác ion giữa histon tích điện dương và ADN tích điện âm, giúp đóng
xoắn bằng cách cho cấu trúc chromatin nhỏ gọn hơn và ngăn chặn sự sao chép gen
vì đã làm hạn chế khả năng tiếp cận của các yếu tố phiên mã. Ngồi ra, acetyl hóa

ici

histone cịn liên kết với các chức năng bộ gen khác như lắp ráp chromatin, sửa chữa

of

Me
d

DNA và tái tổ hợp. Kiểm soát quá trình biểu thị gen này phụ thuộc vào sự cân bằng
giữa hoạt động của enzym histon acetylase và enzym histon deacetylase, nhờ vào sự
điều hồ q trình acetyl hố lysin ở phần đi histon [10]. Ngồi ra, q trình
acetyl hóa cũng liên quan đến rất nhiều protein không histone non-histone proteins)

với bản chất có vai trị như một chất nền đóng vai trị quan trọng trong việc quy

ol

định sự biểu hiện gen cũng như các protein khác trong các con đường điều tiết sự
tăng sinh tế bào, di chuyển tế bào, chu trình chết của tế bào và tạo mạch. Histon

ho

acetyltransferase (HAT) là enzym acetyl hóa nhóm -NH2 trong gốc lysin đầu N

Co

py
ri

gh
t

@

Sc

tận của histon, làm trung hịa điện tích dương trên lysin, do đó giảm khả năng
tương tác của histon với ADN tích điện âm tạo cấu trúc mở chromatin. Vì vậy, sự
acetyl hóa histon tạo điều kiện cho quá trình phiên mã, dịch mã xảy ra hình 1.1b
[10, 28].
Histon deacetylase HDAC là enzym có tác dụng đối lập với HAT. HDAC
loại bỏ nhóm acetyl từ acetyl lysin Ac-Lys ở đầu N tận của histon, làm đóng xoắn
chromatin, do đó ức chế q trình phiên mã Hình 1.1 .


4


,V
NU
ac
y
Ph
ar
m
an
d
ne

Co

py
ri

gh
t

@

Sc

ho

ol


of

Me
d

ici

Hình1.1: Q trình acetyl hóa histone / deacetyl hóa đƣợc điều chỉnh bởi các
enzyme HAT và HDAC. (Nguồn: www.quora.com)
Trung tâm hoạt động HDAC gồm 2 phần chính Hình 1.2 : ion Zn 2+ là
coenzyme của HDAC và kênh enzym dạng túi hình ống. Cấu trúc rất linh động, có
thể biến đổi phù hợp với chiều dài cơ chất khác nhau. Trên miệng túi có một vành
nhỏ được tạo nên từ một vài vòng xoắn protein, phần vành này sẽ tương tác với
nhóm nhận diện bề mặt HDAC [40, 61].

Hình 1.2: Cấu tạo trung tâm hoạt động của HDAC
(Nguồn: PNAS (2004) 101, 15064-15069)
5


,V
NU

1.2.2. Phân loại các histon deacetylase
Tính đến nay, các nhà khoa học đã chỉ ra 18 loại HDAC khác nhau, được

ac
y


chia thành 4 nhóm (I-IV trong đó các HDAC phụ thuộc vào Zn2+ thuộc nhóm I, II
và IV được gọi là các HDAC “kinh điển” và thường được sử dụng để sàng lọc và
thiết kế các chất ức chế HDAC mới [36, 40, 46, 67].

Ph
ar
m

Nhóm I: HDAC1, HDAC2, HDAC3, HDAC8. Các enzym này có ở phần
nhân của nhiều loại tế bào. Các HDACs nhóm I có kích thước nhỏ, thường biểu
hiện ở khắp mọi nơi trong các mô khác nhau của trên người và thường đóng một vai
trị chính trong sự tồn tại của tế bào, sự sinh trưởng phát triển và sự khác biệt.
Nhóm II gồm nhóm IIa và nhóm IIb. Trong đó nhóm IIa có HDAC4,

an
d

HDAC5, HDAC7, HDAC9, nhóm IIb có HDAC6, HDAC10. Các enzym này biểu
thị mơ đặc trưng, có khả năng di chuyển giữa bào tương và nhân.

ne

Nhóm III: Các protein điều hồ chuỗi thơng tin 2 SIRT : SIRT 1 – 7,
chúng có ở bào tương, ty thể và nhân.
Nhóm IV: HDAC11, có ở phần nhân của nhiều loại tế bào.
Các enzym nhóm I, II và IV phụ thuộc vào Zn 2+. Nhóm III là các enzym có

ici

cấu trúc phụ thuộc NAD [54, 67]. Nhóm I (HDAC1, 2, 3, 8) có cấu trúc tương


of

Me
d

đồng với Rdp3 ở tế bào nấm men S.cerevisiae, có chức năng ức chế phiên mã, chỉ
hoạt động khi nằm trong phức hợp protein. HDAC nhóm I có ở nấm men, động
vật có vú và thực vật. Ở động vật có vú, các HDAC này được chia thành 2 phân
nhóm là HDAC1/2 và HDAC3.
- HDAC1 và 2 có cấu trúc khá tương đồng 82% . Vùng xúc tác nằm ở đầu

ho

ol

N tạo nên phần chính của protein. Các cofactor là cần thiết cho hoạt động của
HDAC. HDAC1, 2 hoạt động khi nằm trong phức hợp như phức hợp SIN 3,

Co

py
ri

gh
t

@

Sc


NuRD/NRD/Mi2 và CoREST. Phosphoryl hóa serin trên HDAC1, 2 điều hịa hoạt
động của chúng và tạo nên phức hợp với các cofactor khác [24, 53].
- HDAC3 được tìm thấy trong phức hợp với N-coR (nuclear receptor
copressor và phức hợp với SMRT. Khoảng 68% vùng các acid amin của HDAC3
cần thiết cho cả hoạt tính deacetyl hóa và ức chế phiên mã [53].
- HDAC8 khơng được xếp vào phân nhóm nào vì nó chủ yếu có ở động vật
có xương sống. Hoạt động của HDAC8 giảm khi phosphoryl hóa bởi protein
kinase A [53, 57].
Nhóm II gồm HDAC 4,5,7,9 nhóm IIa và HDAC6,10 nhóm IIb tương
đồng với HDAC1 trong tế bào nấm men. HDAC nhóm II có kích thước phân tử
lớn và khác biệt so với HDAC nhóm I do có đầu N tham gia váo quá trình ức chế

6


,V
NU

phiên mã. Nhóm này chứa tín hiệu định vị ngồi nhân NES nên có thể di chuyển
từ nhân ra bào tương và ngược lại [31].

ac
y

Nhóm III gồm SIRT1-7 tương tự Sir2 ở tế bào nấm men. HDAC nhóm III
này khơng liên quan đến các nhóm khác, chúng có ở trong nhân SIRT 1,6,7 , bào
tương SIRT2 hoặc ty thể SIRT 3,4,5 . Nhóm HDAC III ít được nghiên cứu ở

Ph

ar
m

người, nhưng được xác định có cơ chế hoạt động phụ thuộc cofactor NAD+ [53].`
Nhóm IV gồm HDAC11 chỉ có ở người . Nghiên cứu hệ thống loài thấy
rằng HDAC11 liên quan gần hơn với HDAC3,8 nên có thể giả định HDAC11
liên quan mật thiết với HDAC nhóm I hơn là nhóm II. HDAC11 có vùng xúc
tác ở đầu N và có thể bị ức chế bởi trapoxin dẫn chất của TSA . HDAC11

an
d

chưa được tìm thấy trong các phức hợp HDAC đã biết để có thể xác định chức
năng sinh học [31, 53].

ne

HDAC khơng chỉ điều hịa các protein histon mà rất nhiều protein không
histon cũng bị ảnh hưởng bởi hoạt tính của các HDAC. Thuật ngữ các chất ức chế
HDAC để chỉ các chất có khả năng ức chế HDAC nhóm I, II và IV [50, 65].

ici

1.2.3. Mối liên quan giữa ung thư và hoạt động bất thường của HDAC2
Ngày càng có nhiều bằng chứng cho thấy sự biểu hiện gen, kiểm soát bởi

of

Me
d


thay đổi biểu sinh là rất quan trọng đối với sự khởi đầu và tiến triển của rất nhiều
bệnh trong đó có ung thư. Thay đổi biểu sinh làm thay đổi biểu hiện gen mà cấu
trúc DNA khơng thay đổi, do đó, dẫn đến bệnh tật - trái ngược với đột biến DNA
– vì thế có tiềm năng đảo ngược bởi các enzyme nhắm mục tiêu chịu trách nhiệm
dược lý trong sửa đổi di truyền ngoại sinh. HDACs có mặt trong hầu hết các mơ

ho

ol

và cho thấy biểu hiện quá mức hoạt động của enzyme, tăng mạnh phản ứng
deacetyl hóa đi histon và cấu trúc sợi nhi m sắc. Sự có mặt quá nhiều, chức

Co

py
ri

gh
t

@

Sc

năng và tăng sinh các HDAC nhóm I và II có liên quan tới khối u ác tính bao gồm
ung thư biểu mô tế bào T [11] cũng như sự tăng biểu hiện của nhóm I HDAC1,
HDAC2 và HDAC3 được xác định là yếu tố cần thiết cho sự gia tăng và phát
triển của tế bào ung thư thông qua các bằng chứng thực nghiệm, tiền lâm sàng và

lâm sàng về các ảnh hưởng sinh học liên quan đến sự thay đổi trong hoạt động của
HDAC. Ngồi ra, HDAC nhóm I có mặt trong các khối u ác tính và huyết học có
xu hướng tương quan với tiên lượng xấu hơn, với biểu hiện tăng cao HDAC2 [63].
Ngược lại, sự biểu hiện các HDAC nhóm II 4,5, 6, 7 và 10 có xu hướng liên quan
đến tiên lượng tốt hơn như tế bào ung thư phổi. Đó là lý do mà mối tương quan
giữa HDAC và ung thư chưa thật rõ ràng, tuy nhiên lựa chọn ức chế HDAC nhóm
I là chiến lược điều trị ung thư hiệu quả hơn cả. Hình 1.3 cho thấy các nhóm

7


,V
NU

HDAC khác nhau có các tác động khác nhau: chu trình tự chết, biệt hóa, điều hịa
vịng đời tế bào, di chuyển, tính cảm ứng với điều trị hóa học và sinh mạch.

ac
y

Histone deacetyleasa 2 HDAC2 thuộc HDAC nhóm I. HDAC2 hoạt động như
một chất ức chế phiên mã thông qua loại bỏ nhóm lysine ở đầu N của protein histon
H2A, H2B, H3 và H4 . Tuy nhiên HDAC2 không liên kết với ADN nên chúng sẽ

Ph
ar
m

được chọn lọc bởi các yếu tố phiên mã như YY1, SP1/SP3, gen ức chế khối u p53 và
BRCA1. HDAC2 cũng có thể được gắn vào ADN như là một phần của phức hợp

CoREST, mSin3 và NuRD. Những phức hợp là mục tiêu với các trình tự gen đặc hiệu
bằng các tương tác với các yếu tố phiên mã trình tự đặc hiệu [19].
Phức hợp chứa HDAC2 cũng liên quan đến gen điều chỉnh phiên mã qua

an
d

thụ thể trung gian. Những phức hợp chứa gen biến đổi biểu sinh khác, chẳng hạn
như MeCp2 – là một protein có nhóm liên kết methyl. Các enzyme vận chuyển

ne

nhóm methyl DNA DNMT1, DNMT3A và DNMT3B, sự methyl transferases
histone SUVAR39H1 và G9a và histon bị bỏ đi nhóm methyl LSD1 , cho thấy
một cách khác mà HDAC2 quy định biểu hiện gen và sửa chữa nhi m sắc [39].
HDAC2 cũng quy định biểu hiện gen thông qua sự deacetyl của yếu tố

ici

phiên mã cụ thể bao gồm STAT3 và SMAD7. HDAC2 là một chìa khóa quan

of

Me
d

trọng của gen điều hịa chu kỳ tế bào, q trình tế bào tự tiêu diệt, kết dính tế bào
và di cư. Cùng với HDAC1, HDAC2 quy định việc phiên mã của các gen liên
quan đến q trình tạo máu, biệt hóa tế bào biểu mô, phát triển tim và tế bào thần
kinh [55].

Các đột biến có thể có ở HDAC2 xuất hiện ở tế bào soma. HDAC2 bị đột

ho

ol

biến trong các khối u lẻ tẻ và trong các khối u phát sinh ở người có ung thư biểu
mơ đại trực tràng khơng polyp di truyền. Đột biến này do sự cắt bỏ 9 adenin ở

Co

py
ri

gh
t

@

Sc

exon tạo thành protein không hoạt động. Sự biểu hiện các dạng đột biến của
HDAC2 gây ra sự kháng với tác dụng của các chất ức chế HDAC. Việc thiếu các
biểu hiện và chức năng HDAC2 tạo nên sự tăng điều chỉnh gen thúc đẩy tăng
trưởng khối u [25, 42]. HDAC2 liên quan đến nhiều bệnh ung thư khác nhau:

8


,V

NU
ac
y
Ph
ar
m
an
d
ne
ici

ho

ol

of

Me
d

Hình 1.3: Mối liên quan của các dạng HDAC khác nhau tới quá trình sinh
trƣởng phát triển của tế bào (Nguồn: Future medicinal chemistry (2012) 4,
1439-1460).
Việc điều hòa về biểu hiện hoạt động HDAC2 có liên quan đến sự phát
triển ung thư. HDAC2 biểu hiện quá mức trong các loại ung thư khác nhau bao
gồm cả đại tràng, dạ dày, cổ tử cung, ung thư tuyến tiền liệt, ung thư phổi không
tế bào nhỏ và ung thư biểu mô tế bào gan. HDAC2 biểu hiên quá mức liên quan

gh
t


@

Sc

đến ung thư một phần thông qua việc chọn lọc sai lầm của nó và sự im lặng của
các gen ức chế khối u. Sự ức chế của gen p21WAF1 ức chế khối u ở vùng khởi
động và có thể được đảo ngược bởi việc điều trị bằng thuốc ức chế HDAC [52].
Biểu hiện HDAC2 tương quan với tiên lượng xấu khi bệnh ở giai đoạn tiên triển
trong ung thư đại trực tràng, tuyến tiền liệt, dạ dày và biểu mô tế bào gan.
Ung thư đại tràng: Các nghiên cứu cho thấy trong loại khối u này sự phiên
mã HDAC2 được điều chỉnh bởi tín hiệu beta-catenin-TCF-myc đã bị xóa bỏ

Co

py
ri

trong bệnh ung thư đại tràng. HDAC2 biểu hiện quá mức tương quan với tiên
lượng xấu và bệnh ở giai đoạn tiến triển trong ung thư đại trực tràng. Tuy nhiên,
Ropero và các cộng sự tìm thấy một sự đột biến bất hoạt của HDAC2 trong ung
thư đại tràng với bất ổn microsatellite [47].
9


,V
NU

Ung thư vú: HDAC2 gây lão hóa trong tế bào ung thư vú. Hơn nữa sự mất
hoạt tính của HDAC2 kéo theo quá trình chết tế bào apoptosis của tamoxifen


ac
y

trong estrogen / progesterone tế bào ung thư vú dương tính [41].
Bệnh ung thư tuyến tiền liệt: Theo nghiên cứu của Weichert và các cộng sự
thấy rằng HDAC2 được biểu hiện mạnh mẽ trong hơn 70% các trường hợp phân

Ph
ar
m

tích ung thư tuyến tiền liệt. Sự gia tăng trong biểu hiện HDAC2 có liên quan với
tăng cường tăng sinh tế bào khối u.
Ung thư biểu mô tế bào gan: HDAC2 quy định chu kỳ tế bào và sự phân chia
của HDAC2 gây ra ngừng chuyển pha G1/S trong chu kỳ tế bào. Trong q trình
chuyển đổi G1/S,sự phân chia đích của HDAC2 có tính chọn lọc gây ra các biểu hiện

an
d

của p16 INK4a và p21 WAF1/Cip1 , và đồng thời ức chế sự biểu hiện của cyclin
D1, CDK4 và CDK2. Do đó, sự ức chế HDAC2 dẫn đến sự giảm điều chỉnh của gen

ici

kháng corticosteroid trong COPD [9].

ne


đích E2F/DP1 thơng qua việc giảm sự phosphoryl hóa protein PRB [9].
Bệnh phổi tắc nghẽn mãn tính COPD : giảm hoạt động và biểu hiện
HDAC2 được tìm thấy trong bệnh phổi tắc nghẽn mãn tính COPD . Việc giảm
hoạt động của HDAC2 làm tăng điều hòa các gen liên quan đến phản ứng viêm và

of

Me
d

1.3. Các chất ức chế histon deacetylase
1.3.1 Trên thế giới
Từ những năm 1970, Yoshida và cộng sự đã phát hiện ra dẫn chất
hydroxamat tự nhiên đầu tiên có tác dụng ức chế trực tiếp HDAC là Trichostatin
A TSA , vốn là chất có tác dụng chống nấm . Sau đó, dựa trên hiểu biết về mối

ho

ol

liên quan giữa HDAC và ung thư đồng thời xác định được cấu trúc 3D của các
HDAC, một số chất ức chế HDAC có nguồn gốc tự nhiên hoặc tổng hợp hóa học

Co

py
ri

gh
t


@

Sc

đã được nghiên cứu và thử nghiệm trên lâm sàng để ứng dụng trong điều trị ung
thư. Cho đến nay, nhiều chất ức chế HDAC UHDAC đã được cơng bố và có thể
chia thành các nhóm cấu trúc: acid hydroxamic, benzamides, acid béo mạch ngắn
và peptide vịng [16].
Trong các nhóm chất ức chế HDAC, các acid hydroxamic là nhóm chất được
quan tâm chú ý và tập trung nghiên cứu nhiều nhất bởi cấu trúc đơn giản, d tổng
hợp và có nhóm -NHOH tạo được phức bền với Zn+2 ở trung tâm hoạt động của
HDAC, đáp ứng được chức năng gắn kết với nhóm kẽm và giúp tăng hoạt tính ức
chế enzym. Hiện nay, FDA đã phê duyệt một acid hydroxamic UHDAC điển hình
là vorinostat suberoylanilide hydroxamic acid, Zolinza vào năm 2006 sử dụng
trong điều trị u lympho da tế bào. Một hợp chất UHDA khác là depsipeptide

10


,V
NU

romidepsin, Istodax cũng được FDA cấp phép lưu hành vào năm 2009 để điều trị
CTCL và điều trị ung thư hạch tế bào T ngoại vi. Nhiều chất ức chế enzym HDAC
khác cũng đang được thử nghiệm lâm sàng nhằm phát triển liệu pháp điều trị ung
thư dựa trên đích này Bảng 1.1 [8, 49].

ac
y


Bảng 1.1: Các chất ức chế HDAC đang thử nghiệm lâm sàng
Hợp chất
Butyrat

I, II

AN-9 tiền thuốc

Acid carboxylic

Pha thử nghiệm

Acid valproic

I

ITF-2357
SB-939
CRA 024781

II
I
I

JNJ-16241199

I

SNDX-275

(MS-275)
CI-994
MGCD-0103

I, II

Depsipeptid (FK228)

I, II

an
d

Đã c/m I, II
II
I
II, III

ne

of

Sc

Peptid vịng

ho

ol


Các benzamid

I, II

SAHA
PXD101
NVP-LAQ824
LBH-589

Me
d

Acid hydroxamic

I, II

ici

Phenyl butyrat

Ph
ar
m

Nhóm

I, II
II

gh

t

@

Tuy nhiên, mỗi nhóm nêu trên đều có những hạn chế nhất định như: các acid
hydroxamic bị chuyển hoá nhanh, độ ổn định cịn kém; các benzamide có thể là
ngun nhân dẫn đến tác dụng phụ của các thuốc an thần ; các peptid vịng khó tạo
thành về mặt hố học và FK-228 có phần gắn kết với ion Zn2+ chứa thiol [37].

Co

py
ri

1.3.2. Tại Việt Nam
Một số nghiên cứu tìm kiếm hợp chất ức chế HDAC2 đã được thực hiện và
công bố trên các tạp chí trong nước và quốc tế. Tất cả các nghiên cứu trên đều được
thực hiện bởi nhóm nghiên cứu của GS.TS. Nguy n Hải Nam thuộc Đại học Dược

11


,V
NU

Hà Nội. Hiện nhóm chủ yếu tập trung thiết kế và tổng hợp hóa dược các hợp chất dị
vịng là dẫn xuất của acid hydroxamic, gần 50 hợp chất mới được tổng hợp và thử

Ph
ar

m

ac
y

hoạt tính [3-5, 17, 44].
a)

an
d

b)

ici

ne

c)

of

Me
d

d)

Sc

ho


ol

e)

Co

py
ri

gh
t

@

f)

12


ac
y

,V
NU

g)

Ph
ar
m


Hình 1.4: Cấu trúc một số dãy acid hydroxamic đƣợc tổng hợp
ở Việt Nam
1.3.3. Cấu trúc các chất ức chế HDAC
Cấu trúc các chất ức chế HDAC thường gồm 3 phần chính hình 1.5):
- Nhóm khóa hoạt động cap group hay nhóm nhận diện bề mặt SRG : là

an
d

các vịng thơm hoặc peptid vịng, thường tham gia vào q trình nhận diện với bề
mặt amino acid . Đã có nhiều nghiên cứu thay đổi vùng nhóm khóa hoạt động này
trước đây như thêm nhóm thế halogen, vịng diazol, thiazol.. dựa trên sườn cấu trúc

ne

SAHA, .. Như đã được chứng minh thì vùng nhóm khóa hoạt động cần phải có sự
xuất hiện các hydrocacbon thơm, có thể thêm các nhóm thế halogen, cacbonyl,
methyl, triflourmethyl ceton.. hoặc liên kết không no để tăng mức độ ức chế.

Co

py
ri

gh
t

@


Sc

ho

ol

of

Me
d

ici

- Vùng cầu nối linker : thường là các nhóm sơ nước, gồm các hydrocacbon
thân dầu mạch thẳng hoặc vịng, có thể no hoặc khơng no, có vai trị tạo liên kết
Van der Waals với kênh enzym.
- Nhóm kết thúc gắn với kẽm Zinc binding group - ZBG): nhóm tạo chelat
với kẽm trong vùng trung tâm hoạt động của HDAC2 do đó tăng mức độ tương tác
và khả năng ức chế enzyme. Trong khung cấu trúc hydroxamic, –NHOH chịu trách
nhiệm chính cho vai trị này.

13


,V
NU
ac
y
Ph
ar

m
an
d

Me
d

ici

ne

Hình 1.5: Cấu trúc chung của các chất ức chế HDAC (a) và khung cấu trúc
acid hydroxamic đảm nhiệm vai trị nhóm kết thúc (b)
Như vậy, các phần trong cấu trúc của các chất ức chế HDAC đều tham gia
vào quá trình hình thành liên kết với enzym và phát huy tác dụng. Chúng tôi sẽ thiết
kế các hợp chất mới bằng cách thay đổi nhóm khóa hoạt động và vùng cầu nối, giữ
cố định nhóm kết thúc mang cấu trúc acid hydroxamic.

py
ri

gh
t

@

Sc

ho


ol

of

1.3.4. Cơ chế tác dụng của các chất ức chế HDAC
Cơ chế tác dụng của các chất ức chế HDAC đối với ung thư là do khả năng
tác động lên nhiều giai đoạn quan trọng của chu trình tế bào, từ đó làm mất sự điều
hịa trong tế bào ác tính. Một trong những yếu tố được coi là then chốt, quyết định
hoạt tính chống ung thư của các hợp chất này là thúc đẩy sự biệt hóa, ức chế chu
trình tế bào và thúc đẩy sự chết tế bào. Ngồi ra, hoạt hóa đáp ứng mi n dịch và ức
chế sự tạo mạch cũng là vai trò rất quan trọng của các UHDAC, gián tiếp ức chế sự
phát triển của các khối u. Ngoài ra các chất ức chế HDAC ngăn cản các đi histon
có nhóm acetyl tiến đến vị trí xúc tác.
Với vai trị sinh học của HDAC và các nghiên cứu về các chất UHDAC cho
thấy đấy là mục tiêu quan trọng cần hướng tới trong điều trị ung thư. Do đó, việc
tìm kiếm các hợp chất mới có khung cấu trúc acid hydroxamic có tiềm năng ức chế

Co

HDAC2 là một hướng đi đúng đắn nhằm tìm kiếm các hợp chất mới với khả năng
ức chế cao hơn, ít độc tinh, cải thiện được sinh khả dụng của các nhà khoa học [2].

14


,V
NU

1.4. Mơ hình tương quan định lượng tính chất – tác dụng (QSAR)


ac
y

1.4.1. Lịch sử QSAR
Vào năm 1868, Crum-Brown và Frasher đã nhận xét rằng tác dụng sinh học
là hàm số của cấu trúc hóa học và đây cũng chính là khởi nguồn của phương pháp
xây dựng mối quan hệ định lượng giữa cấu trúc hóa học và hoạt tính sinh học

Ph
ar
m

(QSAR- Quantitative Structure-Activity Relationships). Đến năm 1893, Richet đã
cho rằng sự khác nhau về tác dụng sinh học là do sự thay đổi về tính chất lí hóa.
Đến năm 1935, phương trình Hammett được coi là mơ hình đầu tiên biểu di n mối
quan hệ hoạt tính và cấu trúc:
Log 

Với K, Ko là hằng số acid,  là hằng số Hammett, thơng số hóa lý đặc trưng

an
d

cho khả năng hút hoặc đấy điện tử của nhóm thế.

ici

số hóa lí và hoạt tính sinh học, ví dụ:

ne


Tuy nhiên, mơ hình QSAR thực sự được nghiên cứu bởi C.L. Corwin
Hansch từ những năm 60 của thế kỉ 20. Mơ hình QSAR Hansch thường sử dụng
phương pháp hồi quy tuyến tính đa biến để biểu thị mối tương quan giữa các tham
Log (1/C) = k1+ k22+ k3

Me
d

Trong đó: C là nộng độ mol mà tại đó hoạt chất thể hiện hoạt tính sinh học,
: hằng số kỵ nước, : hằng số thế Hammett; k1, k2, k3 là các hệ số hồi quy.

of

Kể từ đây, phương trình QSAR đã được xây dựng bằng những phương pháp,
kĩ thuật xây dựng đa dạng đã ra đời và đóng vai trị quan trọng trong nghiên cứu và
phát triển dược phẩm.

gh
t

@

Sc

ho

ol

1.4.2. Đại cương về QSAR

Về mặt tốn học, mơ hình QSAR biểu di n mối tương quan định lượng giữa
cấu trúc phân tử và hoạt tính thơng qua phương trình:
Y = f(x1) + f(x2) + ... + f(xn)
(1.4.2)
Trong đó, Y là biến phụ thuộc, phản ánh hoạt tính sinh học của các hợp chất.
Giá trị của Y được xác định thông qua các nghiên cứu thực nghiệm cho giá trị cụ
thể, ví dụ như nồng độ ức chế 50% hoạt tính của enzym (IC50), MIC (Minimum
Inhibitory Concentration): nồng độ ức chế tối thiểu, hay nồng độ kìm khuẩn tối
thiểu (dùng trong vi sinh); MBC (Minimum Bactericidal Concentration): nồng độ

Co

py
ri

diệt khuẩn tối thiểu; EC50 (Effective Concentration): nồng độ 50% tác dụng tối
đa... Y cũng có thể nhận giá trị rời rạc, ví dụ như có hay khơng có hoạt tính, hoạt
tính mạnh hay yếu. Các biến x trong mơ hình QSAR được gọi là các tham số phân

15


,V
NU

tử (TSPT), mô tả một đặc điểm cấu trúc nào đó của phân tử hóa học. Hàm f là một
hàm mô tả mối tương quan giữa Y và các biến x. Để xây dựng được hàm f, cần áp

ac
y


dụng các thuật toán thống kê (statistical) hoặc học máy (machine learning). Một số
kỹ thuật thống kê thường được sử dụng trong xây dựng mơ hình QSAR có thể kể
đến như mạng neuron nhân tạo (Artificial Neural Network); hồi quy đa biến tuyến

Ph
ar
m

tính (Multiple Linear Regression), phân tích thành phần chính (Principal
Component Analysis)...
1.4.3. Quy trình xây dựng mơ hình QSAR
Các bước để xây dựng mơ hình QSAR [59] gồm:1) Xây dựng cơ sở dữ liệu
(CSDL ; 2 Tính tốn tham số mơ tả phân tử đặc trưng cho cấu trúc bằng sử dụng

an
d

các phần mềm giúp biểu di n và tính tốn; 3) Xây dựng mơ hình QSAR: Sử dụng
các phương pháp xác suất thống kê và các kỹ thuật của trí tuệ nhân tạo để xây dựng

ne

mối liên hệ giữa các tham số phân tử (TSPT) và các giá trị đại lượng biểu di n hoạt
tính; 4) Đánh giá mơ hình; 5 Giải thích các kết quả và sử dụng mơ hình trong q
trình sàng lọc ảo nếu có thể .
Xây dựng cơ sở dữ liệu: CSDL thường là cấu trúc của các hợp chất hoá học

ici


đã được chứng minh hoạt tính sinh học in vitro. Để hạn chế các yếu tố gây sai số

of

Me
d

cho mơ hình, CSDL thường sẽ được làm sạch dựa trên sự tương đồng về cấu trúc,
về protocol,...Các giá trị sinh học được hiệu chỉnh, mang tính đại diện và có ý nghĩa
thống kê.
Tính tốn tham số mô tả phân tử đặc trưng cho cấu trúc: Đây là q trình
chuyển đổi tốn học và lơgic chuyển đổi thơng tin cấu trúc hóa học mã hóa thành

ho

ol

dạng số giúp máy tính có thể “hiểu” được.
Thiết kế tập huấn luyện và tập kiểm tra: CSDL được chia thành tập huấn

Co

py
ri

gh
t

@


Sc

luyện TS-Training set chiếm 75%, được sử dụng để xây dựng mơ hình và tập
kiểm tra PS-Prediction set để đánh giá khả năng dự đốn của các mơ hình đã xây
dựng được.
Xây dựng mơ hình QSAR: sử dụng các phương pháp xác suất thống kê và
các kỹ thuật của trí tuệ nhân tạo để xây dựng mối liên hệ giữa các TSPT và giá trị
đại lượng biểu di n hoạt tính.
Đánh giá mơ hình: Đánh giá mơ hình là giai đoạn quan trọng liên quan đến
khả năng ứng dụng của mơ hình. Mơ hình cần có độ khớp, độ ổn định thông qua
đánh giá nội trên tập TS và khả năng dự đốn tốt thơng qua đánh giá ngoại trên tập
PS dựa trên các thông số thống kê. Để đánh giá mơ hình QSAR, các kĩ thuật hay
được sử dụng đó là: đánh giá nội hay đánh giá chéo; đánh giá ngẫu nhiên Y; đánh

16


,V
NU

giá bằng cách chia tệp dữ liệu thành các hợp chất để huấn luyện hay kiểm tra và
đánh giá ngoại bằng cách áp dụng mơ hình trên tập dữ liệu ngoại [18].

ac
y

Đánh giá nội: Độ khớp hay độ tuyến tính được đánh giá thông qua giá hệ số
xác định R2, R2 càng cao thì mức độ khớp (tuyến tính) của mơ hình với các giá trị
thực nghiệm càng tốt; r2> 0,8 thì mơ hình mới có ý nghĩa. Cơng thức tính hệ số xác
định như sau:

y i  yi



( yi  y)

Ph
ar
m

R2 = 1-

^



^

Trong đó n là số các quan sát của tập huấn luyện; yi, y i , lần lượt là giá trị thực
tế, giá trị dự đoán của biến phụ thuộc ở quan sát thứ i; y là giá trị thực tế trung bình

an
d

của biến phụ thuộc.

ici

ne


Khả năng Fit của mơ hình được xác định thơng qua sai số tồn phương trung
bình (RMSE- root mean square errors). Giá trị RMSE cho biết độ sai lệch giữa giá
trị thực nghiệm và giá trị dự đốn của mơ hình:

Me
d

√ ∑

Trong đó y và lần lượt là giá trị hoạt tính sinh học thực nghiệm và dự đoán
của các hợp chất trên tập TS, ym làu trung bình hoạt tính thực nghiệm, n là số lượng

ol

of

phân tử hợp chất của tập TS đang kiểm tra.
Một mơ hình dự đốn tốt thì giá trị RMSE nên thấp hơn 0.5 [56].
MAE: sai số tuyệt đối MAE-root mean square errors được định nghĩa là sự

Sc

ho

khác biệt lớn nhất của giá trị y thực tế so với y dự đoán [13].
|
|

2




Q =1∑

Co

py
ri

gh
t

@

Độ ổn định được đánh giá thông qua hệ số tương quan chéo Q2LOO, Q2LOO
được đánh giá dựa trên phương pháp tham số chéo (cross validation leave one out)
bằng cách lần lượt loại 1 quan sát ra khỏi tập huấn luyện, giữ nguyên các biến đã
lựa chọn và tính tốn lại các thơng số của mơ hình. Q2 càng gần 1, tính tổng qt
hóa của mơ hình càng cao, mơ hình càng ổn định. Thơng thường, u cầu Q2 > 0,7
thì mơ hình mới bền vững. Cơng thức hệ số tương quan chéo tính như sau:

17

^

y i  yi / i

( yi  y)



×