Tải bản đầy đủ (.pdf) (11 trang)

Mô hình in silico dự đoán hoạt tính kháng sốt rét

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (663.46 KB, 11 trang )

Y Học TP. Hồ Chí Minh * Tập 15 * Phụ bản của Số 1 * 2011

Nghiên cứu Y học

MÔ HÌNH IN SILICO DỰ ĐOÁN HOẠT TÍNH KHÁNG SỐT RÉT
Thái Khắc Minh*, Võ Vân Anh*, Nguyễn Đắc Chí*

TÓM TẮT
Giới thiệu: Sốt rét là bệnh dịch nguy hiểm ở các nước đang phát triển và nhu cầu cấp thiết hiện nay là tìm
ra những thuốc mới có hiệu quả trên cả dòng Plasmodium falciparum đề kháng, giá cả phải chăng.
Mục tiêu: Xây dựng các mô hình QSAR để dự đoán hoạt tính kháng sốt rét của một số dẫn chất mới trên
các chủng P. falciparum khác nhau.
Phương pháp: Nghiên cứu này tiến hành thu thập dữ liệu gần 1700 chất thuộc các nhóm cấu trúc khác
nhau từ nhiều bài báo và ứng dụng thuật toán bình phương tối thiểu từng phần để xây dựng 5 mô hình hồi qui
tuyến tính dự đoán hoạt tính kháng sốt rét trên máy tính. Các mô hình này được xây dựng từ các nhóm chất có
hoạt tính kháng sốt rét thử nghiệm trên 5 dòng tế bào đề kháng chloroquin (K1, FcB1, NF54, Dd2, W2) với
phương pháp thử nghiệm là đo độ hấp thu phóng xạ, đo quang và đếm huỳnh quang.
Kết quả: Kết quả 5 mô hình (K1-1, FcB1-1, NF54-1, Dd2-1, W2-1) có giá trị R2 của cả tập xây dựng, đánh
giá chéo và tập ngoại đều trong khoảng 0,57 – 0,86, RMSE trong khoảng từ 0,28 – 0,94, cho thấy khả năng dự
đoán đúng trên 50% và sai số giữa giá trị dự đoán và giá trị thực nghiệm là chấp nhận được. Các mô hình này
được ứng dụng dự đoán hoạt tính kháng sốt rét của 11 dẫn chất nhóm chalcon, từ đó rút ra mối quan hệ cấu trúc
– tác dụng của nhóm dẫn chất này.
Kết luận: Mô hình QSAR/PLS cho thấy khả năng ứng dụng tốt trong dự đoán hoạt tính kháng sốt rét của
một số dẫn chất chalcon. Kết quả này được sử dụng trong định hướng thiết kế và tổng hợp các phân tử mới có
hoạt tính kháng sốt rét mạnh hơn.
Từ khóa: Dược tin học, QSAR, PLS, Plasmodium falciparum, bệnh sốt rét.

ABSTRACT
IN SILICO MODEL FOR PREDICTION OF ANTIMALARIAL ACTIVITY
Thai Khac-Minh, Vo Van Anh, Nguyen Dac Chi
* Y Hoc TP. Ho Chi Minh * Vol. 15 - Supplement of No 1 - 2011: 395 - 405


Background: Malaria is a dangerous infectious desease in developing countries and that finding the new
affordable drug with effection on resistant Plasmodium falciparum is essential.
Objective: The aim of this study is the development of a relevant computational model to predict
antimalarial activity of chalcone derivatives. This model could be applied to screen and design new antimalarial
drugs.
Method: In this study, nearly 1700 compounds were collected with variable structures from several papers
and applicating partial least squares algorithm to build 5 linear regression models to predict antimalarial in silico.
These were performed from structure groups with antimalarial defined on 5 Plasmodium falciparum strains,
including chloroquin resistant (K1, FcB1, NF54, Dd2, W2) by 3 bio-assay methods, including (H3Hypoxanthin)-uptake assay, parasite lactate dehydrogenase activity measuring and flow cytometry.
Results: Resulting in 5 models (K1-1, FcB1-1, NF54-1, Dd2-1, W2-1) with R2 of training set, LOO and
external set in the range of 0.57 – 0.86, RMSE in the range of 0.28 – 0.94, indicated that the ability of prediction
Bộ môn Hóa Dược – Khoa Dược – Đại học Y Dược TP. Hồ Chí Minh
Tác giả liên hệ: TS. Thái Khắc Minh ĐT: 0909. 680. 385
Email:

Chuyên Đề Dược Khoa

395


Nghiên cứu Y học

Y Học TP. Hồ Chí Minh * Tập 15 * Phụ bản của Số 1 * 2011

over 50% and the bias between predicted antimalarial and experiment antimarial approved. These models were
applied to predict antimalarial of 11 chalcon derivatives and finding out their structure-activity relationship.
Conclusion: The PLS models could be applied to predict antimalarial activity of new chalcone compounds.
These models may be used as an in silico tool to design and develop the new potent antimalarial novels.
Keywords: Pharmacoinformatics, QSAR, PLS, Plasmodium falciparum, Malaria.


ĐẶT VẤN ĐỀ
Sốt rét là một trong số những bệnh dịch
nguy hiểm ở các nước đang phát triển, đặc biệt
là ở châu Phi và đối tượng nhạy cảm nhất là trẻ
em dưới 5 tuổi. Bệnh sốt rét là nguyên nhân và
cũng là hậu quả của nghèo đói. Hiện nay, những
thuốc trị sốt rét rẻ tiền giảm hiệu quả điều trị do
tình trạng đề kháng. Vấn đề đặt ra là cần tìm ra
thuốc mới có hiệu quả điều trị trên dòng đề
kháng và giá cả phải chăng(1). Dược tin học góp
phần giúp việc khám phá thuốc mới rút ngắn
thời gian và giảm chi phí. Nghiên cứu này sử
dụng thuật toán bình phương tối thiểu từng
phần xây dựng 5 mô hình cung cấp thông tin về
mối liên hệ cấu trúc – tác dụng của nhiều nhóm
cấu trúc thu thập được gần 1700 chất từ các bài
báo khoa học trên các dòng tế bào P. falciparum
nhạy cảm là NF54, D10, 3D7, và đề kháng là K1,
FcB1, Dd2, W2 với 3 phương pháp thử hoạt tính
kháng sốt rét chính là đo độ hấp thu phóng xạ,
đo quang và đếm huỳnh quang. Những mô
hình này có thể ứng dụng trong sàng lọc số
lượng lớn các chất sẵn có trong ngân hàng dữ
liệu, định hướng thiết kế và tổng hợp nhằm tìm
ra những hoạt chất phát triển thành thuốc trị sốt
rét như mong đợi.

PHƯƠNG PHÁP NGHIÊN CỨU

Chuẩn bị cơ sở dữ liệu

Cấu trúc hóa học 2D (ChemBioDraw Ultra 11.0)
Hoạt tính sinh học (pIC50)

Tối thiểu hóa năng lượng
Tính toán giá trị thông số mô tả 2D
(MOE 2008.10)

Phân chia tập hợp
Tập xây dựng mô hình (Training set) – Tập đánh giá ngoại (External set)
Ngẫu nhiên (random), phân phối đa dạng (diverse)

Chọn lọc thô các thông số mô tả
Tập xây dựng mô hình (Training set)
Loại bỏ các thông số có > 15% giá trị 0 (Excell)
Loại bỏ các thông số có tương quan chéo ≥ 90% (RapidMiner 5)

Chia tỉ lệ các thông số mô tả
Tập xây dựng mô hình (Training set)
Chia tỉ lệ trong khoảng 0-1 (RapidMiner 5)

Chọn lọc thông số mô tả
Tập xây dựng mô hình (Training set)
Phân tích ngẫu nhiên (QSAR-Contingency – MOE 2008.10). Tổ
chức tìm kiếm lấy thêm và chiến thuật phản hồi (Weka 3.7.0)

Xây dựng mô hình 2D-QSAR hồi quy tuyến tính
Tập xây dựng mô hình (Training set)
Bình phương tối thiểu từng phần (PLS – MOE 2008.10)
2
Đánh giá chéo nội (Bỏ-một-ra – MOE 2008.10): XR , XRMSE


Loại các chất gây nhiễu (outlier)
Tập xây dựng mô hình (Training set)
Dựa vào Z-score (Plot – MOE 2008.10)

Quy trình thực hiện nghiên cứu QSAR
Mô hình hồi qui tuyến tính dự đoán hoạt
tính kháng sốt rét được xây dựng theo các bước
như Hình 1.

Đánh giá khả năng dự đoán ngoại
Tập ngoại (External set)
R2, RMSE

Ứng dụng mô hình trong dự đoán

Hình 1. Các bước xây dựng mô hình dự đoán hoạt
tính kháng sốt rét

396

Chuyên Đề Dược Khoa


Y Học TP. Hồ Chí Minh * Tập 15 * Phụ bản của Số 1 * 2011
Chuẩn bị cơ sở dữ liệu
Từ nhiều bài báo khoa học sàng lọc gần 1700
hợp chất có hoạt tính kháng sốt rét thuộc nhiều
nhóm cấu trúc khác nhau, lựa chọn và sắp xếp
lại theo tiêu chí: (i) cùng cách đánh giá hoạt tính

kháng sốt rét (IC50), (ii) cùng đơn vị đo hoạt tính
(nM), (iii) cùng phương pháp xác định hoạt tính,
(iv) có giá trị chất đối chiếu tương đương. Các
chất thuộc nhiều hơn 3 bài báo để tạo sự đa
dạng, số lượng chất cho mỗi tập hợp không quá
ít (≥ 50). Nghiên cứu này xây dựng 10 mô hình
dự đoán hoạt tính kháng sốt rét trên cơ sở 10 tập
hợp dữ liệu gồm những cấu trúc có tài liệu tham
khảo kèm theo như Bảng 1.
Dựa vào chất đối chiếu có thể quy đổi giá trị
hoạt tính kháng sốt rét của các chất theo quy tắc
tam suất nếu chênh lệch giữa các giá trị hoạt tính
của chất đối chiếu (như chloroquin) trong các bài
báo khác nhau từ năm lần trở lên. IC50 được đổi
thành pIC50 = log10(IC50) được sử dụng trong
nghiên cứu.

Nghiên cứu Y học

(Molecular Operating Environment phiên bản
2008.10).

Phân chia tập hợp
Để xây dựng mô hình 2D-QSAR và đánh giá
mô hình xây dựng, tập dữ liệu ban đầu được
phân chia thành: tập xây dựng mô hình (80%) và
tập ngoại (20%) theo kiểu phân chia ngẫu nhiên
(random) hoặc phân chia đa dạng (diverse) bằng
phần mềm MOE 2008.10.


Lọc thô thông số mô tả
Để loại các thông số không có ý nghĩa hoặc
khiến mô hình tốt giả tạo, các thông số mô tả của
tập xây dựng mô hình được loại thô:
- Loại bỏ thông số có >15% chất chứa giá trị 0
bằng phần mềm Excell 2007.
- Loại bỏ thông số có giá trị của tất cả các
chất giống nhau bằng phần mềm Rapid Miner 5.
- Loại bỏ một trong hai thông số có tương
quan chéo với nhau ≥ 90% bằng phần mềm
RapidMiner 5.

Tính thông số mô tả

Chia tỉ lệ thông số mô tả

Thông số mô tả thể hiện cấu trúc hóa học
hay tính chất vật lý của một phân tử bằng các
giá trị số, có ảnh hưởng tới tác dụng sinh học.
Cấu trúc 2D của các hợp chất được xây dựng
bằng phần mềm ChemBioDraw Ultra 11.0 2008,
tối thiểu hóa năng lượng và tính 184 thông số 2D
thuộc 7 nhóm bằng phần mềm MOE 2008.10

Để loại bỏ trọng số chỉ liên quan đến các đơn
vị được dùng để biểu thị một biến riêng biệt, các
thông số trong nghiên cứu này được chia tỉ lệ
trong khoảng 0-1 bằng công thức bình thường
hóa (nomalization)(10)


Bảng 1. Dữ liệu để xây dựng các mô hình dự đoán hoạt tính kháng sốt rét
Stt
1
2
3
4
5
6
7
8
9
10

Mô hình
K1-1
FcB1-1
NF54-1
Dd2-1
W2-1
W2-2
W2-3
D10-1
D10-2
3D7-1

Tài liệu tham khảo
(13-24)
(14,25-35)
(21,36-41)
(42-45)

(46-49)
(13,50-54)
(55-58)
(22,59-60)
(13,50,52,53,61,62)
(13,23,63)

Dòng tế bào P. f
K1
đề kháng
FcB1
đề kháng
NF54
đề kháng
Dd2
đề kháng
W2
đề kháng
W2
đề kháng
W2
đề kháng
D10
nhạy cảm
D10
nhạy cảm
3D7
nhạy cảm

: giá trị mới của thông số j của chất thứ i;


: giá trị hiện tại;

Phương pháp xác định IC50
Phóng xạ(5)
Phóng xạ
Phóng xạ
Phóng xạ
Phóng xạ
Đo quang(7)
Đếm huỳnh quang
Phóng xạ
Đo quang
Đo quang

Số hợp chất
261
170
95
55
50
114
52
52
119
122

: giá trị lớn nhất và nhỏ nhất của

khoảng giá trị hiện tại.


Chuyên Đề Dược Khoa

397


Nghiên cứu Y học

Y Học TP. Hồ Chí Minh * Tập 15 * Phụ bản của Số 1 * 2011

Chia tỉ lệ được tiến hành bằng phần mềm
Excel 2007.

Lựa chọn thông số mô tả phân tử
Chọn thông số mô tả bằng công cụ QSAR –
Contingency trong phần mềm MOE và công cụ
select attributes trong phần mềm WEKA 3.7.0.
Xây dựng mô hình dự đoán hoạt tính kháng
sốt rét bằng thuật toán bình phương tối thiểu
từng phần
Sử dụng công cụ QSAR – Model trong phần
mềm MOE để xây dựng mô hình trên những
thông số mô tả đã chọn. Lựa chọn lại thông số
mô tả bằng cách loại dần theo hệ số tương
quan với pIC50 và đánh giá bằng đánh giá chéo
bỏ-một-ra. Dùng giá trị Z-score để loại chất gây
nhiễu. Xây dựng lại mô hình với những tập đã
loại nhiễu.

Đánh giá mô hình dự đoán

Để thẩm định khả năng dự đoán, các mô
hình cần được đánh giá nội (đánh giá chéo bỏmột-ra) và đánh giá trên tập ngoại. Các thông số
đánh giá chéo gồm: (i) giá trị trung bình bình
phương hệ số tương quan của các mô hình thứ
cấp Q2, (ii) RMSE tiến hành đồng thời với xây
dựng mô hình bằng MOE; các thông số đánh giá
trên tập ngoại gồm: (iii) bình phương hệ số
tương quan R2, (iv) RMSE bằng công cụ model
evaluate của MOE.

KẾT QUẢ VÀ BÀN LUẬN
Xây dựng và đánh giá mô hình
Với mỗi mô hình, tập dữ liệu bao gồm công
thức hóa học hai chiều, pIC50, các thông số mô tả
được lưu trữ dưới dạng *.mdb trong chương
trình MOE. Mỗi tập dữ liệu được chia thành hai
tập hợp: xây dựng mô hình và đánh giá ngoại
theo tỉ lệ 4:1. Với mỗi mô hình, tập xây dựng tiến
hành như trình bày trong PPNC. Lượng thông
số mô tả chọn ra tối đa bằng 1/5 số lượng chất
trong tập hợp. Kết quả số lượng chất trong các
tập hợp và số lượng thông số mô tả cho mỗi mô
hình được tóm tắt trong Bảng 4.

398

Bảng 2. Số chất trong các tập hợp và cách thức phân
chia ứng với mỗi mô hình
stt Mô hình Số hợp Kiểu phân Tập
Tập

chất
phối
xây ngoại
dựng
1
K1-1
261 Ngẫu nhiên 210
51
2 FcB1-1 170 Ngẫu nhiên 136
34
3 NF54-1
95 Ngẫu nhiên 76
19
4 Dd2-1
55 Ngẫu nhiên 44
11
5
W2-1
50
Đa dạng
40
10

Số
thông
số
8
7
5
5

5

Phương trình hồi qui thể hiện mối liên
quan định lượng giữa cấu trúc (thông số mô
tả) và tác dụng kháng sốt rét, có dạng:
y=a0+aixi. Trong đó a0 là hệ số chặn của phương
trình, nếu tất cả các thông số mô tả xi=0 thì
hoạt tính y=a0; ai là hệ số hồi qui của từng
thông số xi, thể hiện tỉ lệ và chiều hướng thay
đổi hoạt tính sinh học khi giá trị thông số thay
đổi. Cụ thể, nếu ai dương thì cấu trúc có thông
số mô tả xi sẽ cho hoạt tính tăng và ngược lại.
Phương trình hồi quy của các mô hình được
trình bày dưới dạng bảng (các Bảng 6, 8, 10, 12,
14, 16, 18, 20, 21, 22) bao gồm các thông tin
trên và hệ số tương quan chéo của từng cặp
thông số mô tả, tất cả đều nhỏ hơn 0.90 (90%).
Khả năng dự đoán của các mô hình được thể
hiện: (i) căn bậc hai sai số chuẩn (RMSE), (ii)
bình phương hệ số hồi qui (R2), (iii) giá trị p của
tập xây dựng. Để đánh giá lại khả năng dự đoán
dùng các thông số như trình bày trong phần
PPNC. Các giá trị trên được thể hiện trong các
Bảng 5, 7, 9, 11, 13, 15, 17, 19, 21, 23 tương ứng
cho mỗi mô hình. Đường thẳng tương quan
pIC50 dự đoán – pIC50 thực nghiệm của tập xây
dựng (góc trên trái) và tập ngoại (góc dưới phải)
được thể hiện trong các Hình 6, 8, 10, 12, 14, 16,
18, 20, 22, 24. Hai đường thẳng song song ở hai
bên đường hồi quy thể hiện 95% dự đoán đúng

được R2 (%) tùy từng mô hình.
Mô hình K1-1: dự đoán hoạt tính kháng sốt
rét trên P.f dòng K1 đề kháng CQ với phương
pháp thử hoạt tính đo độ hấp thu phóng xạ.
Mô hình K1-1 được xây dựng trên tập xây
dựng gồm 210 chất thuộc nhiều nhóm cấu trúc
(PPNC). Tập xây dựng có giá trị p <0,0001 chứng

Chuyên Đề Dược Khoa


Y Học TP. Hồ Chí Minh * Tập 15 * Phụ bản của Số 1 * 2011
tỏ giá trị dự đoán và thực nghiệm khác nhau
không có ý nghĩa với giả thuyết phủ định ban
đầu là “khác nhau có ý nghĩa”. RMSE thể hiện
sai số trung bình giữa pIC50 thực nghiệm và dự
đoán là 0,54, tương đương IC50 là ~3 nM, sai số
này nhỏ. Mức độ tương quan giữa giá trị dự
đoán và thực nghiệm là 82%, tương đối tốt. Các
giá trị cho kết quả tương tự khi đánh giá chéo.

Nghiên cứu Y học

Bảng4. Bảng thông số mô tả xây dựng phương trình
hồi qui của mô hình K1-1 (I)
Stt

Tên

Ý nghĩa


ai

1

BCUT_PE
OE_0
Rings

Chỉ số liên kết ma trận liền
kề với điện tích nhỏ nhất
Số vòng

3

PEOE_VS
A+1

Diện tích bề mặt VDW có
điện tích (0.05,0.10)

+0.9090
5
+0.8817
8
-1.19092

4

LogS


5

a_acc

6

vsa_acc

7

SlogP_VSA
4
logP(o/w)

Log của độ tan trong nước
có giá trị (-1, 1)
Số nguyên tử nhận liên
kết H, cả liên kết cho nhận
OH), trừ acid
Bề mặt VDW có nguyên
tử nhận H, trừ acid và
nguyên tử cho nhận (OH)
Diện tích có logP(o/w)
nằm trong (0.1,0.15).
Log của hệ số phân bố
octanol/nước

2


8

-1.55543
-1.11685

-2.11256

+2.4813
6
-4.97468

H: liên kết hydro. VDW: liên kết Van der Waals.
logP(o/w): log của hệ số phân bố octanol/ nước

Hình 1. Đường thẳng tương quan pIC50 dự đoán và
thực nghiệm của tập xây dựng và tập ngoại mô hình
K1-1

Mô hình FcB1-1: trên P.f dòng FcB1 đề
kháng CQ với phương pháp thử hoạt tính đo độ
hấp thu phóng xạ.

Mô hình được đánh giá ngoại trên tập ngoại
gồm 51 chất được lấy ra theo phân phối ngẫu
nhiên, đảm bảo tính khách quan khi ứng dụng
mô hình. Giá trị dự đoán của các chất phần lớn
nằm trong khoảng 95% dự đoán đúng 82% của
mô hình. Sai số dự đoán và mức độ tương quan
là chấp nhận được khi mà tập ngoại chỉ bằng
25% tập xây dựng.

Như vậy, mô hình K1-1 có khả năng dự
đoán tốt các chất có thông số mô tả nằm trong
khoảng giá trị của tập xây dựng.
Bảng 3. Các thông số đánh giá của mô hình K1-1
RMSE
R2/Q2
Giá trị p

Tập xây dựng Đánh giá chéo Tập ngoại
0,54
0,57
0,73
0,82
0,80
0,71
<0,0001

Chuyên Đề Dược Khoa

Hình 2. Đường thẳng tương quan pIC50 dự đoán và
thực nghiệm của tập xây dựng và tập ngoại mô hình
FcB1-1
Bảng 4 cho thấy sai số giữa giá trị dự đoán
và thực nghiệm của tập xây dựng, đánh giá

399


Y Học TP. Hồ Chí Minh * Tập 15 * Phụ bản của Số 1 * 2011


Nghiên cứu Y học

ngoại và đánh giá nội cho giá trị nhỏ. Bình
phương hệ số tương quan đều trên 0,70, có khả
năng dự đoán tốt.
Bảng 5. Các thông số đánh giá của mô hình FcB1-1
RMSE
R2/Q2
Giá trị p

Tập xây dựng Đánh giá chéo Tập ngoại
0,56
0,59
0,66
0,75
0,72
0,76
<0,0001

Bảng 6. Bảng thông số mô tả xây dựng phương trình
hồi qui của mô hình FcB1-1 (II)
Stt

Tên

1

Diameter

2


3

4
5

Ý nghĩa

Khoảng cách giữa
hai nguyên tử xa nhất
BCUT_PEOE_0
Chỉ số liên kết ma
trận liền kề với điệ n
tích nhỏ nhất
GCUT_SLOGP_2 Chỉ số liên kết ma
trận liền kề khoảng
cách với hệ số phân
bố o/w ở mức 2/3
a_ICM
Chứa thông tin
nguyên tử
Rings
Số vòng

6

Q_VSA_FNEG

7


Q_VSA_POL

2
3

400

Ý nghĩa
Tỉ lệ liên kết đơn quay
được
Rings
Số vòng
PEOE_VSA_HY Tổng diện tích bề mặt
D
VDW kỵ nước, có trị
tuyệt đối điện tích ≤0,2

Tổng diện tích bề mặt -2.83267
VDW có độ khúc xạ
trong vùng (0.11,0.26)
Hệ số chặn của phương 4.71914
trình (III)

VDW: liên kết Van der Waals. logP(o/w): log của hệ số
phân bố octanol/ nước.

-3.06610
-2.22365

Tập ngoại

0,94
0,62

Bảng 8. Bảng thông số mô tả xây dựng phương trình
hồi qui của mô hình NF54-1 (III)
Tên
b_1rotR

SMR_VSA1

-2.17195

Bảng 7. Các thông số đánh giá của mô hình NF54-1

Stt
1

5

+2.13552

Mô hình NF54-1: trên P.f đề kháng CQ với
phương pháp thử hoạt tính đo độ hấp thu
phóng xạ

RMSE
R2/Q2
Giá trị p

Ý nghĩa

ai
Tổng diện tích bề mặt +2.87314
VDW có logP(o/w) >0,4

-1.27200

VDW: liên kết Van der Waals

Đánh giá
chéo
0,55
0,85

Tên
SlogP_VSA9

ai

Tỉ lệ diện tích bề mặt +3.96696
VDW mang điện tích
âm
Tổng diện tích bề mặt +4.35695
VDW có trị tuyệt đối
điện tích > 0,2
Hệ số chặn của
1.77705
phương trình (II)

Tập
xây dựng

0,50
0,87
<0,0001

Stt
4

ai
-3.86875
-3.63093
+6.29295

Hình 3. Đường thẳng tương quan pIC50 dự đoán và
thực nghiệm của tập xây dựng và tập ngoại mô hình
NF54-1
Mô hình NF54-1 có sai số giữa giá trị dự
đoán và thực tế của tập xây dựng và đánh giá
chéo nhỏ nhưng của tập ngoại tương đối cao
(Bảng 6). Tuy nhiên, giá trị này vẫn chấp nhận
được. Tương tự, bình phương hệ số hồi qui của
tập xây dựng và đánh giá chéo trên 0,8, chứng tỏ
khả năng dự đoán cao. Tập ngoại có R2 thấp hơn
0,62 nhưng vẫn chấp nhận được. Trên đồ thị,
cho thấy phần lớn các giá trị của tập ngoại nằm
trong vùng 95% dự đoán đúng 62% (R2=0,62)
của mô hình.
Mô hình Dd2-1: trên P.f dòng Dd2 đề kháng
CQ với phương pháp thử hoạt tính đo độ hấp
thu phóng xạ


Chuyên Đề Dược Khoa


Y Học TP. Hồ Chí Minh * Tập 15 * Phụ bản của Số 1 * 2011
Bảng 9. Các thông số đánh giá của mô hình Dd2-1
RMSE
R2/Q2
Giá trị p

Tập
xây dựng
0.57
0.72
<0,0001

Đánh giá
chéo
0,69
0,60

Tập ngoại
0,53
0,60

Như trình bày ở Bảng 8 và Hình 5, mô hình
Dd2-1 cho thấy có khả năng dự đoán tốt với
bình phương hệ số hồi qui là 0,75. Các thông số
đánh giá chéo và đánh giá ngoại chấp nhận.

Nghiên cứu Y học


Mô hình W2-1: trên P.f dòng W2 đề kháng
CQ với phương pháp thử hoạt tính đo độ hấp
thu phóng xạ
Bảng 11. Các thông số đánh giá của mô hình W2-1
RMSE
R2/Q2
Giá trị p

Tập xây dựng
0,62
0,79
<0,0001

Đánh giá chéo Tập ngoại
0,70
0,84
0,72
0,74

Các thông số đánh giá thể hiện trong Bảng
10 chứng tỏ mô hình có khả năng dự đoán tốt.
Bảng 12. Bảng thông số mô tả xây dựng phương
trình hồi qui của mô hình W2-1 (V)
Stt
Tên
Ý nghĩa
1 GCUT_PEOE Chỉ số liên kết ma trận liền kề
_3
khoảng cách với điện tích ở

mức cao nhất
2 PEOE_VSA+ Tổng diện tích bề mặt VDW có
1
điện tích trong vùng (0.05,0.10)
3 Q_VSA_POL Tổng diện tích bề mặt VDW có
trị tuyệt đối điện tích > 0,2
4 SlogP_VSA1 Tổng diện tích bề mặt VDW có
logP(o/w) trong vùng (-0.4,-0.2)
5 logP(o/w)
Log của hệ số phân bố
octanol/nước
Hệ số chặn của phương trình
(V)

a1
-4.30708

-2.10315
+1.34725
+1.77359
+5.21978
1.41303

VDW: liên kết Van der Waals. logP(o/w): log của hệ số
phân bố octanol/ nước.

Hình 4. Đường thẳng tương quan pIC50 dự đoán và
thực nghiệm của tập xây dựng và tập ngoại mô hình
Dd2-1
Bảng 10. Bảng thông số mô tả xây dựng phương

trình hồi qui của mô hình Dd2-1 (IV)
Stt

Tên

Ý nghĩa

ai

1

a_nN

Số nguyên tử N

-3.32901

2

PEOE_
VSA-5
PEOE_
VSA-6
SlogP_
VSA2
SMR_V
SA6

Tổng diện tích bề mặt VDW có
điện tích trong vùng (-0.30,-0.25)

Tổng diện tích bề mặt VDW có
điện tích trong nhỏ hơn -0.30
Tổng diện tích bề mặt VDW có
logP(o/w) trong vùng (-0.2,0)
Tổng diện tích bề mặt VDW có
đọ khúc xạ trong vùng
(0.485,0.56)
Hệ số chặn của phương trình
(IV)

-3.23264

3
4
5

-4.97440
-2.48145
+2.63627

8.36605

VDW: liên kết Van der Waals. logP(o/w): log của hệ số
phân bố octanol/ nước.

Chuyên Đề Dược Khoa

Hình 5. Đường thẳng tương quan pIC50 dự đoán và
thực nghiệm của tập xây dựng và tập ngoại mô hình
W2-1


401


Nghiên cứu Y học

Y Học TP. Hồ Chí Minh * Tập 15 * Phụ bản của Số 1 * 2011

Ứng dụng các mô hình trên để dự đoán
hoạt tính kháng sốt rét của các dẫn chất
chalcon
Kết quả 5 mô hình (K1-1, FcB1-1, NF54-1,
Dd2-1, W2-1) có R2 của tập xây dựng, đánh giá
chéo và tập ngoại đều trong khoảng 0,57 – 0,86,
RMSE trong khoảng 0,28 – 0,94, cho thấy khả
năng dự đoán đúng trên 50% và sai số giữa giá
trị dự đoán và giá trị thực nghiệm là chấp nhận
được. Các mô hình xây dựng được ứng dụng
trên nhóm dẫn chất 2’-hydroxy 4’-methoxy
chalcon (1) và 2’-hydroxy 4’,6’-dimethoxy
chalcon (2) với công thức trình bày ở Bảng 12.
Tập ứng dụng phải gồm các chất có thông số mô
tả có giá trị trong khoảng giá trị lớn nhất (GTLN)
và nhỏ nhất (GTNN) của tập xây dựng mô hình.
Kết quả dự đoán (Bảng 13) cho thấy các dẫn
chất thuộc nhóm 2 có IC50 thấp hơn so với nhóm
dẫn chất 1. So sánh với cấu trúc ở Bảng 26 cho
thấy nhóm 2 có thêm một nhóm OCH3 ở vị trí 6’
của vòng A. Ba chất 2.3, 2.4, 2.5 có ba nhóm thế
OCH3 ở vị trí 6’ của vòng A. Ba chất 2.3, 2.4, 2.5

có ba nhóm thế OCH3 trên vòng B có IC50 dự
đoán nhỏ hơn so với cấu trúc chỉ có hai nhóm
OCH3 trong cùng nhóm. Chất 2.1 không có
nhóm thế OCH3 trên vòng B có IC50 dự đoán lớn
nhất trong đa số mô hình (gồm K1-1, FcB1-1,
Dd2-1, D10-2). Chất 2.6 không có nhóm thế
OCH3, thay vào đó là nhóm thế Cl (halogen) ở vị
trí số 4 trên vòng A, cho giá trị hoạt tính dự đoán
cao ở phần lớn các mô hình (gồm FcB1-1, Dd2-1,
W2-1 và D10-2). Không có sự khác biệt rõ ràng
về hoạt tính dự đoán trên các dẫn chất có hai
nhóm thế OCH3 ở các vị trí khác nhau trên vòng
B. Điều này có thể so sánh giữa IC50 dự đoán của
các chất 1.1, 1.2 và 1.3 hay 2.2, 2.7 và 2.8. Như

vậy theo như giá trị dự đoán từ các mô hình xây
dựng được trên 2 nhóm dẫn chất chalcon giá trị
hoạt tính kháng sốt rét tăng khi có thêm nhóm
thế OCH3 trên các vị trí khác nhau của cả vòng A
và B. Không có nhóm thế hay thay bằng Cl
(halogen) trên vòng A làm hoạt tính giảm.
Bảng 13. Cấu trúc 11 dẫn chất chalcon thuộc nhóm 1
và nhóm 2

Vòng A Vòng B

1.1
1.2
1.3


(2’-hydroxy 4’-methoxy chalcon)
2
3
4
OCH3
OCH3
OCH3
OCH3
OCH3
OCH3

5

Vòng A Vòng B
(2’-hydroxy 4’,6’-dimethoxy chalcon)
2
3
4
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8

OCH3
OCH3


OCH3
OCH3

OCH3
OCH3

OCH3
OCH3

OCH3
OCH3
OCH3
OCH3
Cl

5

OCH3
OCH3

OCH3

Bảng 14. Kết quả dự đoán hoạt tính kháng sốt rét của 11 dẫn chất chalcon thuộc nhóm 1 và 2
Tên
1.1
1.2
1.3
2.1
2.2
2.3


402

K1-1
pIC50
4.32
4.29
4.30
4.34
4.28
4.27

IC50 (nM)
20862
19467
19992
22002
19272
18805

FcB1-1
pIC50
5.18
5.17
5.21
5.58
5.05
4.95

IC50 (nM)

150262
146825
161314
382895
111837
88779

Dd2-1
pIC50
6.12
6.12
6.12
6.52
5.73
5.34

IC50 (nM)
1331308
1331308
1331308
3285808
539406
218551

W2-1
pIC50
2.43
2.59
2.51
2.54


IC50 (nM)
267
393
321
349

2.08

119

Chuyên Đề Dược Khoa


Y Học TP. Hồ Chí Minh * Tập 15 * Phụ bản của Số 1 * 2011

2.4
2.5
2.6
2.7
2.8

K1-1
4.24
4.21
4.22
4.27
4.26

17540

16080
16415
18555
18055

FcB1-1
4.96
4.96
5.05
5.09
5.05

Dd2-1
5.34
5.34
6.52
5.73
5.73

90511
92149
113496
124115
112753

OCH3: tăng hoạt tính kháng sốt rét khi thêm vào các vị trí sau

Nghiên cứu Y học

218551

218551
3285808
539406
539406

W2-1
2.16

145

2.98
2.28
2.36

964
191
231

dimethoxy chalcon). Kết quả ứng dụng trên
nhóm 1 và 2 cho thấy vai trò tăng hoạt tính
kháng sốt rét của nhóm thế methoxy (OCH3)
trên cả vòng A và vòng B.

TÀI LIỆU THAM KHẢO
1.

Hình 7. Vai trò nhóm thế methoxy trên dẫn chất 2’hydroxy chalcon suy ra bằng quan sát mối quan hệ
cấu trúc – hoạt tính kháng sốt rét từ kết quả dự đoán

2.


3.

KẾT LUẬN

4.

Nghiên cứu này tiến hành thu thập dữ liệu
gần 1700 chất thuộc các nhóm cấu trúc khác
nhau từ nhiều bài báo và ứng dụng thuật toán
bình phương tối thiểu từng phần (PLS) để xây
dựng 5 mô hình hồi qui tuyến tính dự đoán hoạt
tính kháng sốt rét trên máy tính. Các mô hình
này được xây dựng từ các nhóm chất có hoạt
tính kháng sốt rét thử nghiệm trên 5 dòng tế bào
gồm đề kháng (K1, FcB1, NF54, Dd2, W2) với
phương pháp thử nghiệm là đo độ hấp thu
phóng xạ, đo quang và đếm huỳnh quang. Khả
năng dự đoán của các mô hình được đánh giá
bởi các thông số là giá trị p, căn tổng bình
phương phần dư RMSE, bình phương hệ số
tương quan R2 của tập xây dựng, của đánh giá
chéo bỏ-một-ra và của tập ngoại. Kết quả 5 mô
hình được xây dựng ở trên có thể dùng để dự
đoán hoạt tính kháng sốt rét với khả năng dự
đoán khả quan. Từ đó định hướng thiết kế và
tổng hợp các chất có hoạt tính kháng sốt rét có
giá trị thông số mô tả trong giới hạn của mỗi mô
hình trên các dòng và theo các phương pháp
tương ứng với từng mô hình. Nghiên cứu này

ứng dụng các mô hình K1-1, FcB1-1, Dd2-2 và
W2-1 dự đoán hoạt tính kháng sốt rét trên 11
dẫn chất chalcon thuộc nhóm 1 (2’-hydroxy 4’methoxy chalcon) và nhóm 2 (2’-hydroxy 4’,6’-

5.

Chuyên Đề Dược Khoa

6.
7.

8.

9.
10.
11.

12.

13.

14.

15.
16.

Fidock DA., et al., (2004), "Antimalarial drug discovery:
Efficacy models for compound screening", Nature, 3, 509-520.
Wells TNC., Alonso PL., and Gutteridge WE., (2009), "New
medicines to improve control and contribute to the

eradication of malaria", Nature, 8, 879-891.
World Health Organization, (2009), World malaria report 2009,
WHO Press, />Kar Santwana and Kar Santosh, (2010), "Control of malaria",
Nature, 9, 511-512.
Desjardins RE, et al., (1979), "Quantitative assessment of
antimalarial activity in vitro by semiautomated microdilution
technique", Antimicrobial Agents and Chemotherapy, 16(6), 710718.
Trager W and Jensen JB, (1976), "Human malaria parasites in
continuous culture", Science, 193, 673-675.
Makler MT. and Hinrichs DJ (1993), "Measurement of the
lactate dehydrogenase activity of Plasmodium falciparum as an
assessment of parasitemia", Am. J. Trop. Med. Hyg., 48(2), 205210.
Makler MT, et al., (1993), "Parasite lactate dehydrogenase as
an assay for Plasmodium falciparum drug sensitivity", Am. J.
Trop. Med. Hyg., 48(6), 739-741.
Livingstones D, (1995), Data analysis for chemists, Oxford
University Press, 11-13,
Livingstone D, (1995), Data analysis for chemists, Oxford
University Press, 149-158,
Hastie T, Tibshirani R, and Friedman J, The elements of
statistical learning: data mining, inference, and prediction, tái bản
lần thứ 2, Springer, 57-59,
Fattorusso C et al., (2008), "Design, synthesis, and structure–
activity relationship studies of 4 quinolinyl- and 9acrydinylhydrazones as potent antimalarial agents", J. Med.
Chem. , 51, 1333-1343.
Guillon J et al., (2004), "Synthesis, antimalarial activity, and
molecular modeling of new pyrrolo(1,2-a)quinoxalines,
bispyrrolo(1,2-a)quinoxalines,
bispyrido(3,2-e)pyrrolo(1,2a)pyrazines, and bispyrrolo(1,2-a)thieno(3,2-e)pyrazines", J.
Med. Chem., 47, 1997-2009.

Go ML, et al., (1998), "Structure-activity relationships of some
indolo(3,2-clquinolines with antimalarial activity", European
Journal of Pharmaceutical Sciences, 6, 19-26.
Boss C et al., (2006), "Achiral, cheap, and potent inhibitors of
plasmepsins I, II, and IV", ChemMedChem, 1341-1345.
Glenn MP et al., (2006), "Structurally simple, potent,
plasmodium selective farnesyltransferase inhibitors that
arrest the growth of malaria parasites", J. Med. Chem., 49, 57105727.

403


Nghiên cứu Y học
17.

18.

19.

20.

21.

22.

23.

24.

25.


26.

27.

28.

29.

30.

31.

32.

33.

404

Y Học TP. Hồ Chí Minh * Tập 15 * Phụ bản của Số 1 * 2011

O’Neill PM et al., (2006), "Diels–Alder/thiol–olefin cooxygenation approach to antimalarials incorporating the 2,3dioxabicyclo(3.3.1)nonane pharmacophore", Bioorganic &
Medicinal Chemistry Letters, 16, 2991-2995.
Liu M, Wilairat P and Go ML, (2001), "Antimalarial
alkoxylated and hydroxylatedchalones: Structure-activity
relationship analysis", J. Med. Chem., 44, 4443-4452.
Go ML et al., (2004), "Antiplasmodial chalcones Inhibit
sorbitol-Induced hemolysis of Plasmodium falciparuminfected erythrocytes", Antimicrobial Agents and Chemotherapy,
48(9), 3241-3245.
Tasdemir D et al., (2006), "Inhibition of Plasmodium

falciparum fatty acid biosynthesis: Evaluation of FabG, FabZ,
and FabI as drug targets for Flavonoid", J. Med. Chem., 49,
3345-3353.
Ayad
F,
Tilley
L,
and
Deady
LW,
(2001),
"Synthesis,antimalarial activity andinhibition of haem
detoxification of novel bisquinolines", Bioorganic & Medicinal
Chemistry Letters, 11, 2075-2077.
Vicente E et al., (2008), "Synthesis and structureeactivity
relationship
of
3-phenylquinoxaline
1,4-di-N-oxide
derivatives as antimalarial agents", European Journal of
Medicinal Chemistry, 43, 1903-1910.
Jeyadevan JP et al., (2004), "Antimalarial and antitumor
evaluation of novel C-10 non-acetal dimers of 10 -(2Hydroxyethyl)deoxoartemisinin", J. Med. Chem., 47, 12901298.
Ryckebusch A et al., (2005), "Synthesis and antimalarial
evaluation
of new N1-(7-chloro-4-quinolyl)-1,4-bis(3aminopropyl)piperazine derivatives", Bioorganic & Medicinal
Chemistry Letters 15, 297-302.
Ryckebusch A, et al., (2002), "Parallel synthesis and antimalarial activity of a sulfonamide library", Bioorganic &
Medicinal Chemistry Letters 12, 2595-2598.
Ryckebusch A., et al., (2004), "Design, synthesis and

antimalarial activity of a glyoxylylhydrazone library",
Bioorganic & Medicinal Chemistry Letters, 14, 4439-4443.
Domínguez JN et al., (2001), "Synthesis of quinolinyl
chalcones and evaluation of their antimalarial activity", Eur. J.
Med. Chem. , 36, 555-560.
Ryckebusch A et al., (2003), "Synthesis and antimalarial
evaluation
of
new
1,4-bis(3-aminopropyl)piperazine
derivatives", Bioorganic & Medicinal Chemistry Letters 13, 37833787.
Flipo M et al., (2003), "Design, synthesis and antimalarial
activity of novel, quinoline-based, zinc metalloaminopeptidase inhibitors", Bioorganic & Medicinal Chemistry
Letters 13, 2759-2662.
Melnyk P et al., (2006), "Design, synthesis and in vitro
antimalarial activity of an acylhydrazone library", Bioorganic
& Medicinal Chemistry Letters 16, 31-35.
Klingenstein R et al., (2006), "Similar structure activity
relationships of quinoline Derivatives for antiprion and
antimalarial effects", J. Med. Chem., 49, 5300-5308.
Ryckebusch
A
et
al.,
(2005),
"Novel
N-(4Piperidinyl)benzamide antimalarials with mammalian
protein farnesyltransferase inhibitory activity", Chem. Pharm.
Bull., 53(10), 1324-1326.
Grellepois F et al., (2004), "Orally active antimalarials:

Hydrolytically stable derivatives of 10-trifluoromethyl
anhydrodihydroartemisinin", J. Med. Chem., 47, 1423-1433.

34.

35.

36.

37.

38.

39.

40.

41.

42.

43.

44.

45.

46.

47.


48.

49.

50.

51.

Zmitek K, et al., (2006), "Synthesis and antimalarial activities
of novel 3,3,6,6-tetraalkyl-1,2,4,5-tetraoxanes", Bioorganic &
Medicinal Chemistry Letters, 14, 7790-7795.
Posner GH et al., (1996), "Antimalarially potent, easily
prepared, fluorinated endoperoxides ", Tetrahedron Letters,
37(40), 7225-7228.
Posner GH., et al., (1996), "Mechanism-based design of
simple, symmetrical, easily prepared, potent antimalarial
endoperoxides ", Tetrahedron Letters, 37(6), 815-818.
Posner GH et al., (1997), "Synthesis and antimalarial activity
of heteroatom-containing bicyclic endoperoxides ",
Tetrahedron, 53(1), 37-50.
Bachi MD et al., (1998), "Synthesis and in vitro antimalarial
activity of sulfone endoperoxides", Bioorganic & Medicinal
Chemistry Letters 8, 903-908.
Solomon VR et al., (2007), "Synthesis and antimalarial activity
of side chain modified 4-aminoquinoline derivatives", J. Med.
Chem., 50, 394-398.
Kim J et al., (2006), "Ground state oxygen in synthesis of cyclic
peroxides. Part 1: Benzo fused ketals", Tetrahedron 62, 41204127.
Kohring K et al., (2008), "Development of benzophenonebased farnesyltransferase inhibitors as novel antimalarials",

ChemMedChem, 3(8), 1217-1231.
Haemers T et al., (2006), "Synthesis of a-substituted
fosmidomycin analogues as highly potent Plasmodium
falciparum growth inhibitors ", Bioorganic & Medicinal
Chemistry Letters 16, 1888-1891.
Amewu R et al., (2006), "Synthesis of 1,2,4-trioxepanes via
application of thiol-olefin co-oxygenation methodology",
Bioorganic & Medicinal Chemistry Letters, 16, 6124-6130.
Leban J et al., (2004), "Sulfonyl-phenyl-ureido benzamidines: a
novel structural class of potent antimalarial agents", Bioorganic
& Medicinal Chemistry Letters 14, 1979-1982.
Oliveira Renata B. de, et al., (2008), "Synthesis and
antimalarial activity of semicarbazone and thiosemicarbazone
derivatives", European Journal of Medicinal Chemistry, 43, 19831988.
Navarrete-Vázquez G et al., (2006), "Synthesis and
antiprotozoal activity of some 2-(trifluoromethyl)-1Hbenzimidazole bioisosteres", European Journal of Medicinal
Chemistry, 41, 135-141.
Zhu S et al., (2006), "Synthesis and evaluation of febrifugine
analogues as potential antimalarial agents", Bioorganic &
Medicinal Chemistry Letters 16, 1854-1848.
Kamchonwongpaisan S et al., (2004), "Inhibitors of multiple
mutants of Plasmodium falciparum dihydrofolate reductase
and their antimalarial activities", J. Med. Chem., 47, 673-680.
Musonda CC et al., (2004), "Application of multi-component
reactions to antimalarial drug discovery. Part 1: Parallel
synthesis and antiplasmodial activity of new 4aminoquinoline Ugi adducts", Bioorganic & Medicinal
Chemistry Letters 14, 3901-3905.
Tran Khac Vu, Nguyen Van Tuyen, and Tran Van Sung,
(2005), "Synthesis of novel 10-deoxoartemisinins", Bioorganic
& Medicinal Chemistry Letters 15, 2629-2631.

Galli U et al., (2005), "Synthesis and antimalarial activities of
some furoxan sulfones and related furazans", European Journal
of Medicinal Chemistry, 40, 1335-1340.

Chuyên Đề Dược Khoa


Y Học TP. Hồ Chí Minh * Tập 15 * Phụ bản của Số 1 * 2011
52.

53.

54.

55.

56.

Fattorusso C et al., (2006), "Endoperoxide derivatives from
marine organisms: 1,2-Dioxanes of the Plakortin family as
novel antimalarial agents", J. Med. Chem., 49, 7088-7094.
Melato S et al., (2008), "A combinatorial approach to 2,4,6trisubstituted triazines with potent antimalarial activity:
Combining conventional synthesis and microwave
assistance", ChemMedChem, 3, 873-876.
Musonda CC et al., (2006), "Application of multicomponent
reactions to antimalarial drug discovery. Part 2: New
antiplasmodial and antitrypanosomal aminoquinoline
gamma- and delta-lactams via a ‘catch and release’ protocol",
Bioorganic & Medicinal Chemistry 14(16), 5650-5615.
Chipeleme A et al., (2007), "Synthesis and biological

evaluation of phenolic Mannich bases of benzaldehyde and
(thio)semicarbazone derivatives against the cysteine protease
falcipain-2 and a chloroquine resistant strain of Plasmodium
falciparum", Bioorganic & Medicinal Chemistry, 15, 273-282.
Desai PV, et al., (2006), "Identification of novel parasitic
cysteine protease inhibitors by use of virtual screening. 2. The
available chemical directory", J. Med. Chem., 49, 1576-1584.

Chuyên Đề Dược Khoa

57.

58.
59.

60.

61.

Nghiên cứu Y học

Madrid PB, et al., (2005), "Synthesis of ring-substituted 4aminoquinolines and evaluation of their antimalarial
activities", Bioorganic & Medicinal Chemistry, 15, 1015-1018.
Raynes K, et al., (1996), "Novel bisquinoline antimalarials ",
Biochemical Pharmacology, 52, 551-559.
Taylor DK, et al., (2004), "Novel endoperoxide antimalarials:
Synthesis, heme binding, and antimalarial activity", J. Med.
Chem., 47, 1833-1839.
Clarkson C et al., (2003), "Synthesis of totarol amino alcohol
derivatives and their antiplasmodial activity and

cytotoxicity", Bioorganic & Medicinal Chemistry, 11, 4417-4422.
Yeh S, Smith PJ, and Chibale K, (2008), "Dual-acting diamine
antiplasmodial and chloroquine resistance modulating
agents", Biochemical Pharmacology 72(2), 156-165.
Nallan Laxman, et al., (2005), "Protein farnesyltransferase
inhibitors exhibit potent antimalarial activity", J. Med. Chem.,
48, 3704-3713.

405



×