QSAR Studies Using Artificial Intelligence
ÁP DỤNG TRÍ TUỆ NHÂN TẠO
NGHIÊN CỨU LIÊN QUAN ĐỊNH LƯỢNG
GIỮA CẤU TRÚC VỚI TÁC DỤNG
GSTS Đặng Văn Giáp
Tháng 4/ 2023
1. Trí tuệ nhân tạo và áp dụng
2. Liên quan cấu trúc-tác dụng (QSAR)
3. Tóm tắt hai nghiên cứu QSAR:
Thăm dị phương pháp và thơng số
QSAR của nhóm Pyrazolopyridin
QSAR của nhóm Benzofuran
4. Một số ý kiến thay lời kết luận
1
TRÍ TUỆ NHÂN TẠO
VÀ ÁP DỤNG
Định nghĩa “Trí tuệ nhân tạo”
Trí tuệ nhân tạo (AI: Artificial Intelligence): là sự biểu lộ trí tuệ bởi
máy tính mà có thể mơ phỏng thái độ hay kiểu suy nghĩ của bộ
não con người nhằm giải quyết các vấn đề cụ thể.
D
AI
C
B
A
Sáng suốt (Wisdom)
Tri thức (Knowledge)
Sâu (Deep)
Nông (Shallow)
Thông tin (Information)
Dữ liệu (Data)
2
Minh họa về nền tảng và áp dụng AI
Xác lập quy luật
Tối ưu hóa
Máy học
Tự động hóa
Nhận dạng hình ảnh
Khám phá tri thức
Ra quyết định
Ngôn ngữ
Tâm lý
Kỹ thuật
Triết
Sinh
Máy
Các lãnh vực áp dụng AI*
1. Thương mại điện tử (e-Commerce)
2. Giáo dục (Education)
3. Đời sống (Lifestyle)
4. Định hướng/ định vị (Navigation)
5. Người máy (Robotics)
h
n bện
á
o
đ
Chẩn cá thể
trị
Điều
thuốc h
á
h
p
Khám n bệnh dịc
á
D ự đo
6. Nguồn nhân lực (Human Resource)
7. Nghiên cứu thuốc & CCSK (Pharmaceutical & Healthcare Research)
8. Nơng nghiệp (Agriculture)
9. Trị chơi (Gaming)
* Avijeet Biswal, 2023)
3
10. Xe ô tô (Automobiles)
11.Truyền thông đại chúng (Social Media)
12. Tiếp thị (Marketing)
13. Chăm sóc khách hàng trực tuyến (Chatbots)
14. Tài chánh (Finance)
15. Thiên văn học (Astronomy)
16. Bảo toàn dữ liệu (Data Security)
17. Vận chuyển (Transport)
18. Kỹ nghệ máy tự động (Automotive Industry)
Các lãnh vực công nghệ thông minh
Công nghệ
thông minh
Mạng thần kinh
* Fuzzy logic
** Neurofuzzy logic
Thuật toán
di truyền
Hệ thống mờ
Logic mờ*
Logic mờ - thần kinh**
4
Áp dụng AI trong ngành Dược
Đối với lãnh vực Bào chế, Chiết xuất dược liệu
Phân tích liên quan nhân - quả (áp dụng logic mờ - thần kinh)
thành phần cơng thức – tính chất chế phẩm
điều kiện chiết xuất – tính chất sản phẩm
Tối ưu hóa cơng thức/ hoặc quy trình (áp dụng mạng thần kinh
& thuật tốn di truyền)
Đối với lãnh vực Hóa dược
Áp dụng mạng thần kinh, máy học...
Thiết lập liên quan cấu trúc – tác dụng (QSAR)
Dự đoán tác dụng/ độc tính (CADD)
Ngun tắc tối ưu hóa cơng thức
Mơ hình hóa (Modeling)*
Dự đốn
(What-if-preduction)*
Cơng thức
Thành phần
Điều kiện
Tối ưu hóa (Optimization)**
* Mạng thần kinh
** Thuật tốn di truyền
Sản phẩm
Tính chất
Giá thành
Áp dụng trong Bào chế:
Tối ưu hóa cơng thức
Dự đốn tình huống xấu
5
Ngun tắc xác lập mơ hình QSAR
Mơ hình hóa (Modeling)*
Cấu trúc
Dự đốn
(What-if-preduction)*
Tác dụng sinh học
Thơng số cấu trúc
* Mạng thần kinh
Mạng thần kinh + Logic mờ
Tác dụng
Áp dụng trong Hóa dược:
Xác lập mơ hình QSAR
Dự đốn tác dụng/ độc tính
Đầu vào cho nghiên cứu QSAR
Thơng số cấu trúc
Hóa lượng tử
Lý hóa
Lập thể
Tác dụng sinh học
In vitro
In vivo
In situ
MIC
MBC
IC50
EC50
ED50
SD50
LD50
TI (LD50/ ED50)
6
Cấu trúc mạng thần kinh nhân tạo
y1
x1
y2
x2
y3
x3
Lớp vào (I)
I(a)-HL(b)-O(c):
- a = số nút của lớp vào
- b = số nút của lớp ẩn
- c = số nút của lớp ra
y4
Lớp ẩn (HL)
Lớp ra (O)
* MLP: Multi-layer Perceptron Networks
Trọng số và hàm truyền
W1
NET
= XW
W2
X
Y
W3
F
MLP
X: Đầu vào
Y: Đầu ra
W: Trọng số
F: Hàm truyền (tuyến tính, sigmoid hay tanh)
7
Đánh giá mơ hình QSAR
Dữ liệu đầy đủ
Chọn
Nhóm luyện
R2 luyện
R2
1
n
i1
Đánh giá chéo
yˆ i ) 2
x 100
( y i y )2
(y
i1
n
Nhóm thử
R2 thử
i
R2 luyện: tính tương thích
R2 thử: khả năng dự đốn
LIÊN QUAN CẤU TRÚC - TÁC DỤNG
(QSAR)
8
Ý nghĩa và tầm quan trọng của QSAR
Mối liên quan định lượng giữa cấu trúc với tác dụng (QSAR): mối
liên quan giữa sự sắp xếp cấu trúc phân tử với các tính chất như
sinh hóa, vật lý, dược học, sinh học...
Hoạt tính sinh học = f (tham số lý hóa) (Puzyn & Leszczynski, 2012).
Sau khi nghiên cứu QSAR của một nhóm hoạt chất, có thể dự
đốn tác dụng hay cơ chế tác dụng của hợp chất cùng nhóm.
Sự dự đốn chính xác về cấu trúc phân tử có thể giảm thời gian
và chi phí tổng hợp so với phương pháp dị dẫm.
Sự dự đốn chính xác về tác dụng có thể tiết kiệm một số thử
nghiệm về tác dụng, giảm sự ảnh hưởng đến môi trường.
Minh họa tổng quát về QSAR
QSAR là tổng hòa của 3 mặt liên quan:
Liên quan cấu trúc - tính chất
SPR: Structure-Property Relationship
Liên quan tính chất - tác dụng
PAR: Property-Activity Relationship
Liên quan cấu trúc - tác dụng
SAR: Structure-Activity Relationship
Tính
chất
Cấu
trúc
Tác
dụng
9
QSAR và thiết kế phân tử thuốc
CSDL
thực nghiệm
Dữ liệu
lý thuyết
QSAR
Thiết kế
phân tử
in vivo
Thư viện
đại phân tử
in vitro
Tổng hợp
Sàng lọc ảo
Thuốc có thể từ nguồn máy tính
Nguồn gốc
Tổng hợp
Dược liệu
Sinh học
Máy tính
Nghiên cứu
& Phát triển
In vitro
Thất bại
In vivo
Thử lâm sàng
Thất bại
Thất bại
Thị trường
10
Thí dụ về thuốc có nguồn gốc máy tính
Thuốc
Cơng dụng
Ritonavir
Kháng HIV
Oseltamivir
Trị cúm
Dorzolamide
Trị glaucoma và
chứng tăng nhãn áp
Epalrestat
Trị rối loạn hệ thần kinh
do bệnh tiểu đường
Isoniazid
Kháng lao
Các mức trình bày/ mơ phỏng cấu trúc
Cấu trúc tương tác với môi trường
Cấu trúc lập thể - điện tử
Cấu trúc lập thể - cơ động
Khối cấu trúc
Cấu trúc 3 chiều
Cấu trúc 2 chiều
Công thức hóa học
11
Lập thể
Steric
Hằng số Hammett (,+,-)
Hằng số ion hóa (pka,pka)
Tham số Taft (Es)
Thể tích phân tử (MV)
Độ khúc xạ phân tử (MR)
Hóa lượng tử Khơng gian
Spatial
Quantum chemical
Chỉ số về bóng
Điện tử
Electronic
Điện tích ngun tử (Q)
Năng lượng (EHOMO, ELUMO)
Lý hóa
Physicochemical
Hệ số phân bố (log P)
Tham số hịa tan (log S)
Các thơng số cấu trúc cho QSAR
Cơ sở Hóa lượng tử điện tốn
Mơ hình sóng về ngun tử, dựa
trên phương trình Schrưdinger:
Ψ(x): hàm số sóng
E: năng lượng
Ĥ: tốn tử Hamilton
Là cơ sở của các phương pháp
bán nghiệm (trong QSAR) như
AM1, PM3… hay tiên nghiệm.
Thời gian tính
ĤΨ(x) = EΨ(x)
TNDO
AM1, PM3
MNDO
MINDO3
INDO
CNDO
Extended Hϋckel
Độ chính xác
12
Các mức độ nghiên cứu QSAR
1D- QSAR:
Hằng số phân ly (pKa)
Hệ số phân bố (log P)
2D- QSAR:
Điện tích nguyên tử
Độ khúc xạ phân tử
Momen lưỡng cực
3D- QSAR:
Các thông số WHIM*
* WHIM (weighted holistic
invariant molecular): thông
tin cấu trúc 3D về kích
thước, hình dạng, tính đối
xứng và phân bố điện tử.
4D- QSAR:
# 3D-QSAR nhưng khảo sát
nhiều cấu dạng của ligand
5D- QSAR:
Khảo sát các cấu dạng của
ligand gắn kết với receptor
6D- QSAR:
# 5D-QSAR song có thêm sự
động học phân tử của phức
ligand-receptor
Trong thực tế, cơ bản là
2D-QSAR và 3D-QSAR!
13
Các bước xác lập 2D-QSAR
Chuẩn bị
cơ sở dữ liệu
1
Tối thiểu hóa
năng lượng
2
6
Loại giá trị
ngoại lệ
Tính tốn
thơng số cấu trúc
3
7
Xác lập
mơ hình QSAR
8
Đánh giá
mơ hình QSAR
Chon nhóm thử
và nhóm luyện
5
4
Chọn lọc
thơng số
Các phương pháp xác lập QSAR
Phương pháp
tốn thống kê
Thí dụ: Hồi quy tuyến tính đa tham số
Phương pháp
phân loại
Thí dụ: Hồi quy logistic
Phương pháp
thơng minh
Thí dụ:
Mạng thần kinh (Neural networks)
Mạng thần kinh mờ (Fuzzy networks)
Máy học (Machine learning)
14
TÓM TẮT HAI NGHIÊN CỨU
QSAR (2022)
Trần Mỹ Ngọc, Đặng Thị Thanh Nhàn
Chung Khang Kiệt, Đặng Văn Giáp
THĂM DÒ
PHƯƠNG PHÁP VÀ THÔNG SỐ
15
Thăm dị các thơng số cấu trúc (MOE)
206
Sàng lọc chủ quan
(loại thông số quá xa lạ)
Sàng lọc bởi Phasolpro RD
(dựa trên R2 luyện > 90%)
44
Molecular Operating
Environment (MOE)
(Chemical Computing
Group Inc., 2015)
h_logP, logS
ICM
SlogP_VSA1
SMR_VSA2
5
Thăm dị phương pháp bán nghiệm
HyperChem 8.0
Diện tích ngun tử/ Pyrazolopiridin
N1
C2
C3
...
N7
N8
C9
AM1 (n = 10)
PM3 (n = 10)
Kết quả phân tích Anova 2 yếu tố (có lặp): Điện tích ngun tử
được tính tốn bởi hai phương pháp bán nghiệm AM1 và PM3
khác nhau có ý nghĩa thống kê (p < 0,05).
16
Chọn các phần mềm chuyên dụng
HyperChem 8.0 (Hypercube, Inc., 2008)
Xây dựng và tối ưu hóa cấu trúc 3D: MM+
Tính điện tích nguyên tử: AM1, PM3
Tính tính chất lý hóa
Phasolpro RD 1.5 (Khoa Dược, 2019)
Mạng thần kinh (nhóm thử: chọn thủ cơng, n = 2)
Thiếp lập QSAR và dự đoán tác dụng
Discovery studio visualiser 21.1.0: phân tích sự gắn kết
QSAR CỦA
NHĨM PYRAZOLOPYRIDIN
17
Nhóm dẫn xuất Pyrazolopyridin
Khung phân tử: Pyrazolo[3,4-b]pyridin
Tác dụng in vitro:
EC50, EC50b: lần lượt là hoạt tính trên EV-A71 và EV-D68
CC50: Độc tính trên tế bào ung thư cơ vân của người
Mục tiêu nghiên cứu QSAR:
R2
R
4
Có QSAR với tác dụng hay độc tính?
4
3
3a
Các vị trí nào trên khung có liên quan?
Thiết kế phân tử và dự đoán tác dụng?
2
1
7a
7
R3
5
6
R1
Đặc điểm các mơ hình QSAR (AM1)
Mơ hình
Nhóm thử
R2 luyện
R2 thử
QSAR1
QSAR2
QSAR3
QSAR4
QSAR5
QSAR6
QSAR7
QSAR8
QSAR9
QSAR10
QSAR11
QSAR12
QSAR13
QSAR14
QSAR15
QSAR16
QSAR17
QSAR18
1,4
23,24
21,23
19,22
15,24
12,13
10,11
9,2
8,18
8,24
7,14
7,2
6,19
5,6
4,14
2,25
2,10
1,19
90,9166
95,4389
97,3518
96,3890
92,6442
94,0926
91,2065
90,0001
92,7792
90,0761
96,5839
91,7763
93,6567
90,0552
90,3135
90,9075
97,9519
90,1483
77,5415
92,9125
75,0083
97,5580
92,7073
83,7161
75,8756
86,6187
83,9767
82,9309
96,5178
99,9963
75,2245
90,3357
98,9806
85,2643
88,2714
95,0620
EC50
x
x
x
x
x
x
x
x
x
x
x
Tác dụng
CC50
EC50b
x
x
x
x
x
x
x
18
Đặc điểm các mơ hình QSAR (PM3)
Mơ hình
Nhóm thử
R2 luyện
R2 thử
QSAR'1
QSAR'2
QSAR'3
QSAR'4
QSAR'5
QSAR'6
QSAR'7
QSAR'8
QSAR'9
QSAR'10
QSAR'11
QSAR'12
QSAR'13
QSAR'14
QSAR'15
QSAR'16
QSAR'17
QSAR'18
1,14
5,17
6,8
10,12
14,21
15,24
16,18
16,19
18,20
19,25
20,22
20,23
22,23
1,13
4,10
8,23
9,13
12,17
90,5442
91,1141
91,3240
92,4790
94,6071
91,2000
98,0174
92,0268
90,0849
99,2939
90,0601
98,8457
90,8905
91,5189
94,9466
92,6889
93,2306
91,5245
92,2267
88,1302
89,0661
81,0174
75,1594
75,0056
96,4397
90,6334
87,0963
75,0564
81,0376
75,0054
97,2458
83,3328
82,3205
75,3680
94,9925
94,9448
EC50
x
x
x
x
x
x
x
x
x
Tác dụng
CC50
x
EC50b
x
x
x
x
x
x
x
x
Đánh giá các mơ hình QSAR
100
Giá trị R 2
80
60
40
20
Nhìn chung trong 18 QSAR:
- R2 luyện > 90%: tính tương thích tốt
- R2 thử > 70%: khả năng dự đốn khá
R2
R2
R2
R2
luyện AM 1
luyện PM 3
thử AM 1
thử PM 3
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
Mơ hình QSAR
19
Các vị trí liên quan đến tác dụng (AM1)
Mơ hình
QSAR1
QSAR2
QSAR3
QSAR4
QSAR5
QSAR6
QSAR7
QSAR8
QSAR9
QSAR10
QSAR11
QSAR12
QSAR13
QSAR14
QSAR15
QSAR16
QSAR17
QSAR18
N1
x
x
N2
C3
C3 a
C4
C5
C6
x
N7
C7 a
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
EC50
CC50
Các vị trí liên quan đến tác dụng (PM3)
Mơ hình
QSAR1
QSAR2
QSAR3
QSAR4
QSAR5
QSAR6
QSAR7
QSAR8
QSAR9
QSAR10
QSAR11
QSAR12
QSAR13
QSAR14
QSAR15
QSAR16
QSAR17
QSAR18
N1
x
N2
C3
C3 a
C4
x
x
x
x
x
x
C5
C6
N7
C7 a
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
EC50
CC50
20