Tải bản đầy đủ (.pdf) (28 trang)

Bài giảng Ứng dụng Trí tuệ nhân tạo nghiên cứu liên quan định lượng giữa cấu trúc với tác dụng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.25 MB, 28 trang )

QSAR Studies Using Artificial Intelligence

ÁP DỤNG TRÍ TUỆ NHÂN TẠO
NGHIÊN CỨU LIÊN QUAN ĐỊNH LƯỢNG
GIỮA CẤU TRÚC VỚI TÁC DỤNG
GSTS Đặng Văn Giáp
Tháng 4/ 2023

1. Trí tuệ nhân tạo và áp dụng
2. Liên quan cấu trúc-tác dụng (QSAR)
3. Tóm tắt hai nghiên cứu QSAR:
 Thăm dị phương pháp và thơng số
 QSAR của nhóm Pyrazolopyridin
 QSAR của nhóm Benzofuran
4. Một số ý kiến thay lời kết luận

1


TRÍ TUỆ NHÂN TẠO
VÀ ÁP DỤNG

Định nghĩa “Trí tuệ nhân tạo”
Trí tuệ nhân tạo (AI: Artificial Intelligence): là sự biểu lộ trí tuệ bởi
máy tính mà có thể mơ phỏng thái độ hay kiểu suy nghĩ của bộ
não con người nhằm giải quyết các vấn đề cụ thể.

D
AI

C


B
A

Sáng suốt (Wisdom)
Tri thức (Knowledge)

Sâu (Deep)
Nông (Shallow)

Thông tin (Information)
Dữ liệu (Data)

2


Minh họa về nền tảng và áp dụng AI
Xác lập quy luật
Tối ưu hóa
Máy học

Tự động hóa

Nhận dạng hình ảnh

Khám phá tri thức
Ra quyết định

Ngôn ngữ

Tâm lý


Kỹ thuật

Triết

Sinh

Máy

Các lãnh vực áp dụng AI*
1. Thương mại điện tử (e-Commerce)
2. Giáo dục (Education)
3. Đời sống (Lifestyle)
4. Định hướng/ định vị (Navigation)
5. Người máy (Robotics)

h
n bện
á
o
đ
Chẩn cá thể
trị
Điều
thuốc h
á
h
p
Khám n bệnh dịc
á

D ự đo

6. Nguồn nhân lực (Human Resource)
7. Nghiên cứu thuốc & CCSK (Pharmaceutical & Healthcare Research)
8. Nơng nghiệp (Agriculture)
9. Trị chơi (Gaming)

* Avijeet Biswal, 2023)

3


10. Xe ô tô (Automobiles)
11.Truyền thông đại chúng (Social Media)
12. Tiếp thị (Marketing)
13. Chăm sóc khách hàng trực tuyến (Chatbots)
14. Tài chánh (Finance)
15. Thiên văn học (Astronomy)
16. Bảo toàn dữ liệu (Data Security)
17. Vận chuyển (Transport)
18. Kỹ nghệ máy tự động (Automotive Industry)

Các lãnh vực công nghệ thông minh
Công nghệ
thông minh

Mạng thần kinh

* Fuzzy logic
** Neurofuzzy logic


Thuật toán
di truyền

Hệ thống mờ
Logic mờ*
Logic mờ - thần kinh**

4


Áp dụng AI trong ngành Dược
Đối với lãnh vực Bào chế, Chiết xuất dược liệu
 Phân tích liên quan nhân - quả (áp dụng logic mờ - thần kinh)
 thành phần cơng thức – tính chất chế phẩm
 điều kiện chiết xuất – tính chất sản phẩm
 Tối ưu hóa cơng thức/ hoặc quy trình (áp dụng mạng thần kinh
& thuật tốn di truyền)
Đối với lãnh vực Hóa dược
Áp dụng mạng thần kinh, máy học...
 Thiết lập liên quan cấu trúc – tác dụng (QSAR)
 Dự đoán tác dụng/ độc tính (CADD)

Ngun tắc tối ưu hóa cơng thức
Mơ hình hóa (Modeling)*
Dự đốn
(What-if-preduction)*

Cơng thức
Thành phần

Điều kiện

Tối ưu hóa (Optimization)**

* Mạng thần kinh
** Thuật tốn di truyền

Sản phẩm
Tính chất
Giá thành

Áp dụng trong Bào chế:
 Tối ưu hóa cơng thức
 Dự đốn tình huống xấu

5


Ngun tắc xác lập mơ hình QSAR
Mơ hình hóa (Modeling)*

Cấu trúc

Dự đốn
(What-if-preduction)*

Tác dụng sinh học

Thơng số cấu trúc


* Mạng thần kinh
Mạng thần kinh + Logic mờ

Tác dụng

Áp dụng trong Hóa dược:
 Xác lập mơ hình QSAR
 Dự đốn tác dụng/ độc tính

Đầu vào cho nghiên cứu QSAR
Thơng số cấu trúc

 Hóa lượng tử
 Lý hóa
 Lập thể

Tác dụng sinh học

In vitro
In vivo
In situ

MIC
MBC
IC50
EC50
ED50
SD50
LD50
TI (LD50/ ED50)


6


Cấu trúc mạng thần kinh nhân tạo
y1

x1

y2

x2

y3

x3
Lớp vào (I)
I(a)-HL(b)-O(c):
- a = số nút của lớp vào
- b = số nút của lớp ẩn
- c = số nút của lớp ra

y4

Lớp ẩn (HL)
Lớp ra (O)

* MLP: Multi-layer Perceptron Networks

Trọng số và hàm truyền

W1

NET
= XW

W2
X

Y

W3
F
MLP

X: Đầu vào
Y: Đầu ra
W: Trọng số
F: Hàm truyền (tuyến tính, sigmoid hay tanh)

7


Đánh giá mơ hình QSAR
Dữ liệu đầy đủ
Chọn
Nhóm luyện
R2 luyện

R2




 1 




n


i1

Đánh giá chéo


 yˆ i ) 2 
 x 100

( y i  y )2 


 (y
i1
n

Nhóm thử
R2 thử

i


R2 luyện: tính tương thích
R2 thử: khả năng dự đốn

LIÊN QUAN CẤU TRÚC - TÁC DỤNG
(QSAR)

8


Ý nghĩa và tầm quan trọng của QSAR
 Mối liên quan định lượng giữa cấu trúc với tác dụng (QSAR): mối
liên quan giữa sự sắp xếp cấu trúc phân tử với các tính chất như
sinh hóa, vật lý, dược học, sinh học...
 Hoạt tính sinh học = f (tham số lý hóa) (Puzyn & Leszczynski, 2012).
 Sau khi nghiên cứu QSAR của một nhóm hoạt chất, có thể dự
đốn tác dụng hay cơ chế tác dụng của hợp chất cùng nhóm.
 Sự dự đốn chính xác về cấu trúc phân tử có thể giảm thời gian
và chi phí tổng hợp so với phương pháp dị dẫm.
 Sự dự đốn chính xác về tác dụng có thể tiết kiệm một số thử
nghiệm về tác dụng, giảm sự ảnh hưởng đến môi trường.

Minh họa tổng quát về QSAR
QSAR là tổng hòa của 3 mặt liên quan:
 Liên quan cấu trúc - tính chất
SPR: Structure-Property Relationship
 Liên quan tính chất - tác dụng
PAR: Property-Activity Relationship
 Liên quan cấu trúc - tác dụng
SAR: Structure-Activity Relationship


Tính
chất

Cấu
trúc

Tác
dụng

9


QSAR và thiết kế phân tử thuốc
CSDL
thực nghiệm

Dữ liệu
lý thuyết

QSAR
Thiết kế
phân tử

in vivo

Thư viện
đại phân tử

in vitro


Tổng hợp
Sàng lọc ảo

Thuốc có thể từ nguồn máy tính
Nguồn gốc

Tổng hợp

Dược liệu

Sinh học

Máy tính

Nghiên cứu
& Phát triển

In vitro
Thất bại

In vivo
Thử lâm sàng

Thất bại

Thất bại

Thị trường

10



Thí dụ về thuốc có nguồn gốc máy tính
Thuốc

Cơng dụng

Ritonavir

Kháng HIV

Oseltamivir

Trị cúm

Dorzolamide

Trị glaucoma và
chứng tăng nhãn áp

Epalrestat

Trị rối loạn hệ thần kinh
do bệnh tiểu đường

Isoniazid

Kháng lao

Các mức trình bày/ mơ phỏng cấu trúc

Cấu trúc tương tác với môi trường
Cấu trúc lập thể - điện tử
Cấu trúc lập thể - cơ động
Khối cấu trúc
Cấu trúc 3 chiều
Cấu trúc 2 chiều
Công thức hóa học

11


Lập thể
Steric

Hằng số Hammett (,+,-)
Hằng số ion hóa (pka,pka)

Tham số Taft (Es)
Thể tích phân tử (MV)
Độ khúc xạ phân tử (MR)

Hóa lượng tử Khơng gian
Spatial
Quantum chemical

Chỉ số về bóng

Điện tử
Electronic


Điện tích ngun tử (Q)
Năng lượng (EHOMO, ELUMO)

Lý hóa
Physicochemical
Hệ số phân bố (log P)
Tham số hịa tan (log S)

Các thơng số cấu trúc cho QSAR

Cơ sở Hóa lượng tử điện tốn
 Mơ hình sóng về ngun tử, dựa
trên phương trình Schrưdinger:

Ψ(x): hàm số sóng
E: năng lượng
Ĥ: tốn tử Hamilton

 Là cơ sở của các phương pháp
bán nghiệm (trong QSAR) như
AM1, PM3… hay tiên nghiệm.

Thời gian tính

ĤΨ(x) = EΨ(x)

 TNDO
 AM1, PM3
 MNDO
 MINDO3

 INDO
 CNDO
 Extended Hϋckel
Độ chính xác

12


Các mức độ nghiên cứu QSAR
1D- QSAR:
 Hằng số phân ly (pKa)
 Hệ số phân bố (log P)
2D- QSAR:
 Điện tích nguyên tử
 Độ khúc xạ phân tử
 Momen lưỡng cực
3D- QSAR:
Các thông số WHIM*

* WHIM (weighted holistic
invariant molecular): thông
tin cấu trúc 3D về kích
thước, hình dạng, tính đối
xứng và phân bố điện tử.

4D- QSAR:
# 3D-QSAR nhưng khảo sát
nhiều cấu dạng của ligand
5D- QSAR:
Khảo sát các cấu dạng của

ligand gắn kết với receptor
6D- QSAR:
# 5D-QSAR song có thêm sự
động học phân tử của phức
ligand-receptor

Trong thực tế, cơ bản là
2D-QSAR và 3D-QSAR!

13


Các bước xác lập 2D-QSAR
Chuẩn bị
cơ sở dữ liệu

1

Tối thiểu hóa
năng lượng

2

6

Loại giá trị
ngoại lệ

Tính tốn
thơng số cấu trúc


3

7

Xác lập
mơ hình QSAR

8

Đánh giá
mơ hình QSAR

Chon nhóm thử
và nhóm luyện

5

4

Chọn lọc
thơng số

Các phương pháp xác lập QSAR
Phương pháp
tốn thống kê

Thí dụ: Hồi quy tuyến tính đa tham số

Phương pháp

phân loại

Thí dụ: Hồi quy logistic

Phương pháp
thơng minh

Thí dụ:
 Mạng thần kinh (Neural networks)
 Mạng thần kinh mờ (Fuzzy networks)
 Máy học (Machine learning)

14


TÓM TẮT HAI NGHIÊN CỨU
QSAR (2022)
Trần Mỹ Ngọc, Đặng Thị Thanh Nhàn
Chung Khang Kiệt, Đặng Văn Giáp

THĂM DÒ
PHƯƠNG PHÁP VÀ THÔNG SỐ

15


Thăm dị các thơng số cấu trúc (MOE)
206

Sàng lọc chủ quan

(loại thông số quá xa lạ)
Sàng lọc bởi Phasolpro RD
(dựa trên R2 luyện > 90%)

44

Molecular Operating
Environment (MOE)
(Chemical Computing
Group Inc., 2015)

h_logP, logS
ICM
SlogP_VSA1
SMR_VSA2

5

Thăm dị phương pháp bán nghiệm
HyperChem 8.0

Diện tích ngun tử/ Pyrazolopiridin
N1

C2

C3

...


N7

N8

C9

AM1 (n = 10)
PM3 (n = 10)
Kết quả phân tích Anova 2 yếu tố (có lặp): Điện tích ngun tử
được tính tốn bởi hai phương pháp bán nghiệm AM1 và PM3
khác nhau có ý nghĩa thống kê (p < 0,05).

16


Chọn các phần mềm chuyên dụng
HyperChem 8.0 (Hypercube, Inc., 2008)
 Xây dựng và tối ưu hóa cấu trúc 3D: MM+
 Tính điện tích nguyên tử: AM1, PM3
 Tính tính chất lý hóa
Phasolpro RD 1.5 (Khoa Dược, 2019)
 Mạng thần kinh (nhóm thử: chọn thủ cơng, n = 2)
 Thiếp lập QSAR và dự đoán tác dụng
Discovery studio visualiser 21.1.0: phân tích sự gắn kết

QSAR CỦA
NHĨM PYRAZOLOPYRIDIN

17



Nhóm dẫn xuất Pyrazolopyridin









Khung phân tử: Pyrazolo[3,4-b]pyridin
Tác dụng in vitro:
EC50, EC50b: lần lượt là hoạt tính trên EV-A71 và EV-D68
CC50: Độc tính trên tế bào ung thư cơ vân của người
Mục tiêu nghiên cứu QSAR:
R2
R
4
Có QSAR với tác dụng hay độc tính?
4
3
3a
Các vị trí nào trên khung có liên quan?
Thiết kế phân tử và dự đoán tác dụng?
2
1

7a
7


R3

5
6

R1

Đặc điểm các mơ hình QSAR (AM1)
Mơ hình

Nhóm thử

R2 luyện

R2 thử

QSAR1
QSAR2
QSAR3
QSAR4
QSAR5
QSAR6
QSAR7
QSAR8
QSAR9
QSAR10
QSAR11
QSAR12
QSAR13

QSAR14
QSAR15
QSAR16
QSAR17
QSAR18

1,4
23,24
21,23
19,22
15,24
12,13
10,11
9,2
8,18
8,24
7,14
7,2
6,19
5,6
4,14
2,25
2,10
1,19

90,9166
95,4389
97,3518
96,3890
92,6442

94,0926
91,2065
90,0001
92,7792
90,0761
96,5839
91,7763
93,6567
90,0552
90,3135
90,9075
97,9519
90,1483

77,5415
92,9125
75,0083
97,5580
92,7073
83,7161
75,8756
86,6187
83,9767
82,9309
96,5178
99,9963
75,2245
90,3357
98,9806
85,2643

88,2714
95,0620

EC50
x
x
x
x
x
x
x
x
x
x
x

Tác dụng
CC50

EC50b

x
x

x

x

x
x

x

18


Đặc điểm các mơ hình QSAR (PM3)
Mơ hình

Nhóm thử

R2 luyện

R2 thử

QSAR'1
QSAR'2
QSAR'3
QSAR'4
QSAR'5
QSAR'6
QSAR'7
QSAR'8
QSAR'9
QSAR'10
QSAR'11
QSAR'12
QSAR'13
QSAR'14
QSAR'15
QSAR'16

QSAR'17
QSAR'18

1,14
5,17
6,8
10,12
14,21
15,24
16,18
16,19
18,20
19,25
20,22
20,23
22,23
1,13
4,10
8,23
9,13
12,17

90,5442
91,1141
91,3240
92,4790
94,6071
91,2000
98,0174
92,0268

90,0849
99,2939
90,0601
98,8457
90,8905
91,5189
94,9466
92,6889
93,2306
91,5245

92,2267
88,1302
89,0661
81,0174
75,1594
75,0056
96,4397
90,6334
87,0963
75,0564
81,0376
75,0054
97,2458
83,3328
82,3205
75,3680
94,9925
94,9448


EC50
x
x
x
x
x
x

x
x
x

Tác dụng
CC50
x

EC50b

x

x
x
x
x
x
x
x

Đánh giá các mơ hình QSAR
100


Giá trị R 2

80
60
40
20

Nhìn chung trong 18 QSAR:
- R2 luyện > 90%: tính tương thích tốt
- R2 thử > 70%: khả năng dự đốn khá

R2
R2
R2
R2

luyện AM 1
luyện PM 3
thử AM 1
thử PM 3

0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

Mơ hình QSAR

19



Các vị trí liên quan đến tác dụng (AM1)
Mơ hình
QSAR1
QSAR2
QSAR3
QSAR4
QSAR5
QSAR6
QSAR7
QSAR8
QSAR9
QSAR10
QSAR11
QSAR12
QSAR13
QSAR14
QSAR15
QSAR16
QSAR17
QSAR18

N1
x
x

N2

C3

C3 a


C4

C5

C6

x

N7

C7 a

x

x

x
x
x

x
x
x
x
x

x

x

x
x

x
x
x

x

x

x

x
x
x
x
x
x

x
x

x

x

x

EC50

CC50

Các vị trí liên quan đến tác dụng (PM3)
Mơ hình
QSAR1
QSAR2
QSAR3
QSAR4
QSAR5
QSAR6
QSAR7
QSAR8
QSAR9
QSAR10
QSAR11
QSAR12
QSAR13
QSAR14
QSAR15
QSAR16
QSAR17
QSAR18

N1
x

N2

C3


C3 a

C4

x

x
x
x

x
x

C5

C6

N7

C7 a

x
x

x

x
x

x

x
x
x
x

x

x

x
x

x

x
x
x
x
x

EC50
CC50

20



×