Institut de la Francophonie pour l’Informatique
M´
emoire de fin d’´
etudes pour l’obtention du diplˆ
ome
de Master II Informatique
Option : R´
eseaux et Syst`
emes Communicants
D´
eveloppement d’un portail web pour le criblage
virtuel sur la grille de calcul
Promotion 17-RSC
R´
edig´
e par :
Louacheni Farida
Sous l’encadrement de :
Dr.Nguyen Hong Quang
Dr.Doan Trung Tung
Dr.Bui The Quang
20 novembre 2014
Remerciements
Ce travail de stage de fin d’´etudes a ´et´e effectu´e au sein du Laboratoire MSI
`a l’Institut de la Francophonie pour l’Informatique, sous la direction du Docteur
Nguyen Hong Quang, auquel je tiens `a exprimer ma profonde gratitude, et ma
vive reconnaissance pour m’avoir confi´e ce sujet.
J’adresse mes plus vifs remerciements au Dr.Doan Tung Tung et Dr.Quang
Bui The de m’avoir encadr´e et prodigu´e maints conseils. Je suis tr`es reconnaissante
`a tous les enseignants de l’IFI pour la qualit´e de l’enseignement qu’ils nous ont
offerts.
Ma reconnaissance infinie `
a mes tr`es chers parents qui m’ont enseign´e la pers´ev´erance dans mes ´etudes, qui m’ont toujours ´et´e d’un grand secours par leur soutient
et leur encouragement, ainsi mes adorables soeurs et mon tr`es cher fr`ere et mon ami
Yacine-Malek.
Enfin, un immense merci `
a mes amis qui m’ont toujours soutenue.
i
R´
esum´
e
` l’heure actuelle, la grille de calcul est en train de devenir une force motrice maA
jeure pour de nouvelles approches pour la collaboration de science `a grande ´echelle.
Plusieurs programmes nationaux et internationaux eScience ont favoris´e la collaboration entre chercheurs de diff´erents domaines scientifiques.
Dans le domaine biom´edicale, plus pr´ecisement dans la recherche de nouveaux
m´edicaments pour les maladies infectieuses. La grille de calcul a initi´e plusieurs
projets `
a grande ´echelle dans les approches de criblage de m´edicaments in-silico.
Le projet WISDOM a ´et´e parmi les premiers projets dans le domaine public qui
a fait usage de la grille tout en permettant le docking in-silico pour simuler l’interaction de m´edicaments potentiels avec des prot´eines cibles. Le docking in-silico
est la premi`ere ´etape dans le processus de criblage virtuel, il est consid´er´e comme
l’une des approches les plus prometteuses afin acc´el´erer et de r´eduire les coˆ
uts de
d´eveloppement de nouveaux m´edicaments pour les maladies n´eglig´ees.
Bien que, de nombreuses applications ont ´et´e d´evelopp´ees pour permettre le
criblage virtuel dont le but d’acc´el´erer le processus de recherche des m´edicaments.
Une barri`ere critique de ces programmes est leur complexit´e en terme d’utilisation
et de pr´evoir des proc´edures concises pour les utilisateurs r´eguliers.
L’objectif de ce travail est de d´evelopper un portail web conviviale pour effectuer
le criblage virtuel, et de d´eployer un tr`es grand nombre de docking sur la grille
de calcul. Pour atteindre ce but, la grille de calcul a ´et´e utilis´e pour acc´el´erer la
recherche et la d´ecouverte de nouveaux m´edicaments in-silico et traitements pour
les maladies infectieuses.
ii
Abstract
Grid computing is currently developing into a major driving force for new approaches towards collaborative large scale science. Several national and international eScience programs have fostered collaboration between researchers from different scientific domains.
In the biomedical field, more precisely in drug discovery for infectious diseases.
Grid computing has initiated several projects on large scale in-silico drug screening
approaches. The project WISDOM was amongst the first projects in the public domain that made use of grid enabled in-silico docking to simulate the interaction of
potential drugs with target proteins. In-silico docking is the first step in the virtual
screening process, which is one of the most promising approaches to speed-up and
to reduce the costs of the development of new drugs.
Although, many applications have been developed to allow in-silico screening,
but a critical barrier of these programs is the lack of a suitable, easy, simple way to
use and to provide concise procedures for regular users.
The main goal of this work is to develop a user-friendly web portal to perform
virtual screening and to deploy a large number of docking on grid computing. To
achieve this goal, the grid computing was used to accelerate research and discovery
of new drugs in-silico for infectious diseases.
iii
Table des mati`
eres
1 Introduction
1.1 Probl`ematique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2 Notre contribution . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.3 Plan du m´emoire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
´
2 Etat
de l’art
2.1 Conception de m´edicaments in-silico . . . . . . . . . . . . .
2.2 Criblage virtuel ”Vitual Screening” . . . . . . . . . . . . . .
2.2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . .
2.2.2 D´ecouverte de nouveaux m´edicaments avec le criblage
2.2.3 Les diff´erentes strat´egies du criblage virtuel . . . . .
2.2.4 Criblage virtuel a` haut d´ebit . . . . . . . . . . . . .
2.2.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . .
2.3 Docking . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . .
2.3.2 Approches du docking . . . . . . . . . . . . . . . . .
2.3.3 Principe du docking . . . . . . . . . . . . . . . . . .
2.3.4 Outils de Docking . . . . . . . . . . . . . . . . . . . .
2.3.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . .
2.4 AutoDock . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.4.1 Docking avec AutoDock . . . . . . . . . . . . . . . .
2.4.2 Conclusion . . . . . . . . . . . . . . . . . . . . . . . .
2.5 Grille de calcul . . . . . . . . . . . . . . . . . . . . . . . . .
2.5.1 Introduction . . . . . . . . . . . . . . . . . . . . . . .
2.5.2 Grille de calcul . . . . . . . . . . . . . . . . . . . . .
2.5.3 Organisation virtuelle . . . . . . . . . . . . . . . . . .
2.5.4 Architecture g´en´erale d’une grille de calcul . . . . . .
2.5.5 Composants de la grille . . . . . . . . . . . . . . . . .
2.5.6 Fonctionnement de la grille . . . . . . . . . . . . . .
2.5.7 Avantages & D´efis de la grille . . . . . . . . . . . . .
2.5.8 Conclusion . . . . . . . . . . . . . . . . . . . . . . . .
2.6 Portail GVSS . . . . . . . . . . . . . . . . . . . . . . . . . .
2.6.1 Introduction . . . . . . . . . . . . . . . . . . . . . . .
2.6.2 La plate-forme GAP . . . . . . . . . . . . . . . . . .
2.6.3 Architecture GVSS . . . . . . . . . . . . . . . . . . .
2.6.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . .
2.7 Plate-formes utilis´es . . . . . . . . . . . . . . . . . . . . . .
2.7.1 WISDOM . . . . . . . . . . . . . . . . . . . . . . . .
2.7.2 DIRAC . . . . . . . . . . . . . . . . . . . . . . . . .
i
. . . .
. . . .
. . . .
virtuel
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1
1
2
2
3
3
4
4
6
6
7
7
9
9
10
11
12
13
14
15
17
18
18
18
19
20
21
22
24
24
26
26
27
28
29
30
30
33
3 Impl´
ementation
3.1 Architecture du syst`eme propos´ee
3.2 Outils utilis´es . . . . . . . . . . .
3.3 Conception du portail . . . . . .
3.4 D´eveloppement du portail du web
3.4.1 Les services web . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
37
37
38
41
48
48
4 Exp´
erimentation & R´
esultats
52
4.1 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
5 Conclusion & perspective
64
ii
Table des figures
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
Processus de conception de m´edicaments in-silico [11] . .
Criblage Virtuel in-silico . . . . . . . . . . . . . . . . . .
Docking prot´eine-ligand . . . . . . . . . . . . . . . . . .
´
Etapes
du Docking . . . . . . . . . . . . . . . . . . . . .
Illustration de docking/scoring [6] . . . . . . . . . . . . .
Comparaison des programmes de docking [16] . . . . . .
Proc´edures de docking avec AutoDock . . . . . . . . . .
La grille de calcul . . . . . . . . . . . . . . . . . . . . . .
Couches de la grille de calcul . . . . . . . . . . . . . . . .
Architecture de grille de calcul [10] . . . . . . . . . . . .
Portail GVSS . . . . . . . . . . . . . . . . . . . . . . . .
Architecture Service de criblage virtuel GAP (GVSS) [7]
Architecture WPE [9] . . . . . . . . . . . . . . . . . . . .
Intergiciel DIRAC . . . . . . . . . . . . . . . . . . . . . .
Architecture DIRAC [20] . . . . . . . . . . . . . . . . . .
Architecture du syst`eme propos´ee . . . . . . . . . . . . .
Workflow soumission de job sur la grille avec Taverna . .
Diagramme de classe du portail web . . . . . . . . . . . .
Cas d’utilisation pour le Ligand . . . . . . . . . . . . . .
Cas d’utilisation pour la Prot´eine . . . . . . . . . . . . .
Cas d’utilisation pour les param`etres de grille . . . . . .
Cas d’utilisation pour le docking . . . . . . . . . . . . . .
Cas d’utilisation pour l’administrateur du portail . . . .
Mod`ele MVC . . . . . . . . . . . . . . . . . . . . . . . .
Description des services web impl´ement´es . . . . . . . . .
Workflow des services web du portail . . . . . . . . . . .
Interface d’accueil du portail web . . . . . . . . . . . . .
Interface de cr´eation d’un nouveau compte . . . . . . . .
Interface d’authentification . . . . . . . . . . . . . . . . .
Interface de gestion des utilisateurs . . . . . . . . . . . .
Interface d’ajout d’un nouveau Ligand . . . . . . . . . .
Interface de liste des Ligands disponibles . . . . . . . . .
Interface de gestion des prot´eines . . . . . . . . . . . . .
Interface de modification d’une prot´eine . . . . . . . . .
Interface d’ajout de fichier de param`etres de la grille . .
Interface d’ajout d’un nouveau projet de docking . . . .
V´erification d’ajout du nouveau projet . . . . . . . . . .
Soumission de job de docking . . . . . . . . . . . . . . .
T´el´echargement du r´esultat de docking . . . . . . . . . .
iii
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4
5
10
11
12
13
15
19
21
23
27
29
31
33
35
38
39
42
43
44
45
46
47
48
49
51
52
53
53
54
54
55
55
56
56
57
57
58
58
40
41
42
43
44
45
46
47
Fichier log de docking ”dlg” . . . . . . . . . . . . . . .
Soumission du projet de docking ProjectZinc1OKE . .
T´el´echargement du r´esultat de docking . . . . . . . . .
Enregistrement du r´esultat du job sur la grille de calcul
Les fichiers dlg & glg du docking . . . . . . . . . . . . .
Les fichiers log de docking et de la grille dlg & glg . . .
T´el´echargement du r´esultat des jobs . . . . . . . . . .
Les fichiers des jobs soumis en parall`ele . . . . . . . . .
iv
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
59
59
60
60
60
61
62
63
1
Introduction
Par le pass´e, un grand nombre de m´edicaments ont ´et´e d´ecouverts tout simplement
grˆace a` l’identification de principes actifs extraits de substances naturelles historiquement
utilis´ees dans la m´edecine non-conventionnelle, ou mˆeme par hasard, ce qu’on nomme
”s´erendipit´e”. Mais plus le nombre de m´edicaments connus augmente et plus les probabilit´es de faire une telle d´ecouverte sont faibles. Par la suite, les avanc´ees dans le domaine
de la synth`ese chimique ont conduit `a une d´emarche de recherche syst´ematique permettant l’´elaboration de nouveaux m´edicaments de plus grande efficacit´e. La d´ecouverte de
nouveaux m´edicaments ”drug discovery” est un processus extrˆemement long et fastidieux,
12 `a 15 ans peuvent s’´ecouler entre la d´ecouverte de la mol´ecule et la mise a` disposition
du m´edicament aupr`es des patients. Les nouvelles m´ethodes permettant la d´ecouverte de
nouveaux m´edicaments se doivent donc d’innover afin de mettre en ´evidence des mol´ecules
encore inconnues ayant un certain potentiel d’activit´e sur des cibles biologiques connues
[Davis et al,2003]. Les outils mis en place doivent ˆetre capables de guider les chimistes
m´edicinaux dans le choix des mol´ecules `a cribler et a` synth´etiser.
Les strat´egies de criblage virtuel, ou in-silico, sont donc depuis quelques ann´ees employ´ees
en tant qu’alternative ou de fa¸con compl´ementaire. Ces techniques sont en g´en´eral assez
faciles `a mettre en place, pour un coˆ
ut bien moindre que les criblages exp´erimentaux. De
plus, l’´evolution technologique constante de ces derni`eres d´ecennies a permis d’acc´el´erer
consid´erablement le temps de calcul n´ecessaire a` la simulation de syst`emes complexes ou
de bases de donn´ees de plusieurs milliers de mol´ecules. Le criblage virtuel est donc aujourd’hui employ´e dans de nombreux projets, afin de s´electionner, au sein de vastes librairies
de mol´ecules, un nombre restreint de compos´es a` cribler exp´erimentalement.
1.1
Probl`
ematique
L’axe principal de ce travail se situe dans le domaine de bio-informatique. Plus pr´ecisement
dans la recherche et la d´ecouverte de nouveaux m´edicaments pour les maladies dangereuses
comme : HIV, Ebola, fi`evre de dengue,..., par le biais de techniques informatiques. Le d´efi
se situe au niveau de la conception de nouveaux m´edicaments, qui est un processus long et
tr`es on´ereux, et au niveau du d´eployement d’un grand nombre de docking sur la grille de
calcul. Cependant, les outils existants sont en manque de moyen simple pour fournir des
proc´edures concises pour les utilisateurs r´eguliers (biologistes, chimistes, etc) afin d’arranger les ressources pour mener un amarrage mol´eculaires massif. Par cons´equent, ces
derniers rencontrent plusieurs difficult´es et probl`emes lors de l’utilisation de ces applications, ce qui entraˆıne une grande perte de temps et d’argent afin d’acc´el´erer la recherche
de nouveaux traitements pour les maladies n´eglig´ees.
1
1.2
Notre contribution
Notre contribution repose sur le d´eveloppement d’un portail web pour le criblage virtuel en utilisant la grille de calcul pour faciliter la d´ecouverte et la recherche de nouveaux m´edicaments pour les maladies graves et n´eglig´ees. Nous proposons une interface
conviviale et facile a` utiliser pour les utilisateurs non-exp´eriment´es (chimistes, biologistes,
m´edecins....) en informatique et en grille de calcul. Afin de favoriser l’int´erop´erabilit´e
entre le portail web et les services de grille de calcul, nous proposons une architecture qui
permettra une analyse et un traitement fiable des requˆetes des utilisateurs finaux.
1.3
Plan du m´
emoire
Ce m´emoire sera organis´e en 4 parties pr´esentant respectivement : l’´etat de l’art, impl´ementation & conception, d´emonstration & r´esultats, conclusion & perspectives. Dans la premi`ere
partie, un ´etat de l’art est pr´esent´e qui passe en revue le criblage virtuel, le docking, suivie
de l’outil AutoDock. Ensuite nous abordons la technologie de grille de calcul, le portail
GVSS et les plate-formes WISDOM qui est d´eploy´ee dans la d´ecouverte de nouveaux
m´edicaments et DIRAC. La deuxi`eme partie du m´emoire pr´esente l’impl´ementation du
portail, qui se focalisera sur l’architecture propos´ee, la conception et l’impl´ementation du
portail. L’avant derni`ere partie porte sur la d´emonstration du portail muni des r´esultats
` la fin, ce m´emoire ce termine par une conclusion g´en´erale et quelques perspecobtenus. A
tives.
2
´
Etat
de l’art
2
Aujourd’hui, les projets scientifiques produisent et analysent une quantit´e d’information
sans pr´ec´edent, ce qui n´ecessite une puissance de calcul jamais vue auparavant. Les leaders dans ce d´efi de traitement de donn´ees sont les exp´eriences du LHC au CERN, qui
accumulent des dizaines de p´etaoctets de donn´es chaque ann´ee. Cependant, il se r´ev`ele
que d’autres domaines scientifiques s’approchent aussi de ces limites. Par cons´equent les
utilisateurs devons exploiter les ressources disponibles a` travers le monde de mani`ere ais´ee
et facile. Plusieurs travaux existent qui illustrent le d´eveloppement et le d´eploiement des
applications sur l’infrastructure de la grille de calcul, et qui ont montr´e une utilisation
efficace des ressources de cette derni`ere. Les utilisateurs sont rarement experts en informatique et en grille de calcul. Pour cette raison ils ont besoin d’un moyen qui facilite l’acc`es
aux ressources de la grille dont ils ont besoins d’un cot´e, et qui cache la complexit´e de l’infrastructure sous-jacente de l’autre cot´e. Dans cette partie, nous allons d´ecrire en d´etail la
technique du criblage virtuel ainsi l’amarrage ”Docking”, le principe de la grille de calcul
et son rˆole dans la d´ecouverte de nouveaux m´edicaments pour les maladies n´egilg´ees et
dangereuses. Puis, nous pr´esentons le portail GVSS et la plate-forme WISDOM d´eployer
pour acc´eder aux services de grille de calcul et DIRAC.
• Nomenclature
– Ligand, une structure, g´en´eralement une petite mol´ecule qui se lie a` un site
de liaison.
– R´
ecepteur, une structure, g´en´eralement une prot´eine qui contient le site de
liaison actif.
– Site de liaison, zones de prot´eines actives qui interagissent physiquement avec
le ligand pour la formation d’un compos´e.
2.1
Conception de m´
edicaments in-silico
La conception de m´edicaments assist´ee par ordinateur emploie la chimie computationnelle
pour la d´ecouverte, l’am´elioration et l’´etude de m´edicaments et mol´ecules biologiquement
actives. En effet, l’outil informatique aide la conception de m´edicaments `a des ´etapes
sp´ecifiques du processus :
• Dans l’identification des compos´es potentiellement th´erapeutiques, en utilisant le
criblage virtuel ”virtual screening”.
• Dans le processus d’optimisation de l’affinit´e et de la s´electivit´e des mol`ecules potentielles vers les tˆetes de s´erie ”lead” ou appel´es encore prototypes.
• Dans le processus d’optimisation du lead de s´erie par rapport aux propri´et´es pharmacologiques recherch´ees tout en maintenant une bonne affinit´e de cette mol´ecule.
3
Toutes ces ´etapes d’intervention de l’outil informatique sont pr´esent´ees dans le sch´ema
r´ecapitulatif suivant.
Figure 1 – Processus de conception de m´edicaments in-silico [11]
2.2
Criblage virtuel ”Vitual Screening”
L’identification d’une cible pharmaceutique peut se faire par diff´erentes m´ethodes. Une
fois la cible identifi´ee diagnostiqu´ee, il faut tester un ensemble de mol´ecules candidates sur
cette cible, selon un processus qualifi´e de screening. On distingue deux types de criblage :
le criblage virtuel, qui est r´ealis´e in-silico , tout en permettant la r´ealisation de mani`ere
rapide et `a moindre coˆ
ut des pr´edictions de l’activit´e des mol´ecules. Et le criblage r´eel a`
haut d´ebit, quand `a lui il permet de tester rapidement ”in-vitro” l’activit´e de compos´es
biologiques, et cela est limit´e par le nombre de compos´es a` tester en un temps raisonnable
et par le coˆ
ut des tests.
2.2.1
Introduction
Le terme criblage virtuel ou ”Virtual Screening” regroupe un ensemble de techniques
computationnelles ayant pour objectif l’exploration de bases de compos´es `a la recherche
de nouvelles mol´ecules. Une analogie souvent utilis´ee compare ces techniques a` des filtres
qui permettraient de constituer des ensembles de mol´ecules partageant certaines propri´et´es
et de s´electionner les plus susceptibles d’interagir avec une cible donn´ee [13].
Aujourd’hui, le criblage virtuel est largement utilis´e pour identifier de nouvelles substances
bio-active et pour pr´edire la liaison d’une grande base de donn´ee de ligands a` une cible
particuli`ere, dans le but d’identifier les compos´es les plus prometteurs. Il s’agit d’une
m´ethode qui vise `a identifier les petites mol´ecules pour l’interaction avec les sites de
prot´eines cibles afin de faire des analyses et des traitements ult´erieures. Plus pr´ecisement,
le criblage virtuel est d´efini comme l’´evaluation automatique de tr`es grandes banques de
compos´es a` l’aide de programmes informatiques, il se r´ef´ere `a une s´erie in-silico, qui est une
4
technique effectuer `a base d’ordinateur ou par l’interm´ediaire des mod`eles math´ematiques
et des simulations informatique, qui aide dans la d´ecouverte de nouveaux m´edicaments
et de d´eterminer de nouveaux compos´es les plus susceptibles pour se lier `a une mol´ecule
cible d’une structure 3D connue [2].
Figure 2 – Criblage Virtuel in-silico
(http: // serimedis. inserm. fr )
Compte tenu de l’augmentation rapide du nombre de prot´eines, le criblage virtuel continue
a` croitre comme une m´ethode efficace pour la d´ecouverte de nouveaux inhibiteurs et de
nouveaux m´edicaments. Il est utilis´e dans les premi`eres phases du d´eveloppement de
nouveaux m´edicaments. Il a pour but de s´electionner au sein de chimioth`eques vari`ees des
ensembles r´eduits de mol´ecules dont le potentiel d’activit´e envers la cible th´erapeutique
vis´ee est sup´erieur `a celui des autres mol´ecules [Enyedy Egan, 2008], c-`a-d, les mol´ecules
qui peuvent influencer l’activit´e de la prot´eine cible. Dans ce cas, le criblage a pour
objectif l’identification des motifs structuraux essentiels dans la liaison ligand-r´ecepteur,
et la discrimination des meilleurs compos´es au sein de chimioth`eques orient´ees comprenant
des mol´ecules appartenant a` une mˆeme s´erie.
Le criblage virtuel est tr`es utile et consid´er´e comme un outil efficace pour acc´el´erer la
d´ecouverte de nouveaux traitements et la recherche des biblioth`eques de petites mol´ecules
afin d’identifier les structures qui sont les plus susceptibles de se lier `a une cible de
m´edicament, g´en´eralement un r´ecepteur de prot´eine [14]. Il d´epend de la quantit´e d’information disponibles sur la cible d’une maladie particuli`ere. Les techniques de criblage
virtuel sont devenues des outils indispensables dans la chimie m´edicinale qui offrent un
moyen d’am´eliorer la phase de d´ecouverte de m´edicaments. Elles sont utilis´ees de mani`ere
quotidienne aussi bien dans les laboratoires de recherche publics que dans les grands laboratoires pharmaceutiques.
5
2.2.2
D´
ecouverte de nouveaux m´
edicaments avec le criblage virtuel
Le criblage virtuel est la strat´egie in-silico la plus utilis´ee pour l’identification de compos´es
(”hits”) dans le cadre de la recherche de nouveaux m´edicaments. Celui-ci fait d´esormais
partie int´egrante de la plupart des programmes de recherche de compos´es bioactifs, que
ceux-ci se d´eroulent en milieu acad´emique ou industriel, car il constitue un compl´ement essentiel au criblage biologique haut-d´ebit. Le criblage virtuel permet l’exploration de grande
chimioth`eques ( > 106 mol´ecules) a` la recherche de compos´es actifs vis-`a-vis d’une cible
th´erapeutique donn´ee. Ce processus vise a` r´eduire de fa¸con significative la chimioth`eque de
d´epart a` une liste limit´ee de compos´es jug´es les plus prometteurs. Cette approche conduit
souvent `a une nette am´elioration de la ”concentration” de mol´ecules actives pour la cible
”hit-rate”, tandis qu’une s´election al´eatoire de mol´ecules de la chimioth`eque ne saurait
fournir un tel enrichissement. Ainsi, le temps aussi bien que les coˆ
uts de l’identification
de nouveaux compos´es peuvent ˆetre r´eduits de fa¸con remarquable. Plus pr´ecis´ement, le
recours au criblage in-silico, en pr´ealable a` un criblage biologique a` plus petite ´echelle,
permet d’ajuster au mieux le nombre de tests exp´erimentaux ”in-vitro” en fonction des
contraintes budg´etaires et temporelles. Quand les conditions le permettent, le criblage
biologique peut ˆetre employ´e en parall`ele au criblage virtuel, afin d’`evaluer l’efficacit´e de
ce dernier et de pouvoir am´eliorer les param`etres des programmes informatiques utilis´es.
La pertinence de la mol´ecule employ´ee est la premi`ere condition pour le succ`ees d’un
criblage virtuel, bien avant celle des algorithmes utilis´es pour la recherche de touches au
sein de la mol´ecule. En effet, seule une librairie de compos´es suffisamment diverse peut
garantir une exploration satisfaisante de l’espace chimique, maximisant ainsi les chances
de d´ecouvrir de nouveaux compos´es. Par ailleurs, pour ´eviter de perdre du temps avec des
mol´ecules poss´edant des caract´eristiques incompatibles avec celles de compos´es d’int´erˆet
pharmaceutique, le processus de criblage comporte g´en´eralement une ´etape pr´eliminaire de
filtrage. Cette tˆache, qui peut ˆetre prise en charge par des programmes sp´ecialis´es, consiste
a` exclure les compos´es toxiques. Ensuite, ne sont retenus que les compos´es ob´eissant `a des
d´efinitions empiriques simples du profil de mol´ecule active.
2.2.3
Les diff´
erentes strat´
egies du criblage virtuel
Suivant la nature de l’information exp´erimentale disponible, on distingue deux approches
distinctes pour le criblage virtuel. La premi`ere se base sur la structure de la cible, qui
est connue sous le nom de ”structure-based virtual screening”, qui rapporte souvent aux
algorithmes de docking prot´eine-ligand. Elle consiste `a estimer la compl´ementarit´e structurale de chaque mol´ecule cribl´ee avec le site actif consid´er´e. En revanche, ces m´ethodes
sont g´en´eralement plus coˆ
uteuses en puissance de calcul et leur emploi requiert souvent
une expertise plus importante.
6
La seconde, reposant sur la connaissance d’un nombre suffisant d’information concernant une ou plusieurs mol´ecules actives de r´ef´erence, est appel´ee ”ligand-based virtual
screening”. Cette approche est rapide et relativement simple a` mettre en oeuvre, mais
son majeur inconv´enient est l’interd´ependance envers les informations de r´ef´erence utilis´ees pour construire le mod`ele de pr´ediction d’affinit´e. Bien que ces deux approches
soient surtout utilis´ees de mani`ere exclusive, leur combinaison lors du criblage permet de
maximiser les chances de succ`es pour identifier de nouvelles touches ”hits”. Dans le cadre
de ce travail, nous utilisons l’approche ”structure-based”.
2.2.4
Criblage virtuel `
a haut d´
ebit
La simulation de docking mol´eculaire est une proc´ed´e utile pour la pr´ediction des potentiels interaction des complexes de petite mol´ecule dans des sites de liaison de prot´eines, ces
informations sont indispensables dans la conception de m´edicaments bas´ee sur la structure (SBDD) ”Structure Based Drug Discovery” [4]. Plusieurs programmes de docking,
comme DOCK, GOLD, Autodock, Glide, LigandFit et FlexX, etc se sont montr´es utiles
dans le pipeline de la d´ecouverte in-silico de m´edicaments. La m´ethode de base derri`ere
la simulation de docking mol´eculaire est de g´en´erer toutes les conformations possibles
d’une mol´ecule de docking et ´evaluer entre eux l’orientation la plus favorable en tant que
mode de liaison de la mol´ecule a` l’aide d’une fonction de scoring. Une recherche exhaustive sur toutes les conformations correctes d’un compos´e est un processus qui consomme
beaucoup de temps. Par cons´equent, une simulation de docking efficace pour le criblage
a` grande ´echelle a` haut d´ebit (HTS) consommera de grandes ressources informatiques.
Il n´ecessite quelques Tera-flops par tˆache pour effectuer le docking de milliers de compos´es pour une prot´eine cible. Cependant, les outils existants manquent de moyen simple
pour pr´evoir des proc´edures de fa¸con concise pour les utilisateurs r´egulier afin d’organiser les ressources pour mener un amarrage mol´eculaires massives. La technologie de la
grille commence une nouvelle `ere de criblage virtuel en raison de son efficacit´e ainsi que
son rapport coˆ
ut-efficacit´e. Le coˆ
ut des tests in-vitro traditionnelle est g´en´eralement tr`es
´elev´e lors du criblage a` grande ´echelle est men´ee. Le criblage virtuel fournit aux scientifiques un outil efficace pour s´electionner les potentiels compos´es pour les tests in-vitro.
En cons´equence, le criblage virtuel a` haut d´ebit pourrait bien ´economiser ´enorme somme
d’argent comparant aux tests in-vitro classique.
2.2.5
Conclusion
Nous avons introduit le concept, les strat´egies de criblage virtuel. Ce dernier est une
approche informatique visant a` pr´edire des propri´et´es de librairies de mol´ecules. Avec
l’essor consid´erable de donn´ees exp´erimentales publiquement disponibles, cette discipline a
enregistr´e des progr`es consid´erables quant au d´ebit, la qualit´e et la diversit´e des pr´edictions
possibles. Un inventaire des applications du criblage ”in-silico” est donn´e , tout en gardant
7
une attention particuli`ere a` des cas concrets d’utilisation ainsi qu’au d´eveloppements
futur. Le criblage virtuel fournit une solution compl´ementaire pour le criblage virtuel
a` haut d´ebit ”HTS”, o`
u il comprend des techniques de calcul novatrices. L’avantage
du criblage virtuel ”in-silico” est donc de fournir une petite liste de mol´ecules `a tester
exp´erimentalement et ainsi r´eduire les coˆ
uts et gagner du temps. On peut aussi explorer
rapidement de nombreuses mol´ecules pour se focaliser ensuite, au niveau exp´erimental, sur
les mol´ecules les plus int´eressantes. Les difficult´es intrins`eques aux techniques a` haut d´ebit
ainsi que celles rencontr´ees lors des ´etapes d’optimisation des mol´ecules chimiques, ont
encourag´e le d´eveloppement de nouvelles approches, telles que les techniques de criblage
virtuel par docking mol´eculaire.
8
2.3
2.3.1
Docking
Introduction
La mod´elisation de la structure d’un complexe prot´eine-ligand est tr`es importante pour
la compr´ehension des interactions de liaison entre un compos´e potentiel ”ligand” et sa
cible th´erapeutique ”prot´eine”, et pour la conception de m´edicaments a` base de structure
moderne.
Le docking ou ”amarrage, arrimage” est une proc´ed´e tr`es utile qui vise `a pr´edire l’interaction potentiel de la structure d’un complexe mol´eculaire a` partir des petites mol´ecules
dans les sites de liaison de prot´eine afin d’acc´el´erer la recherche et la d´ecouverte de nouveaux m´edicaments in-silico (c-`a-d `a l’aide d’ordinateur), ”Le docking in-silico est la
d´etermination de la structure 3D des complexes prot´eiques `a l’´echelle atomique, qui permet de mieux comprendre la fonction biologique de ces complexe [1]”. Plus pr´ecisement,
le docking consiste `a trouver la meilleure position d’un ligand (petite mol´ecule) dans le
site de liaison d’un r´ecepteur (prot´eine) de fa¸con `a optimiser les interactions avec un
r´ecepteur, ´evaluer les interactions ligand-prot´eine de fa¸con `a pouvoir discriminer entre les
positionnement observ´ees exp´erimentalement et les autres. De fa¸con g´en´erale, le docking
a pour but de simuler l’interaction entre les mol´ecules in-silico, et les r´esultats obtenus
servent a` pr´edire la structure et les propri´et´es de nouveaux complexes [3].
Historiquement, les premiers outils de docking ob´eissaient au principe dit : ”lock-and-key”
(principe clef-serrure), selon lequel le ligand qui repr´esente la clef, est compl´ementaire au
niveau g´eom´etrique du site actif du r´ecepteur, qui repr´esente la serrure [Yuriev et al.,
2011]. Les ligands sont des petites mol´ecules destin´ees `a inhiber l’activit´e d’une prot´eine,
qui constitue le r´ecepteur. Il permet aussi, de pr´edire la structure intermol´eculaire entre
deux mol´ecules en une structure tridimensionnelle 3D, les modes de liaison ou les conformations possibles d’un ligand a` un r´ecepteur, et de calculer l’´energie de liaison. La technique de docking pr´evoit ´egalement la r´esistance de la liaison, l’´energie du complexe, les
types de signaux produits et estime l’affinit´e de liaison entre deux mol´ecules. Elle joue
un rˆole tr`es important dans l’aide a` la d´ecision, afin de d´eterminer quel ligand candidat
interagira le mieux avec un r´ecepteur prot´eine cible [15].
Le docking prot´eine-ligand est utilis´e pour v´erifier la structure, la position et l’orientation
d’une prot´eine quand elle interagit avec les petites mol´ecules comme les ligands. Son but
est de pr´edire et de classer les structures r´esultant de l’association entre un ligand donn´e
et une prot´eine cible d’une structure 3D connue.
9
Figure 3 – Docking prot´eine-ligand
Le docking ligand-prot´eine reste donc la m´ethode la plus souvent employ´ee, car elle permet une ´evaluation rapide de bases de milliers, voire de millions de mol´ecules.
En principe, un programme de docking doit ˆetre capable de g´en´erer les modes de liaison
attendus pour des ligands dont la position adopt´ee au sein du site actif est connue dans
un temps raisonnable. Pour cela, il est n´ecessaire que l’algorithme de recherche conformationnelle puisse explorer l’espace conformationnel le plus exhaustivement possible et
de fa¸con efficace. Classiquement, on juge la qualit´e du docking en mesurant le RMSD
(Root Mean Square Deviation) sur les atomes entre la pose obtenue en docking, et la pose
observ´ee exp´erimentalement si elle existe.
2.3.2
Approches du docking
Les diff´erentes approches du docking se distinguent au niveau de leurs conditions d’application et de la nature des informations qu’elles peuvent fournir. La pertinence du
choix d’un programme de docking donn´e repose en premier lieu sur l’ad´equation entre
ces caract´eristiques et celles du syst`eme ´etudi´e. L’efficacit´e de l’algorithme choisi sera par
ailleurs un compromis entre la rapidit´e d’ex´ecution et la pr´ecision des r´esultats.
Aussi en fonction du but recherch´e et du besoin de pr´ecision voulu, trois degr´es sont
en g´en´eral consid´er´es : rigide (les mol´ecules sont consid´er´ees comme rigides), semi-flexible
(une mol´ecule rigide et l’autre flexible), flexible (les deux flexibles). Le niveau semi-flexible
est souvent appliqu´e dans le cas prot´eine-ligand o`
u une des deux mol´ecules (le ligand) de
taille moindre est consid´er´ee comme flexible et la prot´eine comme rigide de fa¸con a` ne pas
trop complexifier le syst`eme.
10
Le processus de docking consiste `a faire interagir une petite mol´ecule organique avec le
r´ecepteur, g´en´eralement de nature prot´eique. La technique de docking comprend 4 ´etapes
principales :
1. Pr´eparer les fichiers pour la prot´eine.
2. Pr´eparer les fichiers pour le ligand.
3. Pr´eparer les fichiers de param`etres pour la grille.
4. Pr´eparer les fichiers de param`etres pour le docking.
Le sch´ema ci-apr`es montre clairement les ´etapes de docking.
´
Figure 4 – Etapes
du Docking
2.3.3
Principe du docking
Le docking mol´eculaire s’accomplit en deux ´etapes compl´ementaires. La premi`ere est
le Docking, qui consiste a` rechercher les conformations du ligand capables a` ´etablir des
interactions id´eales avec le r´ecepteur en utilisant des algorithmes de recherche : algorithme
g´en´etique, la m´ethode de Monte Carlo (qui utilise des proc´ed´es al´eatoires)... La deuxi`eme
dite le ”Scoring”, qui sont des m´ethodes math´ematiques et des fonctions discriminant les
poses de docking correctes de celles incorrectes. Ces m´ethodes sont utilis´ees pour estimer
la puissance d’interaction et l’affinit´e de liaison et qui permet d’´evaluer les conformations
par un calcul rapide d’´energie d’interaction des ligands avec un r´ecepteur pour ne retenir
que la meilleure.
11
La formule utilis´ee pour le scoring est la suivante :
G= complexe - ligand - prot´
eine
La figure ci-dessous sch´ematise le principe du docking/scoring, o`
u R symbolise une structure du r´ecepteur. Tandis que, A, B et C repr´esentent les petites mol´ecules.
Figure 5 – Illustration de docking/scoring [6]
Le docking peut ˆetre interpr´et´e de mani`ere qualitative par observation de l’entit´e ligand
dans la cavit´e de la prot´eine, mais ´egalement de mani`ere quantitative par traitement des
donn´ees provenant des fonctions de scoring.
2.3.4
Outils de Docking
A l’heure actuelle, plus de 30 programmes de docking mol´eculaires (commerciaux ou
non) sont disponibles [6]. Les plus fr´equemment cit´es sont respectivement : AutoDock
[9], GOLD, FlexX, DOCK et ICM. Ils permettent notamment un criblage rapide de
vastes librairies de compos´es. Ces programmes reposent le plus souvent sur des algorithmes sp´ecifiques (Algorithme g´en´etique, Recuit Simul´e...), leur protocole est compos´e
de 2 ´etapes essentielles Docking/Scoring.
Pour accomplir la tˆache de docking, les outils d’amarrage mol´eculaire vont g´en´erer une
s´erie de poses diff´erentes de liaison au ligand et en utilisant une fonction de notation
”scoring” pour ´evaluer les affinit´es de liaison de ligand pour les poses g´en´er´ees afin de
d´eterminer le meilleur mode de liaison.
12
Figure 6 – Comparaison des programmes de docking [16]
Comme la figure ci-dessus montre, le programme AutoDock est le plus cit´e et le plus
utilis´e parmi les autres programmes de docking.
2.3.5
Conclusion
Le processus de docking est l’un des premi`eres ´etapes dans la conception de m´edicaments,
il consiste a` faire interagir une petite mol´ecule organique avec un r´ecepteur, g´en´eralement
de nature prot´eique. En cons´equent, le plus grand avantage des m´ethodes de docking
prot´eine-ligand est qu’ils peuvent proposer des hypoth`eses structurelles sur la fa¸con dont
une petite mol´ecule peut interagir avec sa cible macromol´ecule. Des ´etudes ont montr´e que
certains algorithmes de docking sont plus fiables que d’autres pour reproduire le mode de
fixation exp´erimentale de ligand. La contrepartie de ces techniques est g´en´eralement une
hausse des temps de calcul et des ressources. A l’inverse, un projet impliquant le criblage
virtuel de millions de produits ne pourra pas ˆetre accompli avec ce type d’algorithme
mais plutˆot des codes plus simples, dans lesquels les approximations engendrent un gain
de temps de calcul et d’argent. Le nombre de programme de docking actuellement disponibles est ´elev´e et n’a cess´e d’augmenter au cours des derni`eres d´ecennies. Les exemples
suivants pr´esentent un aper¸cu des programmes les plus communs de docking prot´eineligand (LigandFit, FlexX, AutoDock). Dans ce travail nous avons utilis´e le programme
AutoDock.
Le docking est un type d’application facilement distribuable sur une grille. De sorte
que, de nombreuses ressources de calcul et de stockage ont ´et´e mises a` disposition par
le projet EGEE (Enabling Grids for E-sciencE), qui est financ´e par la commission europ´eenne et qui a pour but de construire sur les plus r´ecentes avanc´ees des technologies
de grille et de d´evelopper un service d’infrastructure de grille disponible 24h/24h.
13
2.4
AutoDock
AutoDock [4] est un programme flexible, utiliser pour le docking prot´eine-ligand. Il s’agit
d’un ensemble de proc´edures, dont le but de pr´edire l’interaction de petites mol´ecules,
telles que des m´edicaments candidats ”ligand” ou des substrats a` un r´ecepteur dont la
structure 3D est connue. AutoDock fonctionne essentiellement comme une proc´edure en
deux ´etapes : le calcul de la carte d’interaction du site de liaison du r´ecepteur qui est
r´ealis´e avec autogrid, et la position de ligand sur la carte d’interaction, qui est effectu´ee
avec autodock.
Le programme AutoGrid est charg´e de calculer les cartes d’interaction des grilles afin
de maximiser l’´etape d’´evaluation des diff´erentes configurations du ligand. Pour cela une
grille entoure la prot´eine r´eceptrice et un atome sonde est plac´e `a chaque intersection.
L’´energie d’interaction de cet atome avec la prot´eine est calcul´ee et attribu´ee a` l’emplacement de l’atome sonde sur la grille. Une grille d’affinit´e est calcul´e pour chaque type
d’atome du ligand. Le temps de calcul de l’´energie en utilisant les grilles est proportionnel
au nombre d’atomes du ligand uniquement, il est ind´ependant du nombre d’atomes du
r´ecepteur.
Le programme AutoDock effectue la partie de recherche et d’´evaluation des diff´erentes
configurations du ligand. Il est possible d’utiliser plusieurs techniques pour obtenir les
configurations (par recuit simul´e, algorithme g´en´etique ou par algorithme g´en´etique Lamarckien). Pour la m´ethode Monte Carlo, a` chaque pas un d´eplacement au hasard de
tous les degr´es de libert´e est effectu´e (translation, rotation, torsion). Les ´energies de la
nouvelle et de l’ancienne configuration sont compar´ees. Si la nouvelle est plus basse elle
est gard´ee, sinon elle est conserv´ee ou rejet´ee.
La version actuelle du programme est la version 4.2, qui fournit de nouvelles fonctionnalit´es importantes pour le docking comme la flexibilit´e des r´esidus de prot´eines et
des fonctions de score de haute qualit´e. Afin de pouvoir r´ealiser le criblage virtuel avec
AutoDock, un ensemble d’outils n´ecessaires doivent ˆetre mis en place :
• Java OpenJDK (openjdk-7-jdk)
• Python 2.7
• AutoDock4.2 (http: // autodock. scripps. edu )
• MGLTools (http: // mgltools. scripps. edu/ )
• autodocksuite-4.2.5.1-i86Linux2.tar.gz
• AutoDockTools
• Les fichiers n´ecessaires t´el´echargeable depuis le site de base de donn´ee de prot´eine :
www.pdb.com
14
2.4.1
Docking avec AutoDock
AutoDock a besoin de connaˆıtre les types, les charges et la liste de liaison de chaque atome,
afin de pouvoir effectuer la proc´edure de docking. Tout d’abord, il faut chercher dans la
base de donn´ee PDB (Protein Data Bank) dans le site (http: // www. pdb. org,http:
// www. rcsb. org ), les fichiers pdb pour la prot´eine et le ligand.
Figure 7 – Proc´edures de docking avec AutoDock
La proc´edure de docking avec AutoDock se d´ecompose en plusieurs ´etapes :
1. Pr´eparer le fichier d’entr´ee de prot´eine. Dans cette ´etape un fichier PDBQT(Protein
Data Bank, Partial Charge (Q), & Atom Type (T)) sera cr´e´e, qui contient les atomes
et les charges partielles.
> input protein.pdb
> output protein.pdbqt
L’utilisateur poss`ede 2 choix pour pr´eparer son prot´eine, soit il utilise l’outil ”ADT”,
soit via la commande suivante :
> /usr/local/MGLTools-1.5.6/bin/pythonsh /usr/local/MGLTools-1.5.6
/MGLToolsPckgs/AutoDockTools/Utilities24/prepare receptor4.py
-r protein.pdb
15
2. Pr´eparer le fichier d’entr´ee de ligand. Cette ´etape est tr`es semblable a` la pr´eparation
du prot´eine. Nous cr´eons un fichier dont l’extension est PDBQT du ligand.La
pr´eparation s’effectue comme suit :
> input ligand.pdb
> output ligand.pdbqt
> /usr/local/MGLTools-1.5.6/bin/pythonsh /usr/local/MGLTools1.5.6 /MGLToolsPckgs/AutoDockTools/Utilities24/
prepare ligand4.py -r ligand.pdb
3. G´en´eration d’un fichier de param`etre de la grille. Maintenant, nous devons d´efinir
l’espace en 3D, qu’AutoDock consid`erera pour le docking. Dans cette phase, nous
allons cr´eer les fichier d’entr´ees pour ”AutoGrid4”, qui permettra de cr´eer les
diff´erents fichiers de carte ”map file” et le fichier de donn´ees de la grille ”gpf”(grid
parameter file).
> input ligand.pdbqt & protein.pdbqt
> output protein.gpf
> /usr/local/MGLTools-1.5.6/bin/pythonsh /usr/local/MGLTools1.5.6/MGLToolsPckgs/AutoDockTools/Utilities24/
prepare gpf4.py -l ligand.pdbqt -r protein.pdbqt
4. G´en´eration des fichiers de cartes et de donn´ees de la grille. Dans l’´etape pr´ec´edente,
nous avons cr´e´e le fichier de param`etres de la grille, et maintenant nous allons utiliser
”AutoGrid4” pour g´en´erer les diff´erents fichiers de cartes et le fichier principal de
donn´ees de la grille.
> input protein.pdbqt & protein.gpf
> autogrid4 -p protein.gpf
Apr`es avoir lanc´e autogrid, plusieurs nouveaux fichiers avec l’extension map se
cr´eent, qui correspondent a` chaque type d’atome de ligand et des fichiers auxiliaires.
Ces fichiers sont importants dans le processus de docking.
5. G´en´eration du fichier de param`etre de docking. Cette ´etape consiste `a pr´eparer les
fichiers de docking (dpf).
> input ligand.pdbqt & protein.pdbqt
> output ligand protein.dpf
> /usr/local/MGLTools-1.5.6/bin/pythonsh /usr/local/
MGLTools-1.5.6/MGLToolsPckgs/ AutoDockTools/
Utilities24/prepare dpf4.py -l ligand.pdbqt -r protein.pdbqt
16
On peut pr´eparer les fichiers de param`etres pour la grille et pour le docking sans utiliser l’outil ADT, en utilisant un script shell (voir annexe) pour pr´eparer ces fichiers.
Le r´esultat de ce script sont respectivement les fichiers : dpf ”docking parameter file”
et gpf ”grid parameter file”.
` ce stade, nous aurions cr´e´e tout un tas de diff´erents fichiers. Cette avant derni`ere
6. A
´etape consiste `a ex´ecuter autodock avec la commande ci-apr`es :
> input protein ligand.gpf
> output result.dlg protein ligand.gpf
> autodock4 -p protein ligand.dpf -l result.dlg
7. La derni`ere ´etape sera consacr´ee a` l’analyse des r´esultats de docking. Apr`es avoir
termin´e avec succ`es la proc´edure de docking. Le meilleur r´esultat pour le docking,
sont les conformations qui poss`edent une basse ´energie. AutoDock peut faire une
premi`ere analyse des r´esultats en regroupant les solutions en classes (clusters) en
fonction de leur proximit´e spatiale. La mesure de la proximit´e entre deux solutions
est calcul´ee par la racine de la moyenne des carr´es des ´ecarts (Root Mean Square
Deviation RMSD) de leurs coordonn´ees atomiques. Si le RMSD entre mol´ecules est
inf´erieur `a une distance seuil, ces deux solutions sont dans la mˆeme classe. Le seuil de
distance est appel´e ”tol´erance de classe” et sa valeur par d´efaut, pour AutoDock,
est de 0,5. Ce param`etre est transmis `a AutoDock par le fichier de param`etrage
”dpf” avant le lancement du docking.
2.4.2
Conclusion
Comme nous avons mentionn´e dans la partie de docking, l’amarrage avec AutoDock est
une proc´ed´e qui comporte plusieurs ´etapes. Ce qui n´ecessitera une pr´eparation pr´ealable
des fichiers pour le docking. Le processus de docking est un sujet essentiel pour progr´esser
dans la compr´ehension des m´ecanismes d’interaction mol´eculaires et pour le d´eveloppement
d’outils pr´edictifs dans le domaine de la m´edecine. Dans cette partie, nous avons pr´esent´e
la proc´edure du docking avec AutoDock4.2 en utilisant l’outil AutoDockTools, et nous
avons appliqu´e les ´etapes de docking sur un exemple concret dans le but de comprendre
cette technique. qui va nous aider dans la prochaine phase de lancement des jobs sur la
grille de calcul pour faire le docking.
17