Des progrès importants ont été réalisés dans la prédiction des structures protéiques statiques, mais comprendre la dynamique des protéines, influencée par les ligands, est essentiel pour saisir leur fonction et avancer dans la découverte de médicaments. Les méthodes de docking traditionnelles considèrent souvent les protéines comme rigides, limitant leur précision. Bien que les simulations de dynamique moléculaire suggèrent des conformations pertinentes, elles sont coûteuses en calculs. Des avancées récentes comme AlphaFold prédisent des structures à partir de séquences mais manquent la nature dynamique des protéines, affectant ainsi la précision du docking.
Des chercheurs de Galixir Technologies, de la School of Pharmaceutical Science, de l’Université Sun Yat-sen, du Center for Theoretical Biological Physics et du Department of Chemistry de Rice University, ainsi que du Global Institute of Future Technology de l’Université Shanghai Jiao Tong, ont développé DynamicBind, une méthode d’apprentissage profond utilisant des réseaux de diffusion géométrique équivariants pour créer un paysage énergétique fluide, permettant des transitions efficaces entre différents états d’équilibre. DynamicBind prédit avec précision des conformations spécifiques aux ligands à partir de structures protéiques non liées, sans structures holo ou échantillonnage étendu. Il excelle dans les benchmarks de docking et de criblage virtuel, accommodant de grands changements conformationnels et identifiant les poches cachées dans de nouvelles cibles protéiques. Cette méthode montre un potentiel notable pour accélérer le développement de petites molécules pour des cibles auparavant non exploitables, faisant ainsi avancer la découverte de médicaments par calcul.
DynamicBind, un modèle générateur géométrique profond pour le docking dynamique, ajuste efficacement les conformations protéiques des prédictions initiales d’AlphaFold aux états semblables à holo. Il gère des changements conformationnels significatifs, tels que la transition DFG-in à DFG-out dans les kinases, mieux que les simulations de dynamique moléculaire traditionnelles. DynamicBind y parvient en apprenant un paysage énergétique en entonnoir qui minimise la frustration durant les transitions entre les états biologiquement pertinents. À la différence des générateurs de Boltzmann traditionnels, DynamicBind est généralisable à de nouvelles protéines et ligands.
Le modèle DynamicBind est un réseau de neurones graphiques basé sur la diffusion et équivariant E(3) utilisant une représentation grossière pour prédire les conformations de liaison protéine-ligand. Il transforme efficacement les structures d’entrée pour tenir compte des changements trans-rotationnels et de parité en 3D, surpassant les méthodes traditionnelles avec moins de données. Le modèle emploie une transformation de type morphing pour l’entraînement, interpolant entre les structures cristallines et AlphaFold. Utilisant une représentation graphique, chaque résidu de protéine et atome de ligand est un nœud avec diverses caractéristiques. DynamicBind met à jour ces nœuds par des produits tensoriels et des processus de diffusion pour prédire les dièdres des chaînes latérales, les angles de torsion, les translations et rotations, améliorant ainsi les prédictions d’affinité de liaison.
DynamicBind est un outil polyvalent pour prédire les structures complexes de protéines-ligands, s’adaptant aux changements conformationnels significatifs des protéines. Lors de l’inférence, il ajuste progressivement les positions des ligands et les angles internes sur 20 itérations tout en adaptant les conformations protéiques, notamment les angles des chaînes latérales, améliorant les structures prédites par AlphaFold. Contrairement aux modèles traditionnels, il utilise une transformation de type morphing plutôt que des perturbations de bruit gaussien, ce qui améliore la capacité du modèle à capturer les changements conformationnels biologiquement pertinents. DynamicBind excelle dans la prédiction des poses de ligands, réduisant les collisions et révélant des poches cachées comme démontré dans divers benchmarks et études de cas, montrant son potentiel pour les applications de découverte de médicaments.
En conclusion, DynamicBind intègre la génération de conformations protéiques et la prédiction des poses de ligands en un seul cadre d’apprentissage en profondeur de bout en bout, beaucoup plus rapide que les simulations de dynamique moléculaire traditionnelles. Contrairement aux méthodes de docking conventionnelles nécessitant des poches de liaison prédéfinies, DynamicBind effectue un docking global, idéal pour identifier des poches cachées. Cela réduit les effets secondaires potentiels en ciblant des protéines spécifiques et aide à la découverte de médicaments en prédisant des cibles protéiques non intentionnelles ou en identifiant des cibles lors du criblage phénotypique. Bien qu’il montre d’excellentes performances, des améliorations sont nécessaires pour mieux généraliser aux protéines avec une faible homologie de séquence. Les avancées en Cryo-EM et l’incorporation de données d’affinité de liaison peuvent renforcer les capacités de DynamicBind.