L’utilisation de techniques computationnelles avancées dans les sciences physiques est devenue essentielle pour accélérer les découvertes scientifiques. Cela inclut l’intégration de grands modèles de langage (LLMs) et de simulations pour améliorer la génération d’hypothèses, la conception d’expériences et l’analyse des données. L’automatisation de ces processus vise à démocratiser l’accès aux outils de recherche de pointe, repoussant les limites de la connaissance scientifique et améliorant l’efficacité dans divers domaines scientifiques.
Les chercheurs doivent relever le défi de simuler efficacement les retours d’observation et de les intégrer avec des modèles théoriques dans les sciences physiques. Les méthodes traditionnelles manquent souvent d’universalité, conduisant à des inefficacités et limitant les découvertes innovantes. Un cadre plus complet et adaptable est nécessaire pour surmonter ce problème.
Des recherches actuelles affinent les LLMs avec des données spécifiques au domaine pour les aligner avec l’information scientifique. Des méthodes comme le Chain-of-Thoughts prompting, FunSearch et Eureka utilisent les LLMs pour la résolution de problèmes. Le Neural Architecture Search (NAS) optimise l’architecture des réseaux neuronaux et les paramètres continus. Des techniques comme la régression symbolique et la conception de molécules basées sur la population sont employées pour faire avancer la découverte scientifique.
Des chercheurs du MIT CSAIL, CMU LTI, UMass Amherst, et le MIT-IBM Watson AI Lab ont introduit un nouveau cadre d’optimisation appelé Scientific Generative Agent (SGA). Cette approche intègre les LLMs et les simulations pour améliorer le processus de découverte scientifique, visant à offrir une méthode unifiée pour la science physique.
Le SGA utilise un processus à deux niveaux où les LLMs génèrent des hypothèses au niveau supérieur, et les simulations optimisent les paramètres continus au niveau inférieur. Les chercheurs ont utilisé des ensembles de données QM9 pour la conception moléculaire et des simulateurs MPM différentiables pour la découverte de lois constitutives. Le cadre affine itérativement les hypothèses en intégrant des variables symboliques discrètes et des paramètres continus, optimisant les propriétés des matériaux et ajustant les structures moléculaires. Cette approche a démontré une performance supérieure dans l’identification de solutions précises pour des tâches telles que les matériaux élastiques non-linéaires et les propriétés mécaniques quantiques spécifiques.
Les résultats ont été significatifs, avec le SGA surpassant d’autres méthodes. En ce qui concerne la découverte de lois constitutives, le SGA a réalisé une réduction de perte de 50% par rapport aux bases de référence. Il a réussi à optimiser des molécules avec des propriétés quantiques spécifiques, atteignant une valeur de perte de 0.0001 dans la tâche du gap HOMO-LUMO, contre 0.003 pour les méthodes traditionnelles. L’approche d’optimisation à deux niveaux du SGA a constamment fourni des valeurs de perte plus faibles sur diverses tâches, prouvant son efficacité dans l’identification précise de nouvelles solutions scientifiques.
En conclusion, le SGA combine les LLMs et les simulations pour la découverte scientifique, générant et affinant des hypothèses et menant à des améliorations significatives dans la découverte de lois constitutives et la conception moléculaire. Les résultats montrent des réductions substantielles des valeurs de perte, démontrant l’exactitude et l’efficacité du SGA. Cette approche innovante offre une solution transdisciplinaire polyvalente pour l’enquête scientifique, enrichissant le potentiel de découvertes et faisant progresser les méthodologies de recherche.