La planification par intelligence artificielle (IA) consiste à créer une séquence d’actions pour atteindre un objectif spécifique dans le développement de systèmes autonomes. Les grands modèles linguistiques (LLM) ont démontré un grand potentiel, mais présentent des défis lorsqu’il s’agit de générer des plans complets et fiables. La recherche s’efforce de concilier flexibilité, précision et fiabilité, en réduisant la dépendance à l’intervention humaine.
Pour relever ces défis, les chercheurs de Cornell University et IBM Research ont conçu AutoToS. Ce système génère automatiquement des composants de recherche valides et complets sans supervision humaine, grâce à des tests unitaires et des processus de débogage automatisés. AutoToS permet d’améliorer notablement l’efficacité et la scalabilité du processus de planification par IA.
Testé sur divers problèmes de référence, AutoToS a montré une précision de 100% avec un nombre minimal de rétroactions. Par exemple, pour le domaine « 24 Game », il n’a nécessité en moyenne que 2,6 appels aux LLM pour obtenir une précision parfaite, démontrant ainsi l’importance des rétroactions automatiques pour des solutions correctes et fiables.