Les grands modèles de langage (LLM) ont réalisé des avancées impressionnantes en compréhension et génération de texte, mais leur capacité à gérer des contextes longs reste limitée. En réponse à ce défi, des chercheurs d’institutions renommées, dont le laboratoire AI de Shanghai et l’Université de Manchester, ont développé GraphReader, un système d’agent basé sur des graphes. GraphReader segmente les longs textes en morceaux, extrayant des informations clés et des faits atomiques pour construire une structure de graphe. Cette méthode exploite efficacement les dépendances à long terme et les relations multi-sauts au sein du texte. L’agent explore ce graphe de manière autonome, notant et réfléchissant jusqu’à obtenir suffisamment d’informations pour générer une réponse adéquate.
Les évaluations de GraphReader montrent des performances supérieures sur plusieurs benchmarks. Par exemple, sur le dataset HotpotQA, GraphReader atteint des scores EM de 55.0% et F1 de 70.0%, surpassant des modèles comme GPT-4-128k. Ce système représente une avancée significative pour le traitement des contextes longs, ouvrant des possibilités pour des applications complexes en analyse de documents et assistance à la recherche.