L’expansion des systèmes de questions-réponses (QA) propulsés par l’intelligence artificielle (IA) découle de la demande croissante pour l’analyse et la gestion des données financières. Ces technologies améliorent non seulement le service client, mais elles aident aussi à la gestion des risques et offrent des recommandations boursières personnalisées. Les réponses aux données financières doivent être exactes et utiles, nécessitant une compréhension approfondie du domaine financier en raison de la complexité des données, de la terminologie spécifique et des processus décisionnels.
Les scénarios de réponse longue (LFQA), bien que courants dans d’autres secteurs avec des jeux de données comme ELI5 ou WikiHowQA, manquent dans le domaine financier. Ce manque est crucial car les questions complexes nécessitent souvent des réponses détaillées et la récupération de documents pertinents. Les normes actuelles de QA financière, basées sur des calculs numériques et l’analyse de sentiments, peinent à gérer cette complexité.
Face à ces défis, des chercheurs de HSBC Lab, HKUST (Guangzhou) et Harvard ont développé FinTextQA, un jeu de données dédié aux questions financières, réglementaires et politiques. Composé de 1 262 paires de questions-réponses tirées de manuels et de sites gouvernementaux, incluant des règles et règlements financiers, il apporte un contenu plus complexe pour tester les modèles QA.
Le jeu de données a été utilisé pour évaluer des modèles de pointe tels que GPT-3.5-turbo et LLaMA2, mais ces modèles n’offrent pas toujours des réponses complètes. Ainsi, le système RAG est utilisé pour améliorer les performances et les capacités d’explication des LLMs.
Cependant, FinTextQA comporte moins de paires QA comparé aux grands jeux de données générés par IA, limitant son extension à des scénarios réels plus larges. Les futures recherches devraient se concentrer sur des approches innovantes pour pallier ce manque de données et explorer des méthodes de récupération plus avancées.
Malgré ces limites, les chercheurs voient dans ce travail une avancée significative pour la compréhension des concepts financiers et le soutien des systèmes QA dans ce domaine. FinTextQA offre une structure robuste pour le développement des systèmes LFQA financiers.