Nexusflow a dévoilé Athene-Llama3-70B, un modèle de chat à poids ouvert affiné à partir du Llama-3-70B de Meta AI. Athene-70B a obtenu un score de 77,8% au test Arena-Hard-Auto, rivalisant avec des modèles propriétaires comme GPT-4o et Claude-3.5-Sonnet. Cela représente une nette amélioration par rapport à son prédécesseur, Llama-3-70B-Instruct, qui avait atteint 46,6%. Cette avancée résulte de la finalisation ciblée de Nexusflow pour peaufiner certains comportements du modèle. Athene-70B est actuellement testé publiquement sur Chatbot Arena.

Pour maximiser le potentiel de Llama-3-70B, Nexusflow a développé des benchmarks internes évaluant les capacités des modèles de langue dans des domaines tels que le suivi des instructions, le codage, l’écriture créative et les tâches multilingues. Ces évaluations ont conduit à des données de préférence de haute qualité pour l’apprentissage par renforcement basé sur des retours humains, conséquence de performances nettement améliorées par rapport à Llama-3-70B-Instruct.

Athene-70B montre la capacité de Nexusflow à personnaliser des modèles pour des besoins spécifiques des entreprises grâce à ce post-entraînement ciblé. Forts de leurs succès précédents avec Starling-7B et NexusRaven-V2, Nexusflow ambitionne de faire progresser ses modèles pour répondre aux normes des applications d’entreprise. La société propose des solutions sur mesure pour aider les entreprises à exceller dans les technologies GenAI de copilote et d’agent. Nexusflow invite les organisations à explorer comment Athene-70B peut améliorer leurs initiatives en IA en les contactant pour davantage d’informations et d’opportunités de collaboration.

Athene-Llama3-70B, un modèle de chat à poids ouverts développé par Nexusflow, démontre des améliorations significatives par rapport à son prédécesseur. Le modèle atteint des performances compétitives comparées aux modèles propriétaires dans le benchmark Arena-Hard-Auto. La pipeline de post-formation ciblée de Nexusflow, utilisant des benchmarks internes et l’apprentissage par renforcement basé sur des retours humains, a amélioré les capacités du modèle dans divers domaines, y compris le suivi des instructions, les mathématiques et le raisonnement, le codage, l’écriture créative, et les tâches multilingues. Cette avancée met en évidence la capacité de Nexusflow à adapter les modèles aux besoins des entreprises, s’appuyant sur leurs succès antérieurs. L’entreprise se positionne comme un fournisseur de solutions IA sur mesure de qualité entreprise, en invitant les organisations à découvrir le potentiel d’Athene-70B pour leurs initiatives en IA.