Évaluation comparative des LLM : Analyse du prix par rapport aux performances
2025-06-05
Ce rapport évalue les grands modèles de langage dans divers domaines, notamment le raisonnement, les sciences, les mathématiques, la génération de code et les capacités multilingues. Les résultats révèlent des variations de performance significatives selon les tâches, avec de bonnes performances en raisonnement scientifique et mathématique, mais des performances relativement plus faibles en génération de code et en traitement de contextes longs. Le rapport analyse également les stratégies de prix et montre que les performances du modèle ne sont pas corrélées linéairement au prix.