LLM : Explorer les capacités arithmétiques dans la poursuite de l'AGI
Cet article explore pourquoi les grands modèles de langage (LLM) sont utilisés pour les calculs. Bien que les LLM excellent dans le traitement du langage naturel, les chercheurs tentent de les faire effectuer des opérations mathématiques, de la simple addition à la démonstration de théorèmes complexes. Le but n'est pas de remplacer les calculatrices, mais d'explorer les capacités de raisonnement des LLM et, à terme, d'atteindre l'intelligence artificielle générale (AGI). L'article souligne que les humains ont toujours cherché à utiliser les nouvelles technologies pour le calcul, et tester les capacités mathématiques des LLM est un moyen de tester leurs capacités de raisonnement. Cependant, le processus de calcul des LLM diffère radicalement de celui des calculatrices ; les premiers reposent sur d'immenses bases de connaissances et des modèles probabilistes, tandis que les seconds reposent sur des algorithmes déterministes. Par conséquent, les résultats des calculs des LLM ne sont pas toujours précis et fiables, ce qui met en lumière le compromis entre praticité et recherche.