Les LLM échouent à un contrôle des faits du monde réel : un écart flagrant de capacités
2025-06-05
L'auteur a testé plusieurs grands modèles de langage (LLM) sur une tâche complexe de vérification des faits du monde réel concernant les effets à long terme des médicaments contre le TDAH. Les résultats ont révélé un écart de performance significatif : certains LLM ont cité et résumé avec précision des documents du monde réel, tandis que d'autres ont souffert de graves « hallucinations de liens » et d'interprétations erronées des sources. L'auteur soutient que les méthodes actuelles de test des LLM sont trop simplistes et ne permettent pas d'évaluer correctement leur capacité à gérer des informations complexes, appelant à une plus grande attention à ce problème critique.
Lire plus