Les LLM échouent spectaculairement sur les connaissances de niche : Étude de cas du Brachiosaure
Un article de blog expose les failles critiques des grands modèles de langage (LLM) lorsqu’ils traitent de connaissances spécialisées. Prenant l’exemple de la taxonomie du genre Brachiosaure, l’auteur démontre les erreurs significatives de ChatGPT lorsqu’il répond aux questions connexes. Ces erreurs ne sont pas seulement des imprécisions factuelles ; elles sont présentées d’une manière plausible et trompeuse. Cela souligne que les LLM ne sont pas omniscients et que leurs résultats sont peu fiables dans les domaines qui manquent de données robustes. Les utilisateurs ont besoin d’une expertise de domaine pour distinguer le vrai du faux. L’auteur met en garde contre la confiance aveugle dans les résultats des LLM et recommande de vérifier les réponses.