Les LLM échouent à identifier les polices : un benchmark en direct

2025-08-04
Les LLM échouent à identifier les polices : un benchmark en direct

Un développeur a évalué GPT-4 et Gemini sur un benchmark en direct et mis à jour en continu de polices non identifiées provenant du forum DaFont. Malgré la fourniture d'un contexte tel que des images, des titres et des descriptions, les deux LLM ont obtenu des résultats très médiocres. Cela souligne les limites, même dans des tâches de classification d'images apparemment simples, suggérant que les LLM sont loin d'être une solution universelle. Le projet utilise des scripts Python pour le scraping de données, GitHub Actions pour l'automatisation, JSON pour le stockage et Observable pour un tableau de bord dynamique.

Lire plus