Webtagr - Résumé de news de technologie

Tags populaires：

Virtualisation sécurité DNS vérification formelle analyse d'atteignabilité erreurs du compilateur conflit de macro extension web framework de développement Graphiques bitmap incohérences d'API Tous les tags

Les LLM échouent à identifier les polices : un benchmark en direct

2025-08-04

Un développeur a évalué GPT-4 et Gemini sur un benchmark en direct et mis à jour en continu de polices non identifiées provenant du forum DaFont. Malgré la fourniture d'un contexte tel que des images, des titres et des descriptions, les deux LLM ont obtenu des résultats très médiocres. Cela souligne les limites, même dans des tâches de classification d'images apparemment simples, suggérant que les LLM sont loin d'être une solution universelle. Le projet utilise des scripts Python pour le scraping de données, GitHub Actions pour l'automatisation, JSON pour le stockage et Observable pour un tableau de bord dynamique.

Lire plus

(maxhalford.github.io)

IA Identification de polices