Face-à-face des LLM : Évaluation réelle de 130 prompts

2025-08-24

L'auteur a réalisé une évaluation réelle de plus d'une douzaine de LLM dans quatre catégories : programmation, tâches d'administration système, explications techniques et invites créatives, en utilisant 130 prompts de son historique bash. Les modèles open source ont systématiquement surpassé les options propriétaires comme Gemini 2.5 Pro en termes de précision, de vitesse et de rentabilité. L'auteur a conclu en utilisant une combinaison de modèles open source rapides et peu coûteux, complétés par des modèles propriétaires plus puissants selon les besoins.

Lire plus
IA