Webtagr - Résumé de news de technologie

Tags populaires：

Virtualisation sécurité DNS vérification formelle analyse d'atteignabilité erreurs du compilateur conflit de macro extension web framework de développement Graphiques bitmap incohérences d'API Tous les tags

Face-à-face des LLM : Évaluation réelle de 130 prompts

2025-08-24

L'auteur a réalisé une évaluation réelle de plus d'une douzaine de LLM dans quatre catégories : programmation, tâches d'administration système, explications techniques et invites créatives, en utilisant 130 prompts de son historique bash. Les modèles open source ont systématiquement surpassé les options propriétaires comme Gemini 2.5 Pro en termes de précision, de vitesse et de rentabilité. L'auteur a conclu en utilisant une combinaison de modèles open source rapides et peu coûteux, complétés par des modèles propriétaires plus puissants selon les besoins.

Lire plus

(darkcoding.net)