LLM-Showdown: Eine reale Bewertung von 130 Prompts

2025-08-24

Der Autor führte eine reale Bewertung von über einem Dutzend LLMs in vier Kategorien durch: Programmierung, Systemadministration, technische Erklärungen und kreative Aufgaben, wobei 130 Prompts aus seinem Bash-Verlauf verwendet wurden. Open-Source-Modelle übertrafen konsequent proprietäre Optionen wie Gemini 2.5 Pro in Bezug auf Genauigkeit, Geschwindigkeit und Kosteneffizienz. Der Autor schloss mit der Verwendung einer Kombination aus schnellen, günstigen Open-Source-Modellen, ergänzt durch leistungsstärkere proprietäre Modelle nach Bedarf.

Mehr lesen
KI