LLM-Benchmark: Preis-Leistungs-Analyse

2025-06-05
LLM-Benchmark: Preis-Leistungs-Analyse

Dieser Bericht bewertet große Sprachmodelle in verschiedenen Bereichen, darunter logisches Denken, Naturwissenschaften, Mathematik, Codegenerierung und mehrsprachige Fähigkeiten. Die Ergebnisse zeigen erhebliche Leistungsunterschiede zwischen den Aufgaben, mit starken Leistungen im wissenschaftlichen und mathematischen Denken, aber relativ schwächeren Leistungen in der Codegenerierung und der Verarbeitung langer Kontexte. Der Bericht analysiert auch Preisstrategien und zeigt, dass die Modellleistung nicht linear mit dem Preis korreliert.