KI-Inferenzkosten: Nicht so teuer wie gedacht
Dieser Artikel widerlegt die Behauptung, dass KI-Inferenz unerschwinglich teuer und nicht nachhaltig ist. Durch die Berechnung der Kosten für die Ausführung von KI-Inferenz auf H100-GPUs zeigt der Autor, dass die Eingabeverarbeitung unglaublich günstig ist (Bruchteile eines Cents pro Million Token), während die Erzeugung von Ausgaben deutlich teurer ist (Dollar pro Million Token). Diese Kostenungleichheit erklärt die Rentabilität einiger Anwendungen (wie Codierungsassistenten) und die hohen Kosten anderer (wie Videogenerierung). Der Autor argumentiert, dass diese Kostenungleichheit oft übersehen wird, was zu einer Überschätzung der KI-Inferenzkosten führt, was den etablierten Akteuren zugutekommen und Wettbewerb und Innovation behindern kann.