IBMs Bamba: Überwindung des quadratischen Engpasses von Transformers

Beliebte Tags：

Kosmos Virtualisierung DNS-Sicherheit formale Verifikation Erreichbarkeitsanalyse KI Compilerfehler Makrokonflikt Web-Erweiterung Entwicklungsframework Alle Tags

IBMs Bamba: Überwindung des quadratischen Engpasses von Transformers

2025-04-29

Die Transformer-Architektur, die die heutigen großen Sprachmodelle antreibt, leidet trotz ihrer Effizienz bei längeren Konversationen unter einem quadratischen Engpass. IBMs Open-Source-Modell Bamba begegnet diesem Problem, indem es State-Space-Modelle (SSMs) geschickt mit Transformatoren kombiniert. Bamba reduziert den Speicherbedarf deutlich, was zu einer mindestens doppelt so hohen Geschwindigkeit im Vergleich zu ähnlichen Transformatoren führt, während die Genauigkeit erhalten bleibt. Bamba wurde mit Billionen von Tokens trainiert und ist darauf vorbereitet, Konversationen mit Millionen von Tokens zu verarbeiten und mit weiteren Optimierungen möglicherweise bis zu fünfmal schneller zu laufen.

(research.ibm.com)

KI State-Space-Modelle

Indisches Gericht ordnet Sperrung des verschlüsselten E-Mail-Anbieters ProtonMail an

Bitcoin-Mining: Tod für Einzelpersonen? Megakonzerne dominieren, Einzelminer im Staub