Metas Jagged Flash Attention: Revolutioniert die Leistung von Empfehlungssystemen

2025-03-21
Metas Jagged Flash Attention: Revolutioniert die Leistung von Empfehlungssystemen

Meta stellt Jagged Flash Attention vor, eine Innovation, die die Leistung und Skalierbarkeit von großen Empfehlungssystemen revolutioniert. Traditionelle Methoden haben Schwierigkeiten mit kategorialen Merkmalen variabler Länge (wie der Benutzerinteraktionshistorie), die ein umfangreiches Padding erfordern. Jagged Flash Attention verarbeitet diese Merkmale effizient mithilfe von Jagged-Tensoren und eliminiert den Padding-Overhead. In Kombination mit der TorchRec-Bibliothek erzielt es bis zu 10-fache Performance-Verbesserungen in Metas Produktionsumgebung und unterstützt das Training von Modellen mit über 3 Billionen Parametern. Dieser Durchbruch verbessert personalisierte Empfehlungssysteme erheblich.