Stream vs. Batch: Es geht eigentlich um Push vs. Pull
2025-05-18
Die übliche "Stream vs. Batch"-Debatte ist irreführend. Viele Streaming-Systeme verwenden intern Batch-Verarbeitung zur Leistungssteigerung, aber der eigentliche Unterschied liegt in der Datenverarbeitung-Semantik: 'Push'-Systeme liefern Daten in Echtzeit und bieten eine vollständige, aktuelle Ansicht; 'Pull'-Systeme fragen Daten periodisch ab und können Aktualisierungen und Löschungen verpassen. Obwohl 'Push' komplexer ist, ist sein Echtzeitvorteil überzeugend. Sobald man die Magie der Sekunden-Datenaktualität erlebt hat, möchte man nicht mehr darauf verzichten. In der Praxis ergänzen sich beide Ansätze, wobei Batch-Verarbeitung oft für Backfills in ansonsten Streaming-basierten Systemen verwendet wird.
Entwicklung
Batch-Verarbeitung