Fehler zuerst verfolgen: Das wertvollste Signal für Observability
Dieser Artikel argumentiert, dass die Fehlerverfolgung bei der Erstellung von Observability-Systemen priorisiert werden sollte. Das Standardmodell der „drei Säulen“ (Logs, Metriken und Traces) übersieht das wertvollste Signal: Fehler. Ausnahmen zeigen direkt an, dass Annahmen im Code fehlgeschlagen sind, und liefern direktere und wertvollere Informationen als Logs, Metriken oder Traces. Der Autor plädiert für eine tiefgreifende Fehlerverfolgung, bei der vollständige Stacktraces, lokale Variablen, Anforderungsdaten und Benutzerkontext erfasst werden, anstatt nur Fehler zu zählen. Er kritisiert die Abstraktion von Fehlern als generische Ereignisse und den Trend von Full-Stack-APM-Tools, die Fehlerverfolgung zu marginalisieren, und betont, dass die Fehlerverfolgung im Vordergrund stehen sollte, nicht als nachträglicher Gedanke.
Mehr lesen