Événements larges : guide pratique pour une meilleure observabilité
Cet article présente les « événements larges », une approche d’observabilité qui améliore la surveillance et le débogage des systèmes en émettant un seul événement contenant toutes les informations pouvant être collectées pour chaque unité de travail. L’auteur détaille comment choisir les outils appropriés (tels que Honeycomb), ajouter des attributs riches (y compris les métadonnées du service, les informations sur l’instance, les informations de build, les détails des requêtes et des réponses HTTP, les informations sur l’utilisateur et le client, les limites de taux, les informations de cache, les informations de localisation, le temps de disponibilité, les mesures, les résumés des requêtes asynchrones, les informations d’échantillonnage et les informations de chronométrage), et gérer les erreurs et les indicateurs de fonctionnalités. Des préoccupations courantes telles que le volume excessif de données, les données redondantes et la relation avec les mesures existantes sont abordées. L’article souligne la valeur pratique significative de cette approche, montrant comment elle simplifie le débogage et révèle des comportements inattendus du système.