Elastic Cloud Serverless: Rendimiento inestable y pérdida de paquetes en Azure AKS
2025-06-10
El equipo de Ingeniería de Fiabilidad del Sitio (SRE) de Elastic observó un rendimiento inestable y pérdida de paquetes en Elastic Cloud Serverless que se ejecuta en Azure Kubernetes Service (AKS). La investigación reveló que los principales factores que contribuyen a esto son los desbordamientos del búfer de anillo RX y la saturación de la cola de entrada del kernel en las interfaces SR-IOV. Para solucionar este problema, aumentamos los tamaños de los búferes RX y ajustamos el backlog de netdev, lo que mejoró significativamente la estabilidad de la red. Incluso con hardware de alto rendimiento, el ajuste de los parámetros de red a nivel del sistema operativo es crucial para un rendimiento óptimo.
Desarrollo