Elastic Cloud Serverless: Azure AKS上での不安定なスループットとパケットロス
2025-06-10

ElasticのSREチームは、Azure Kubernetes Service(AKS)上で実行されているElastic Cloud Serverlessにおいて、不安定なスループットとパケットロスを観測しました。調査の結果、根本原因はSR-IOVインターフェース上のRXリングバッファオーバーフローとカーネル入力キューの飽和であることが判明しました。RXバッファサイズを増やし、netdevバックログを調整することで、ネットワークの安定性が大幅に向上しました。高性能ハードウェアであっても、オペレーティングシステムレベルでのネットワークパラメータのチューニングが、最適なパフォーマンスには不可欠です。
開発