Elastic Cloud Serverless在Azure上的网络性能瓶颈

2025-06-10
Elastic Cloud Serverless在Azure上的网络性能瓶颈

Elastic的SRE团队在Azure Kubernetes Service (AKS)上运行的Elastic Cloud Serverless中观察到吞吐量不稳定和丢包现象。调查发现,根本原因是SR-IOV接口上的RX环形缓冲区溢出和内核输入队列饱和。通过增加RX缓冲区大小和调整netdev backlog,显著改善了网络稳定性。即使在高性能硬件上,也需要对操作系统级别的网络参数进行微调,才能充分发挥其性能。

开发