RDMA和AI后端网络的负载均衡新方法
2025-04-22
传统的基于流的ECMP负载均衡在RoCEv2的AI后端网络中效率低下,因为它无法处理海量数据流。本文介绍了两种替代方法:基于流的负载均衡的自适应路由和基于分组的负载均衡的分组喷洒。前者通过动态监控链路利用率,将数据流引导至低负载路径;后者则将单个数据流的分组分散到多条路径,但需要RDMA Write Only操作支持,以确保分组顺序。Cisco Nexus交换机已支持动态负载均衡配置,允许进行基于流和基于分组的负载均衡。
科技
AI网络