AI 백엔드 네트워크 혁신: 기존 ECMP 부하 분산 넘어서
2025-04-22
기존의 플로우 기반 ECMP 부하 분산은 RoCEv2 기반 AI 백엔드 네트워크에서 생성되는 대량의 엘리펀트 플로우에 대처하는 데 어려움을 겪습니다. 이 글에서는 두 가지 대안을 소개합니다. 적응형 라우팅을 사용한 플로우릿 기반 부하 분산(트래픽을 동적으로 저부하 경로로 리다이렉트)과 패킷 분산을 사용한 패킷 기반 부하 분산(개별 패킷을 여러 경로에 분산하지만 안정적인 작동에는 RDMA Write Only 작업이 필요). Cisco Nexus 스위치는 이제 플로우릿 기반 및 패킷 기반 부하 분산을 모두 가능하게 하는 동적 부하 분산(DLB) 구성을 지원합니다.