Conquistando uma Rede de 3200 Gbps: Uma Jornada com RDMA, EFA e libfabric
2025-01-03
Na Perplexity AI, o autor utilizou RDMA, EFA e libfabric em instâncias AWS p5 (com 8 GPUs NVIDIA H100 interconectadas via NVSwitch) para atingir uma utilização quase perfeita (97%) da largura de banda da rede de 3200 Gbps. Este artigo detalha o processo, compartilhando insights valiosos e técnicas de otimização (multithreading, fixação de núcleo da CPU, particionamento de estado, etc.) para programação de rede de alto desempenho. Ele destaca as vantagens dos modelos de comunicação assíncrona sobre os métodos de comunicação coletiva.
Leia mais
Desenvolvimento
Rede de Alto Desempenho