DeepSeekインフラストラクチャのプロファイリングデータ公開

2025-02-27
DeepSeekインフラストラクチャのプロファイリングデータ公開

DeepSeekは、トレーニングおよび推論フレームワークのプロファイリングデータを公開し、コミュニティが通信と計算のオーバーラップ戦略と低レベルの実装の詳細を理解するのに役立てています。PyTorch Profilerを使用してキャプチャされたデータは、ChromeまたはEdgeブラウザで直接視覚化できます。分析では、完全にバランスの取れたMoEルーティング戦略がシミュレートされ、トレーニング、プリフィリング、デコーディングの各フェーズがカバーされています。計算と通信のオーバーラップを改善するために、さまざまな構成(例:EP64/TP1、EP32/TP1、EP128/TP1)とマイクロバッチング戦略が最適化されています。