DeepSeek V3:限られたリソースで最高峰のパフォーマンス

2025-01-23
DeepSeek V3:限られたリソースで最高峰のパフォーマンス

OpenAIなどの巨大企業が使用するリソースのごく一部である、わずか2048個のH800 GPUでトレーニングされたDeepSeekの新しいV3モデルは、いくつかのベンチマークにおいてGPT-4やClaudeに匹敵するか、それを上回っています。トレーニングコストは550万ドルと、GPT-4の推定4000万ドルと比較して非常に低くなっています。この成功は、ハイエンドGPUへのアクセスを制限する米国の輸出規制によって部分的に促進され、純粋な計算能力よりもアーキテクチャの革新とアルゴリズムの最適化の可能性を浮き彫りにしています。これは、リソースの制約が、逆説的にAI開発における画期的な進歩を促進できるという説得力のある議論です。