AI推論コスト:想像以上に安価である可能性
2025-08-28

この記事は、AI推論のコストが法外に高く、持続不可能であるという説に異議を唱えています。H100 GPUを用いたAI推論のコストを計算することで、著者は、入力処理のコストは驚くほど低い(100万トークンあたり数セント)一方、出力生成のコストは非常に高い(100万トークンあたり数ドル)ことを示しています。このコストの非対称性は、コーディングアシスタントなどのアプリケーションの収益性と、ビデオ生成などのアプリケーションの高コストを説明しています。著者は、このコストの不均衡はしばしば見過ごされており、AI推論のコストを過大評価し、既存のプレーヤーに利益をもたらし、競争とイノベーションを阻害する可能性があると主張しています。
続きを読む