DeepSeek:中国AIレースを牽引する静かな巨人

2024-12-31

DeepSeekは、中国のAIスタートアップで、そのR1モデルは複数の推論ベンチマークにおいてOpenAIのモデルを上回った、注目すべき存在です。クオンツヘッジファンドであるHigh-Flyerによって全額出資されており、商業アプリケーションよりも基礎技術に焦点を当て、すべてのモデルをオープンソース化することを約束しています。手頃な価格のAPIによって中国で価格競争を引き起こしました。これは、High-Flyerの膨大なコンピューティングリソースへのアクセスによって支えられています。DeepSeekの野心的な目標は、汎用人工知能(AGI)の達成であり、マルチヘッド潜在的アテンション(MLA)やスパース混合オブエキスパーツ(DeepSeekMoE)などの画期的なアーキテクチャとアルゴリズムの革新に焦点を当て、推論コストを大幅に削減しています。その成功は、包括的なモデルアーキテクチャの革新と国内人材の有効活用に起因し、商業化と複製に焦点を当てている多くの中国企業とは対照的です。創業者のLiang Wenfengは、技術的な理想主義者であり、「是非観」を「利害観」よりも優先し、中国における独創的なイノベーションを推進し、中国が世界の技術革新の波の中でより重要な役割を果たすことを目指しています。

続きを読む
AI