プラトン的表現仮説:普遍的な埋め込み反転とクジラとのコミュニケーションに向けて

2025-07-18
プラトン的表現仮説:普遍的な埋め込み反転とクジラとのコミュニケーションに向けて

研究者らは、大規模言語モデルが大きくなるにつれて、共有された基礎となる表現空間に収束することを発見しました。これは「プラトン的表現仮説」と呼ばれています。これは、アーキテクチャに関係なく、異なるモデルが同じ特徴を学習することを示唆しています。本論文では、「ムッソリーニかパンか」というゲームをアナロジーとして使用して、この共有表現を説明し、圧縮理論とモデルの汎化能力によってさらに裏付けられています。重要なことに、この仮説に基づいて、研究者らはvec2vecを開発しました。これは、異なるモデルの埋め込み空間間の教師なし変換を行う方法であり、高精度なテキスト埋め込みの反転を実現しています。将来の応用としては、線形Aなどの古代文字の解読や、クジラの言語の翻訳などが考えられ、言語間の相互理解とAIの発展に新たな可能性を開きます。

続きを読む

強化学習のスケーリング:ウェブ上での次トークン予測

2025-07-13
強化学習のスケーリング:ウェブ上での次トークン予測

著者は、強化学習(RL)がAIモデルのトレーニングにおける次のフロンティアであると主張しています。複数の環境を同時にスケーリングする現在の方法は、混乱を招きます。代わりに、著者は、ウェブ規模のデータセット上でRLによる次トークン予測を使用して、モデルに推論を学習させることを提案しています。これは、数学やコードの問題に焦点を当てた現在のRLトレーニングデータセットの限界を超えて、容易に入手可能な膨大なウェブデータを利用します。RLと次トークン予測を統合することで、このアプローチは、はるかに強力な推論モデルを作成することを約束します。

続きを読む
AI

AIのボトルネック:データ、アルゴリズムではない?

2025-06-30
AIのボトルネック:データ、アルゴリズムではない?

AIは目覚ましい進歩を遂げてきたが、そのペースは鈍化しつつあるように見える。この記事は、過去の主要なAIブレークスルー(DNN、トランスフォーマー、RLHF、推論モデル)は、新しいアルゴリズムではなく、新しいデータソース(ImageNet、ウェブテキスト、人間のフィードバック、検証者)の解禁によるものだったと主張している。著者は、将来のブレークスルーは、アルゴリズムの革新ではなく、ビデオやロボットセンサーなどの新しいデータソースの効果的な活用から生まれる可能性が高いと示唆しており、既存のデータセットは、その知識の限界に近づきつつある可能性があるためだ。

続きを読む