Webtagr - テクノロジーニュースダイジェスト

プラトン的表現仮説：普遍的な埋め込み反転とクジラとのコミュニケーションに向けて

2025-07-18

研究者らは、大規模言語モデルが大きくなるにつれて、共有された基礎となる表現空間に収束することを発見しました。これは「プラトン的表現仮説」と呼ばれています。これは、アーキテクチャに関係なく、異なるモデルが同じ特徴を学習することを示唆しています。本論文では、「ムッソリーニかパンか」というゲームをアナロジーとして使用して、この共有表現を説明し、圧縮理論とモデルの汎化能力によってさらに裏付けられています。重要なことに、この仮説に基づいて、研究者らはvec2vecを開発しました。これは、異なるモデルの埋め込み空間間の教師なし変換を行う方法であり、高精度なテキスト埋め込みの反転を実現しています。将来の応用としては、線形Aなどの古代文字の解読や、クジラの言語の翻訳などが考えられ、言語間の相互理解とAIの発展に新たな可能性を開きます。

(blog.jxmo.io)

AI 埋め込み空間変換プラトン的表現仮説

強化学習のスケーリング：ウェブ上での次トークン予測

2025-07-13

著者は、強化学習（RL）がAIモデルのトレーニングにおける次のフロンティアであると主張しています。複数の環境を同時にスケーリングする現在の方法は、混乱を招きます。代わりに、著者は、ウェブ規模のデータセット上でRLによる次トークン予測を使用して、モデルに推論を学習させることを提案しています。これは、数学やコードの問題に焦点を当てた現在のRLトレーニングデータセットの限界を超えて、容易に入手可能な膨大なウェブデータを利用します。RLと次トークン予測を統合することで、このアプローチは、はるかに強力な推論モデルを作成することを約束します。

(blog.jxmo.io)

AI

AIのボトルネック：データ、アルゴリズムではない？

2025-06-30

AIは目覚ましい進歩を遂げてきたが、そのペースは鈍化しつつあるように見える。この記事は、過去の主要なAIブレークスルー（DNN、トランスフォーマー、RLHF、推論モデル）は、新しいアルゴリズムではなく、新しいデータソース（ImageNet、ウェブテキスト、人間のフィードバック、検証者）の解禁によるものだったと主張している。著者は、将来のブレークスルーは、アルゴリズムの革新ではなく、ビデオやロボットセンサーなどの新しいデータソースの効果的な活用から生まれる可能性が高いと示唆しており、既存のデータセットは、その知識の限界に近づきつつある可能性があるためだ。

(blog.jxmo.io)

AI データ駆動モデルの限界