Helix:汎用的なロボット操作のためのビジョン・ランゲージ・アクションモデル

2025-02-20
Helix:汎用的なロボット操作のためのビジョン・ランゲージ・アクションモデル

Figure社は、長年のロボット工学の課題を克服するために、知覚、言語理解、学習制御を統合した画期的なビジョン・ランゲージ・アクション(VLA)モデルであるHelixを発表しました。Helixは、全身の上半身の高レート連続制御、複数ロボットの協調作業、自然言語指示だけで事実上あらゆる小さな家庭用品を拾い上げる能力など、いくつかの画期的な成果を達成しています。単一ニューラルネットワークが、タスク固有の微調整なしですべての動作を学習し、商用展開に向けて低消費電力の組込みGPU上で動作します。Helixの「システム1」(高速反応視覚運動ポリシー)と「システム2」(インターネットで事前トレーニングされたVLM)アーキテクチャにより、高速な汎化と精密な制御が可能になり、家庭環境へのヒューマノイドロボットの拡大への道が開かれます。