Webtagr - 科技资讯摘要

热门标签：

Mac 多显示器显示器扩展 requests patch 并发 Alpine Linux BSD Linux 电动汽车全部标签

Helix：赋予机器人理解和操控能力的视觉-语言-动作模型

2025-02-20

Figure公司推出Helix，一个具有突破性的视觉-语言-动作（VLA）模型，它将感知、语言理解和学习控制统一起来，解决了机器人领域长期存在的难题。Helix首次实现了全上半身高频连续控制、多机器人协作以及仅通过自然语言指令即可拾取任何小型家用物品的能力。它使用单个神经网络权重学习所有行为，无需特定任务微调，并可在嵌入式低功耗GPU上运行，实现了商业化部署。Helix通过“系统1”（快速反应视觉运动策略）和“系统2”（基于互联网预训练的VLM）的协同工作，实现了快速泛化和高精度控制，为家用机器人的规模化应用铺平了道路。

(www.figure.ai)