谷歌DeepMind发布Gemini机器人AI模型，赋能灵活精准的机器人控制

热门标签：

Mac 多显示器显示器扩展 requests patch 并发 Alpine Linux BSD Linux 电动汽车全部标签

2025-03-12

谷歌DeepMind发布了两个用于控制机器人的全新AI模型：Gemini Robotics和Gemini Robotics-ER。这两个模型基于Gemini 2.0大语言模型，增加了视觉-语言-动作（VLA）能力和强化空间理解能力，使机器人能够更有效、更精细地理解和与物理世界互动。Gemini Robotics能够理解自然语言指令并执行相应的动作，例如“拿起香蕉并放入篮子”，而Gemini Robotics-ER则专注于“具身推理”，更易于与现有机器人控制系统集成。此次发布标志着机器人技术的一大进步，尤其是在处理复杂物理操作和泛化能力方面取得了显著提升，为未来更广泛的机器人应用铺平了道路，例如与Apptronik合作开发新一代人形机器人。但同时，谷歌也强调了安全的重要性，并发布了名为“ASIMOV”的数据集，用于评估机器人行为的安全隐患。