谷歌DeepMind发布Gemini机器人AI模型,赋能灵活精准的机器人控制
2025-03-12
谷歌DeepMind发布了两个用于控制机器人的全新AI模型:Gemini Robotics和Gemini Robotics-ER。这两个模型基于Gemini 2.0大语言模型,增加了视觉-语言-动作(VLA)能力和强化空间理解能力,使机器人能够更有效、更精细地理解和与物理世界互动。Gemini Robotics能够理解自然语言指令并执行相应的动作,例如“拿起香蕉并放入篮子”,而Gemini Robotics-ER则专注于“具身推理”,更易于与现有机器人控制系统集成。此次发布标志着机器人技术的一大进步,尤其是在处理复杂物理操作和泛化能力方面取得了显著提升,为未来更广泛的机器人应用铺平了道路,例如与Apptronik合作开发新一代人形机器人。但同时,谷歌也强调了安全的重要性,并发布了名为“ASIMOV”的数据集,用于评估机器人行为的安全隐患。
AI