观看百万小时YouTube视频意外解决了机器人难题

2025-06-30
观看百万小时YouTube视频意外解决了机器人难题

研究人员通过训练名为V-JEPA 2的模型,观看了百万小时的YouTube视频,意外解决了机器人领域长期存在的难题。该模型通过预测视频中的下一个瞬间,而非下一个单词,学习理解物理世界。与以往依赖于语言监督的模型不同,V-JEPA 2能够在从未见过的环境中完成抓取和放置等复杂任务,展现了惊人的零样本泛化能力。虽然模型仍存在一些局限性,例如对摄像机位置敏感以及长时预测精度不足,但这项研究为机器人技术的发展带来了新的方向,预示着未来机器人可能具备与ChatGPT同等水平的理解能力。

阅读更多
AI