财联社6月12日讯(编辑 牛占林)美东时间周三,Meta推出了一款新的开源模型V-JEPA 2,可以让人工智能更好地理解3D环境并推理物理世界的运作规律。
Meta声称,V-JEPA 2是一款世界模型,可以帮助机器人和其他人工智能主体理解物理世界,并预测物理世界将如何对它们的行动做出反应。
据悉,这种被称为世界模型的系统从物理世界的逻辑中汲取灵感,并按照现实世界的规则构建内部虚拟环境,从而让人工智能能够以更接近人类的方式进行学习、规划和决策。
Meta表示,V-JEPA 2是一个拥有12亿参数的模型,经过了超过100万小时的视频训练,在物理世界中实现了最先进的视觉理解和预测性能。
例如,在Meta的新模型中,V-JEPA 2可以识别从桌子上滚下来的球会掉下来,或者隐藏在视野之外的物体不会消失。
Meta认为V-JEPA 2在自动驾驶汽车和送货机器人等方面的应用具有很多优势,因为它们需要在复杂多变的环境中安全地工作。
与依赖大量标记数据或视频片段的模型不同,V-JEPA 2通过简化后的“潜在空间”进行推理,以理解物体是如何移动、相互作用以及如何响应的。
根据Meta的说法,V-JEPA 2比英伟达的Cosmos模型快30倍,后者也试图发展与物理世界相关的人工智能。然而,Meta可能会根据不同于英伟达的基准来评估自己的模型。
Meta首席人工智能科学家Yann LeCunn声称,让机器理解物理世界与让它们理解语言是截然不同的。“世界模型提供了一个虚拟的、简化版的现实世界,人工智能可以参考它来理解世界,预测其行为的后果,因此它将能够计划一个行动方案来完成给定的任务。”
LeCunn补充说:“我们相信,世界模型将为机器人技术开启一个新时代,让现实世界中的人工智能助手能够在不需要海量训练数据的情况下,帮助人们完成家务和体力劳动。”