据“智元机器人”微信公众号23日消息,继今年1月AgiBot World具身智能百万真机数据集开源后,通用具身基座大模型GO-1(Genie Operator-1)当日在GitHub开源。这标志着全球首个采用Vision-Language-Latent-Action(ViLLA)架构的通用具身智能模型向全球开发者免费开放,将大大降低具身智能的技术门槛,推动行业快速发展。
公司称,GO-1采用的Vision-Language-Latent-Action(ViLLA)架构是具身智能领域的重大技术突破。与传统的Vision-Language-Action(VLA)架构相比,ViLLA通过引入隐式动作标记,成功弥合了图像-文本输入与机器人执行动作之间的语义鸿沟。这一创新使得机器人能够更好地理解人类意图,并将其转化为精确的动作执行。
公司表示,虽然GO-1仅基于AgiBot G1机器人数据进行预训练,但该模型已经在松灵机器人、方舟机器人、Franka机械臂等不同本体上进行了充分的验证测试。这些跨本体验证结果表明,GO-1具备良好的可移植性,能够适应不同机器人的运动学特性和控制接口。