蚂蚁灵波开源世界模型LingBot-World,可交互长视频生成能力比肩Genie3
创始人
2026-01-29 11:48:58

钛媒体App 1月29日消息,蚂蚁灵波科技于1月29日正式开源发布世界模型LingBot-World,在视频质量、动态程度、长时一致性等关键指标上达到与Google Genie 3相当的水平。该模型突破性地实现了近10分钟的无损连续视频生成,有效解决了长时漂移问题。在交互性能方面,模型支持16FPS的生成吞吐,端到端延迟控制在1秒以内,用户可通过键盘、鼠标实时控制角色与视角,并利用文本指令触发环境变化。

此外,模型具备Zero-shot泛化能力,仅需输入单张真实照片或游戏截图即可生成可交互视频流。该技术为具身智能、自动驾驶等领域提供了高保真的数字训练环境,支持复杂长程任务的低成本模拟训练。目前模型权重及推理代码已面向社区开源。(广角观察)

相关内容

热门资讯

组图丨2026全球投资者大会在... 2026年5月28日上午,2026全球投资者大会在深圳举行,本次大会主题的主题是资本市场与创新成长—...
深圳市最新或2023(历届)夏... 全国征兵工作提前到8月1日开始。广大应征青年最关心的兵源去向日前也尘埃落定。 记者从深圳市政府征...
深圳市最新或2023(历届)征... 最新或2023(历届)夏季征兵已经正式启动,深圳市人民政府征兵办公室8月5日发布征兵体检地点及时间。...
台积电3纳米下半年涨价15%!...   今日(5月28日)午后,A股三大指数快速翻红,科技成长方向强势猛攻,覆盖创业板+科创板50只高成...
姜姓股民向ST长康发起索赔 张...   受损股民可至Hehson股民维权平台登记该公司维权:http://wq.finance.sina...