阿里开源通义万相Wan2.1-VACE 助力视频生成与编辑
创始人
2025-05-15 22:20:09

【太平洋科技快讯】近日, 阿里巴巴宣布开源其全能型视频生成与编辑模型“通义万相 Wan2.1-VACE”。该模型功能全面,单一模型即可支持文生视频、图像参考视频生成、视频重绘、视频局部编辑、视频背景延展以及视频时长延展等全系列基础生成和编辑能力,号称目前业界功能最全面的视频生成与编辑模型之一。

通义万相 Wan2.1-VACE 的核心优势在于其强大的多功能性,它能够根据文字描述生成视频,也能基于静态图像生成动态视频。此外,该模型还支持对现有视频进行重绘,提升画面质量,并能对视频中的特定区域进行局部编辑。值得一提的是,它可以扩展视频背景,增加场景的深度和广度,还能延长视频的播放时间,使内容更加丰富。这些功能覆盖了视频创作从生成到编辑的各个环节,为创作者提供了极大的便利。

此次阿里巴巴此次开源了两个版本:1.3B 和 14B。其中,1.3B 版本针对消费级进行了优化,使得普通用户也能轻松运行。而 14B 版本则拥有更强大的性能,适合对计算资源要求较高的专业场景。

据悉,通义万相是阿里巴巴通义系列 AI 绘画创作大模型的一部分,最初于 2023 年 7 月 7 日上线,主要用于辅助图片创作。2024 年 9 月 19 日的阿里云栖大会上,通义万相视频生成大模型正式发布,标志着其正式进军视频生成领域。该模型不仅能够生成影视级高清视频,还具备较强的中文理解能力,能够更好地理解中文指令。

通义万相视频生成模型在今年 1 月初升级至 2.1 版,在处理复杂运动、还原真实物理规律、提升电影质感及优化指令遵循方面取得了显著进展。2 月 25 日,阿里巴巴宣布全面开源万相 2.1 模型,进一步推动了该模型的应用与普及。

相关内容

热门资讯

春分节气如何调理身体?运动、饮... 今天是春分。一到春分,不少人都会有这种感觉,活动多了,胃口也变好了。在春分前后,气温慢慢回升,白天也...
摩根士丹利因卡塔尔液化天然气项... 格隆汇3月20日|由于导弹袭击损坏了卡塔尔拉斯拉凡液化天然气综合设施的 14 条生产线中的两条,扰乱...
春分巧遇“龙抬头”!本世纪仅有... 转自:新华社春分平昼夜,“苍龙”正“抬头”。3月20日将迎来一场罕见的天象巧合—— “龙抬头”与春分...
前2个月全国一般公共预算收入同... 财政部3月19日发布数据显示,今年前2个月,全国一般公共预算收入44154亿元,同比增长0.7%。数...
财政运行平稳开局 3月19日,财政部发布统计数据显示,前2个月,全国一般公共预算收入4.42万亿元,同比增长0.7%;...