阿里开源通义万相Wan2.1-VACE 助力视频生成与编辑
创始人
2025-05-15 22:20:09

【太平洋科技快讯】近日, 阿里巴巴宣布开源其全能型视频生成与编辑模型“通义万相 Wan2.1-VACE”。该模型功能全面,单一模型即可支持文生视频、图像参考视频生成、视频重绘、视频局部编辑、视频背景延展以及视频时长延展等全系列基础生成和编辑能力,号称目前业界功能最全面的视频生成与编辑模型之一。

通义万相 Wan2.1-VACE 的核心优势在于其强大的多功能性,它能够根据文字描述生成视频,也能基于静态图像生成动态视频。此外,该模型还支持对现有视频进行重绘,提升画面质量,并能对视频中的特定区域进行局部编辑。值得一提的是,它可以扩展视频背景,增加场景的深度和广度,还能延长视频的播放时间,使内容更加丰富。这些功能覆盖了视频创作从生成到编辑的各个环节,为创作者提供了极大的便利。

此次阿里巴巴此次开源了两个版本:1.3B 和 14B。其中,1.3B 版本针对消费级进行了优化,使得普通用户也能轻松运行。而 14B 版本则拥有更强大的性能,适合对计算资源要求较高的专业场景。

据悉,通义万相是阿里巴巴通义系列 AI 绘画创作大模型的一部分,最初于 2023 年 7 月 7 日上线,主要用于辅助图片创作。2024 年 9 月 19 日的阿里云栖大会上,通义万相视频生成大模型正式发布,标志着其正式进军视频生成领域。该模型不仅能够生成影视级高清视频,还具备较强的中文理解能力,能够更好地理解中文指令。

通义万相视频生成模型在今年 1 月初升级至 2.1 版,在处理复杂运动、还原真实物理规律、提升电影质感及优化指令遵循方面取得了显著进展。2 月 25 日,阿里巴巴宣布全面开源万相 2.1 模型,进一步推动了该模型的应用与普及。

相关内容

热门资讯

何晴版小乔成为其经典形象 (来源:河北新闻网)转自:河北新闻网 【#何晴版小乔成为...
国网甘肃电力全力应对雨雪降温天...   受强冷空气影响,12月11日起,甘肃出现大范围降温、降雪及大风沙尘天气,部分地区出现寒潮,全省自...
未满16岁禁止使用社交媒体,澳... 当地时间12月10日,澳大利亚正式实施了全球首个针对16岁以下青少年的社交媒体使用禁令,超百万澳大利...
宜宾白酒数字化转型入选国家级示... 1.宜宾白酒数字化转型入选国家级示范样本2.俩酒厂入选山西工业遗产名单3.洋河朗热酒村项目试运营4....
全国大范围回暖,陆续开启! 本文转自【新华社微信公众号】;全国大部进入雨雪稀少时段 大范围回暖开启眼下,寒潮影响趋于结束,今明两...