腾讯混元发布并开源HunyuanVideo 1.5 元宝上线生视频能力_知识

腾讯混元发布并开源HunyuanVideo 1.5 元宝上线生视频能力

创始人

2025-11-21 17:15:45

11月21日，腾讯混元大模型团队正式发布并开源HunyuanVideo 1.5。这是一款基于Diffusion Transformer（DiT）架构、参数为8.3B的轻量级视频生成模型，支持生成5至10秒的高清视频。目前，腾讯元宝最新版已上线该模型能力。

上证报中国证券网讯（记者谭镕）11月21日，腾讯混元大模型团队正式发布并开源HunyuanVideo 1.5。这是一款基于Diffusion Transformer（DiT）架构、参数为8.3B的轻量级视频生成模型，支持生成5至10秒的高清视频。目前，腾讯元宝最新版已上线该模型能力。用户可通过两种方式即可体验：一是输入文字描述（Prompt），直接实现“文生视频”；二是上传图片配合文字描述，将静态图片转化为动态视频。

此前，视频生成领域的开源SOTA旗舰模型至少有20B，需要超过50GB显卡方可部署。HunyuanVideo 1.5的出现大幅降低了硬件部署门槛，以极低的门槛就可以获得旗舰模型的体验，目前模型已上传至Hugging Face和Github社区。

据介绍，HunyuanVideo 1.5模型具备全面且强大的核心能力，支持中英文输入的文生视频与图生视频。模型还具备强指令理解与遵循能力，能够精准地实现多样化场景，包括运镜、流畅运动、写实人物和人物情绪表情等多种指令；同时支持写实、动画、积木等多种风格，并可在视频中生成中英文文字。在画质方面，模型可原生生成5至10秒时长的480p和720p高清视频，并可通过超分模型提升至1080p电影级画质。

同时，HunyuanVideo 1.5创新的SSTA稀疏注意力机制（全称Selective and Sliding Tile Attention, 选择性滑动分块注意力）在保证高质量生成的同时显著提升推理效率，配合多阶段渐进式训练策略，在运动连贯性、语义遵循等关键维度均达到商用水平。

腾讯元宝称，自上线以来，元宝不断拓展AI能力的边界，此次“一句话生视频”的上线，标志着元宝在多模态能力上迈出了关键一步，正式实现了从文本、图片、音频到视频的“图文音视”全模态覆盖。这不仅是元宝产品能力的升级，更让AI成为一个贴近用户的实用工具。

上一篇：谁懂啊！乌蒙深处每一帧都是屏保

下一篇：他们是父子，巍子演《唐诡2》，星二代王杍逸演《唐诡3去天尺五》

腾讯混元发布并开源HunyuanVideo 1.5 元宝上线生视频能力

相关内容

热门资讯