阶跃星辰联合吉利首次开源视频生成模型和语音模型
创始人
2025-02-18 20:19:32

2月18日,上海阶跃星辰智能科技有限公司发布消息称,公司与吉利汽车集团联合开源了两款阶跃 Step 系列多模态大模型——Step-Video-T2V 视频生成模型和 Step-Audio 语音模型。目前,已经可以在跃问 App 内体验。

据介绍,阶跃星辰是吉利汽车集团的科技生态战略合作伙伴。在两款大模型的研发过程中,双方展开了深度合作,在算力算法、场景训练等领域优势互补,显著增强了多模态大模型的性能表现。

“开源的初心,是希望跟大家分享最新的多模态大模型技术成果,为全球开源社区贡献一份来自中国的力量。”阶跃星辰介绍,根据技术报告中的评测结果,阶跃 Step-Video-T2V 的参数量和模型性能目前在全球开源视频生成领域都处于领先水平;而阶跃 Step-Audio 则是业内首款产品级的开源语音交互模型。

阶跃 Step-Audio能够根据不同的场景需求生成情绪、方言、语种、歌声和个性化风格的表达,能和用户自然地进行高质量对话。模型生成的语音具有自然流畅、情商高等特征,同时也能支持不同角色的音色克隆,满足影视娱乐、社交、游戏等行业场景下应用需求。

阶跃 Step-Video-T2V 模型的参数量达到 300 亿,可以直接生成 204 帧、540P 分辨率的高质量视频,这意味着能确保生成的视频内容具有极高的信息密度和强大的一致性。

文/北京青年报记者 宋霞

编辑/李涛

相关内容

热门资讯

从“周末愉快”到被判死缓,唐仁... ▲农业农村部原党组书记、部长唐仁健在忏悔。图/电视专题片《一步不停歇 半步不退让》部长组建了一个“周...
多地推动撤销“空壳学校” 澎湃新闻记者 岳怀让随着生源结构调整,多地编办近期推动对一些“空壳学校”进行撤并。2026年1月6日...
Windows 11预装软件减...   炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! (来源:快科技)快科...
川宁生物股东会通过2026年关... 中访网数据  伊犁川宁生物技术股份有限公司于2026年1月9日成功召开了2026年第一次临时股东会。...
最新或2023(历届)泰州市上... 最新或2023(历届)上班期间哺乳假规定,哺乳假工资待遇怎么算  最新或2023(历届)上班期间哺乳...