阶跃星辰联合吉利首次开源视频生成模型和语音模型
创始人
2025-02-18 20:19:32
0

2月18日,上海阶跃星辰智能科技有限公司发布消息称,公司与吉利汽车集团联合开源了两款阶跃 Step 系列多模态大模型——Step-Video-T2V 视频生成模型和 Step-Audio 语音模型。目前,已经可以在跃问 App 内体验。

据介绍,阶跃星辰是吉利汽车集团的科技生态战略合作伙伴。在两款大模型的研发过程中,双方展开了深度合作,在算力算法、场景训练等领域优势互补,显著增强了多模态大模型的性能表现。

“开源的初心,是希望跟大家分享最新的多模态大模型技术成果,为全球开源社区贡献一份来自中国的力量。”阶跃星辰介绍,根据技术报告中的评测结果,阶跃 Step-Video-T2V 的参数量和模型性能目前在全球开源视频生成领域都处于领先水平;而阶跃 Step-Audio 则是业内首款产品级的开源语音交互模型。

阶跃 Step-Audio能够根据不同的场景需求生成情绪、方言、语种、歌声和个性化风格的表达,能和用户自然地进行高质量对话。模型生成的语音具有自然流畅、情商高等特征,同时也能支持不同角色的音色克隆,满足影视娱乐、社交、游戏等行业场景下应用需求。

阶跃 Step-Video-T2V 模型的参数量达到 300 亿,可以直接生成 204 帧、540P 分辨率的高质量视频,这意味着能确保生成的视频内容具有极高的信息密度和强大的一致性。

文/北京青年报记者 宋霞

编辑/李涛

相关内容

热门资讯

7月19日新闻早知道丨昨夜今晨... 转自:北京日报客户端▶ 已进驻6省区市!二十届中央第六轮巡视陆续进驻根据党中央关于巡视工作的统一部署...
夏天床单换成它!丝滑、凉感、真... 天丝四件套,A类标准,现只要99元到手四件!来看一段开箱视频(月落竹影系列包装),高端品质四件套,入...
高温持续!7省区市气温将超37... 中央气象台7月19日06时继续发布高温黄色预警:预计7月19日白天,新疆大部、陕西关中地区、山西西南...
中银证券中高等级债券季报解读:... 中银证券中高等级债券型证券投资基金2025年第2季度报告已发布,以下将对报告中的关键数据进行详细解读...
东财中证光伏指数发起式季报解读... 2025年第二季度,东财中证光伏指数发起式基金呈现出份额增长但净值下滑的态势。报告期内,该基金份额总...