全球最大开源视频生成模型国内首发 阶跃星辰上架阿里云魔搭社区
创始人
2025-02-21 13:20:27

每经杭州2月21日电(记者叶晓丹)在2月21日开幕的全球开发者大会(GDC)上,阿里云魔搭社区首发阶跃星辰最新开源的两款多模态模型,包括全球参数量最大的开源视频生成模型Step-Video-T2V,以及业界首款产品级开源语音交互模型Step-Audio。截至目前,魔搭社区已上架超过4万个开源模型,涵盖LLM、对话、语音、文生图、图生视频等多个领域,是中国最大的AI模型社区。

此次在魔搭社区开源的两款模型,是近期全球多模态领域最热门的开源模型。Step-Video-T2V是基于300亿参数的文本转视频预训练模型,能够生成高达204帧的视频,在指令遵循、运动平滑性、物理合理性、美感度等方面表现均显著超过市面上既有的开源视频模型。

另一款上架模型Step-Audio,是业界首个产品级开源语音模型,参数规模多达1300多亿。根据Llama Question等5大主流公开测试,Step-Audio模型性能均位列第一,并在HSK-6(汉语水平考试六级)的测评中表现尤佳。

每日经济新闻

相关内容

热门资讯

2025年度“中国科学十大进展... 今天(25日),国家自然科学基金委员会发布2025年度“中国科学十大进展”。嫦娥六号样品首次揭示月背...
数说“新”变化丨生态优先、绿色... 本文转自【天山网】; 据统计,新疆森林面积达1.25亿亩,森林覆盖率为5.07%。面对这笔宝贵的绿色...
科创001|财报数据创新高,小... 深圳商报·读创客户端首席记者 陈小慧 3月24日,小米发布了2025年Q4及全年财报。财报数据显示,...
“锅底洼”如何长成“梦里水乡”... 在江苏省泰州市兴化市,有这么一座乡村,它静卧在里下河湿地腹地,坐拥独有的垛田地貌,河网交织、湖荡密布...
​左海会客厅丨“星妈”张秀丽:...   左海会客厅丨近日,“星妈”张秀丽获评2025年“感动福建”十大人物。她为一群“星星”点亮了前行的...