全球最大开源视频生成模型国内首发 阶跃星辰上架阿里云魔搭社区
创始人
2025-02-21 13:20:27

每经杭州2月21日电(记者叶晓丹)在2月21日开幕的全球开发者大会(GDC)上,阿里云魔搭社区首发阶跃星辰最新开源的两款多模态模型,包括全球参数量最大的开源视频生成模型Step-Video-T2V,以及业界首款产品级开源语音交互模型Step-Audio。截至目前,魔搭社区已上架超过4万个开源模型,涵盖LLM、对话、语音、文生图、图生视频等多个领域,是中国最大的AI模型社区。

此次在魔搭社区开源的两款模型,是近期全球多模态领域最热门的开源模型。Step-Video-T2V是基于300亿参数的文本转视频预训练模型,能够生成高达204帧的视频,在指令遵循、运动平滑性、物理合理性、美感度等方面表现均显著超过市面上既有的开源视频模型。

另一款上架模型Step-Audio,是业界首个产品级开源语音模型,参数规模多达1300多亿。根据Llama Question等5大主流公开测试,Step-Audio模型性能均位列第一,并在HSK-6(汉语水平考试六级)的测评中表现尤佳。

每日经济新闻

相关内容

热门资讯

马来西亚为大熊猫“辰星”“晓月... 经济观察网 据央视新闻客户端消息,10日,马来西亚政府在吉隆坡国家动物园为两只中国大熊猫“辰星”(“...
三个关键词,看民营经济活力迸发 卫星能有多轻?在星众空间(嘉兴)科技股份有限公司工厂,重量最轻的卫星仅20公斤,性能却不打折扣。“微...
“十四五”青海搜集整理出版《格... 中新社西宁1月10日电 (李隽)记者10日从青海省格萨尔史诗保护研究中心获悉,“十四五”时期,青海省...
美委联合行动把“Minerva... 格隆汇1月10日|委内瑞拉石油部及委内瑞拉国家石油公司(PDVSA)发布声明称,委内瑞拉和美国把“M...
最新或2023(历届)陕西省大... 全省卫生计生工作会议昨日召开,今年陕西省将探索试点建设城乡一体的大病保障制度,在新农合、城镇居民和职...