超越Grok、Gemini,阶跃星辰开源语音模型登顶全球榜首
创始人
2026-01-15 14:47:24

当地时间1月14日,据大模型评测榜单Artificial Analysis Speech Reasoning最新结果,中国大模型企业阶跃星辰的原生音频推理模型Step-Audio-R1.1登顶,超越Grok、Gemini、GPT-Realtime等。

该榜单是目前业界评估“原生语音模型”最权威的第三方基准之一,核心考量模型直接处理音频并进行复杂逻辑推理的能力,考察维度包括准确率、首包延迟等。

去年11月,阶跃星辰发布了Step-Audio-R1,可以在不增加额外时延的情况下,端到端理解语音内容。此次发布的Step-Audio-R1.1是R1的升级版,基于推理能力,R1.1不仅能准确识别声音,还可以捕捉到声音背后的情绪和心理状态、言外之意,并能基于环境音推导对物理世界的理解。

目前,阶跃星辰已开源该模型,chat模式也已搭载该模型核心,完整的实时语音API预计将于 2 月上线。(澎湃新闻记者 秦盛)

相关内容

热门资讯

一块田的变形记 □四川日报全媒体记者 张彧希/文 肖雨杨/图高标准农田建设  ●挖掘机铁臂挥舞,把零散高低田一块块“...
北京银行处置地产不良债权 涉富... (来源:经济参考报) 为有序推进不良资产化解,北京银行股份有限公司(简称“北京银行”,601169....
贵安樱花园旁200亩油菜花田迎... 转自:贵州日报与贵安樱花园隔湖相望的油菜花田。 本报讯 日前,与贵安樱花园隔湖相望的贵安新区...
市供销系统筑牢 粮食安全农资保... 转自:贵州日报 本报讯 3月9日,记者从贵阳市供销社获悉,今年以来,市供销社坚决扛牢农资市场...
同花顺拟豪派27.4亿现金并1... 中访网数据  浙江核新同花顺网络信息股份有限公司于2026年3月7日召开董事会会议,审议通过了202...