超越Grok、Gemini,阶跃星辰开源语音模型登顶全球榜首
创始人
2026-01-15 14:47:24

当地时间1月14日,据大模型评测榜单Artificial Analysis Speech Reasoning最新结果,中国大模型企业阶跃星辰的原生音频推理模型Step-Audio-R1.1登顶,超越Grok、Gemini、GPT-Realtime等。

该榜单是目前业界评估“原生语音模型”最权威的第三方基准之一,核心考量模型直接处理音频并进行复杂逻辑推理的能力,考察维度包括准确率、首包延迟等。

去年11月,阶跃星辰发布了Step-Audio-R1,可以在不增加额外时延的情况下,端到端理解语音内容。此次发布的Step-Audio-R1.1是R1的升级版,基于推理能力,R1.1不仅能准确识别声音,还可以捕捉到声音背后的情绪和心理状态、言外之意,并能基于环境音推导对物理世界的理解。

目前,阶跃星辰已开源该模型,chat模式也已搭载该模型核心,完整的实时语音API预计将于 2 月上线。(澎湃新闻记者 秦盛)

相关内容

热门资讯

城乡融合绘就和美乡村新图景 (来源:新华日报) □ 本报记者 许 愿 清晨,乡村广场上,几位老人正在健身器材上活动...
七国集团暂不动用战略石油储备 新华社巴黎3月9日电(记者崔可欣)七国集团成员国财政部长9日与国际能源署举行视频会议,讨论在必要时联...
锚定十五五 北京这样干 | “... 正在全国两会上审查讨论的“十五五”规划纲要草案20项主要指标中,民生福祉占了7项。就业、收入、教育、...
“鹤企云”平台发力 推动企业数... (来源:黑龙江日报)转自:黑龙江日报□张胜奎 唐荣 本报记者 孙铭阳获客能力提升20%以上,订单处理...
南侨食品续聘毕马威华振为202... 中访网数据  南侨食品集团(上海)股份有限公司董事会审计委员会发布对会计师事务所2025年度履职情况...