超越Grok、Gemini,阶跃星辰开源语音模型登顶全球榜首
创始人
2026-01-15 14:47:24

当地时间1月14日,据大模型评测榜单Artificial Analysis Speech Reasoning最新结果,中国大模型企业阶跃星辰的原生音频推理模型Step-Audio-R1.1登顶,超越Grok、Gemini、GPT-Realtime等。

该榜单是目前业界评估“原生语音模型”最权威的第三方基准之一,核心考量模型直接处理音频并进行复杂逻辑推理的能力,考察维度包括准确率、首包延迟等。

去年11月,阶跃星辰发布了Step-Audio-R1,可以在不增加额外时延的情况下,端到端理解语音内容。此次发布的Step-Audio-R1.1是R1的升级版,基于推理能力,R1.1不仅能准确识别声音,还可以捕捉到声音背后的情绪和心理状态、言外之意,并能基于环境音推导对物理世界的理解。

目前,阶跃星辰已开源该模型,chat模式也已搭载该模型核心,完整的实时语音API预计将于 2 月上线。(澎湃新闻记者 秦盛)

相关内容

热门资讯

出境支付更便捷!Visa宣布:... 每经编辑|许绍航     1月15日,Visa宣布,支持中国持卡人Apple Pa...
特朗普希望对伊朗发动快速 决定... 转自:财联社【特朗普希望对伊朗发动快速 决定性打击 不想陷入持久战泥潭】财联社1月15日电,据美媒1...
部分激光雷达价格降至千元级 业...   炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! (来源:财联社) 财...
两部门发文,事关企业年金 近日,人力资源社会保障部、财政部印发《关于进一步做好企业年金工作的意见》(以下简称《意见》)。《意见...
江西铜业:全资子公司与第一量子... 每经AI快讯,1月15日,江西铜业(600362.SH)公告称,公司全资子公司江铜香港投资的全资子公...