超越Grok、Gemini，阶跃星辰开源语音模型登顶全球榜首_知识

创始人

2026-01-15 14:47:24

当地时间1月14日，据大模型评测榜单Artificial Analysis Speech Reasoning最新结果，中国大模型企业阶跃星辰的原生音频推理模型Step-Audio-R1.1登顶，超越Grok、Gemini、GPT-Realtime等。

该榜单是目前业界评估“原生语音模型”最权威的第三方基准之一，核心考量模型直接处理音频并进行复杂逻辑推理的能力，考察维度包括准确率、首包延迟等。

去年11月，阶跃星辰发布了Step-Audio-R1，可以在不增加额外时延的情况下，端到端理解语音内容。此次发布的Step-Audio-R1.1是R1的升级版，基于推理能力，R1.1不仅能准确识别声音，还可以捕捉到声音背后的情绪和心理状态、言外之意，并能基于环境音推导对物理世界的理解。

目前，阶跃星辰已开源该模型，chat模式也已搭载该模型核心，完整的实时语音API预计将于 2 月上线。（澎湃新闻记者秦盛）