炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!
(来源:21世纪经济报道)
21世纪经济报道记者 孙燕
大模型正从专用走向通用。
7月28日晚间,智谱发布新一代旗舰模型GLM-4.5,并在Hugging Face与Model Scope平台同步开源。
其综合能力达到开源SOTA级:综合MMLU Pro、AIME 24、MATH 500等12个基准性能测试的平均分来看,GLM-4.5取得了全球模型第三、国产模型第一、开源模型第一的成绩。
而GLM-4.5参数量仅为DeepSeek-R1的1/2、Kimi-K2的1/3,之所以在多项标准基准测试中表现得更为出色,是因为GLM模型具有更高的参数效率。
调用价格方面,GLM-4.5系列的定价也远低于主流模型:API调用价格低至输入0.8元/百万tokens,输出2元/百万tokens。
值得一提的是,智谱首款SOTA(state of the art,是指在特定任务中目前表现最好的方法或模型)级原生智能体大模型,原生融合了推理、编码和智能体能力。
同样在7月,阿里云发布通义千问AI编程大模型Qwen3-Coder,阶跃星辰发布新一代基础大模型Step 3,均集成了推理、代码生成、智能体等能力。
民生证券研究指出,当前全球多模态AI正在向“多模态通才”转变,专家型模型逐渐走向支持多任务的通才和具备任务级协同能力的通才模式。
此前,智谱已经有推理大模型GLM-Z1-Air和GLM-Z1-Flash,代码大模型CodeGeeX-4,智能体模型AutoGLM等。此次推出的GLM-4.5,首次在单个模型中实现推理、编码和智能体能力原生融合。
此前在7月初,智谱CEO张鹏在智谱开放平台产业生态大会上演示大模型编写PPT、生成小游戏的能力时,也多次强调“原生”这一关键词。“这完全由模型原生生成,没有附加其他功能、第三方软件和工作流。大模型在持续叠加越来越多的能力。”
有业内人士指出,推理能力和智能体能力的融合,会带来规划能力更强的智能体;代码能力和智能体能力本身便高度融合。三种能力的融合,有助于构建一个以模型为主体的智能体。
“如今大模型的能力越来越多样化,有文本类的、推理类的、工具类的,还有专门处理代码任务的,但它们大多都‘偏科’,比如OpenAI的o系列模型最擅长推理,Anthropic的Claude则特别精通代码。”智谱相关负责人向21世纪经济报道记者表示,大模型的下一个范式,一定是把各种能力整合到一起,成为一个‘全优生’,就像人一样,越来越通用,这才是实现AGI的必要条件。
其进一步指出,融合能力最大的意义在于让AI从擅长做一件事变成擅长做多件事,也是让AI越来越通用、越来越像人,能解决人的更多问题。“OpenAI的GPT-5也是这个方向。”
据测试,GLM-4.5在推理、代码和智能体能力上均达到开源模型的最高水平,其中推理能力位列开源模型第二。
尽管同时集成推理、代码、智能体等能力,但阿里Qwen3-Coder侧重于代码任务、阶跃星辰Step 3定位为原生多模态推理模型,智谱GLM-4.5则是专为智能体应用打造的基础模型。
GLM-4.5发布当晚,张鹏在朋友圈表示,“GLM上新!全面进入智能体基座时代!”
智谱对外表示,GLM-4.5首次在单个模型中实现将推理、编码和智能体能力原生融合,是为了满足智能体应用的复杂需求。
在智谱演示的模型原生Agent场景中,GLM-4.5做出了能搜索的搜索引擎、能发弹幕的B站、能发博的微博。此外,GLM-4.5系列还能胜任全栈开发任务,编写复杂应用、游戏、交互网页。
在此背后,是模型原生具备的在前端编写网站、在后端进行数据库管理,以及通过工具调用接口支持任意的智能体应用等能力。
前述业内人士指出,智能体包括以Coding(编码)为核心的智能体、基于UI(用户界面)的视觉识别智能体。GLM-4.5属于前者,比较擅长处理与Coding有关的任务。“如今万物都可Coding,智能体基座最成熟的应用场景还是接入Coding Agent(编码智能体)。”
在Agent Coding场景中,通过Claude Code与Claude-4-Sonnet、Kimi-K2、Qwen3-Coder等模型进行对比测试,GLM-4.5相对其他开源模型展现出竞争优势,特别在工具调用可靠性和任务完成度方面表现突出。尽管GLM-4.5相比Claude-4-Sonnet仍有提升空间,但在大部分场景中可以实现平替的效果。
7月29日,Rokid Glasses、智联招聘、脉脉、Lovart中国版“星流”、沉浸式翻译、Flowith等均宣布即将接入GLM-4.5。
智谱还预告:Vibe coding模式即将推出。该模式由OpenAI联合创始人Andrej Karpathy提出,其核心思想是通过自然语言提示驱动AI生成代码,从而减少手动编码的需求。这意味着,未来开发者只需用自然语言描述需求,AI即可生成相应的代码。
“AI越来越多地从后台走向前台,早期AI能力是藏在后台的功能模块,比如说理解一句话、调起一个命令、唤醒一个音像,用户对它的感知没有那么明显。到后来,出现了类似于ChatGPT的Copilot伴随式模型,以及智能体应用AI Native的Agent。未来AI会下沉到中间层、底层,像操作系统一样接管所有的硬件、软件、数据,你只需要通过跟ALM(大模型操作系统)进行自然语言层面的交互,它就能帮你调度底层能力,完成更多任务。”张鹏在此前的演讲中畅想道。