本报讯(记者 孙奇茹)7月28日晚,总部位于北京的清华系大模型企业智谱发布其新一代旗舰大模型GLM-4.5。这个专为智能体应用打造的基础模型,在复杂推理、代码生成及智能体交互等通用能力上,实现了能力融合与技术突破,综合测试性能已跻身全球领先行列。
“衡量AGI(通用人工智能)的第一性原理,是在不损失原有能力的前提下融合更多通用智能能力,GLM-4.5是我们对此理念的首次完整呈现。”智谱相关负责人介绍,GLM-4.5首次在单个模型中实现将推理、编码和智能体能力原生融合,以满足智能体应用的复杂需求。
业内人士分析,这款新模型的发布,代表了AI迈向通用人工智能的一次重要转变。它不再满足于扮演一个被动回答问题的“聊天机器人”,而是要成为能够理解复杂目标、自主规划并执行多步骤任务的“全优生”。例如,模型能够胜任全栈开发任务,一键生成较为复杂的应用、游戏、交互网页。在实际例子中,用户通过z.ai使用该模型时,仅用一句简单的指令,就可让GLM-4.5独立开发出具备搜索功能的“谷歌”网站、可以发弹幕的“B站”,甚至直接上线一个完整的“Flappy Bird”小游戏。
在性能评估中,GLM-4.5的表现展示了其架构优势:在涵盖研究生水平推理和复杂软件工程解题等12项全球公认的硬核测试中,其综合得分位列全球第三,在所有国产模型和开源模型中均排名第一。GLM-4.5系列在成本和效率上也实现了突破:API调用价格低至输入价格为0.8元/百万tokens(大模型处理文本的基本单位),输出价格为2元/百万tokens,大幅低于目前主流的模型定价。
发布后不到两个小时,GLM-4.5模型就引发了不少国际媒体关注,发布后不到12小时,其已位列国际开源社区Hugging-Face榜单全球第二。
国际社交媒体X平台就在首页推荐了这款中国大模型。美国消费者新闻与商业频道CNBC报道称:“中国企业正在研发的人工智能模型不仅智能化水平提升,使用成本也持续降低,这与深度求索(DeepSeek)当年震动市场的突破核心优势相呼应。”彭博社表示,OpenAI的挑战者智谱发布开源模型,试图在这个蓬勃发展的行业中抢占制高点。