《科创板日报》2月16日讯(记者 黄心怡)除夕当天,阿里巴巴开源全新一代大模型千问Qwen3.5-Plus,总参数为3970亿,激活仅170亿,性能超过万亿参数的Qwen3-Max模型,部署显存占用降低60%,最大推理吞吐量可提升至19倍。Qwen3.5-Plus的API价格每百万Token低至0.8元,为Gemini 3 Pro的1/18。
与前几代的千问大语言模型不同,千问3.5从纯文本模型升级为多模态模型。千问3预训练在纯文本Tokens上进行,而千问3.5基于视觉和文本混合token上预训练,并新增中英文、多语言、STEM和推理等数据,以不到40%的参数量获得超万亿的Qwen3-Max基座模型的性能。
千问3.5在MMLU-Pro知识推理评测中得分87.8分,超越GPT-5.2;在博士级难题GPQA测评中斩获88.4分,高于Claude 4.5;在指令遵循IFBench以76.5分刷新所有模型纪录;而在通用Agent评测BFCL-V4、搜索Agent评测Browsecomp等基准中,千问3.5表现均超越Gemini 3 Pro、GPT-5.2。
在视频理解方面,千问3.5支持2小时(1M token上下文)的视频直接输入,适用于长视频内容分析与摘要生成。同时,千问3.5实现了视觉理解与代码能力的融合,结合图搜和生图工具,可将手绘界面草图直接转为可用的前端代码。
值得注意的是,在Agent应用方面,千问3.5可自主操作手机与电脑,在移动端支持更多主流APP与指令,在PC端可处理多步骤操作,如跨应用数据整理、自动化流程执行等。同时,千问团队构建了一个可扩展的Agent异步强化学习框架,端到端可加速3到5倍,并将插件式智能体Agent支持扩展至百万级规模。
据悉,千问APP、PC端已第一时间接入Qwen3.5-Plus模型。阿里很快将继续开源不同尺寸、不同功能的千问3.5系列模型。而性能更强的旗舰模型Qwen3.5-Max不久也将发布。
今年春节期间,国产大模型领域迎来密集发布潮。字节跳动的视频生成模型Seedance 2.0、智谱AI旗舰模型GLM-5、蚂蚁集团的全模态大模型 Ming-Flash-Omni 2.0、MiniMax 一代文本模型M2.5等相继发布。此外,DeepSeek,网页/APP正在测试新的长文本模型结构,支持1M(百万Token)上下文。
IDC中国研究经理孙振亚认为,大模型的能力正在从纯粹的生成式输出向智能体能力进化。各家模型厂商都在代码、多模态、长上下文和工具调用能力上做针对性的优化。“智能体落地毫无疑问是这一轮竞争的重点,甚至可以说是最核心的主线。”孙振亚称。