阿里巴巴:Qwen3 登顶全球最强开源模型 性能卓越
创始人
2025-04-29 12:45:45

【4 月 29 日凌晨,阿里巴巴开源新一代通义千问模型 Qwen3】Qwen3 参数量仅为 DeepSeek-R1 的 1/3,成本大幅下降,性能全面超越 R1、OpenAI-o1 等全球顶尖模型,登顶全球最强开源模型。 它是国内首个“混合推理模型”,将“快思考”与“慢思考”集成,对简单需求可低算力“秒回”,对复杂问题能“深度思考”,节省算力消耗。 热门模型中只有千问 3 等少数能做到“混合推理”,其设计和训练难度远超单纯推理模型。 Qwen3 采用混合专家架构,总参数量 235B,激活仅需 22B,预训练数据量达 36T,在多项评测中表现出色。 其部署成本大幅下降,提供丰富模型版本,为智能体和大模型应用爆发提供更好支持,原生支持 MCP 协议,具备工具调用能力。 阿里通义已开源 200 余个模型,全球下载量超 3 亿次,千问衍生模型数超 10 万个,成全球第一开源模型。

相关内容

热门资讯

省政协召开“双推”协商活动和打...   本报讯 记者陈思伊报道 3月20日,省政协以视频会议形式召开2026年度“双推”协商活动和打造“...
吃干榨尽一块磷 转自:贵州日报贵州磷化集团瓮福化工公司全景。(企业供图) 贵州日报天眼新闻记者 方亚丽3月初,黔南州...
传统矿业向新向智 转自:贵州日报毕节市黔西市青龙煤矿地面原煤生产系统。 贵州日报天眼新闻记者 金秋时 摄 2025年3...
市知识产权保护中心护航企业“出... (来源:沈阳日报)转自:沈阳日报  本报讯(沈阳日报、沈报全媒体记者岳雨)记者3月20日获悉,沈阳市...
微软大刀阔斧重组AI部门   炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! (来源:虎嗅APP)...