阿里巴巴发布新一代通义千问Qwen3 全球最强开源模型诞生
创始人
2025-04-29 11:48:02

今日凌晨,阿里巴巴正式推出新一代通义千问Qwen3系列模型,凭借卓越性能一举登顶全球最强开源模型。该系列涵盖多个版本,从Qwen3-0.6B到Qwen3-32B,以及更强大的MoE模型如Qwen3-30B-A3B和Qwen3-235B-A22B,参数规模从数亿至2350亿不等,支持上下文长度最高达128K。

Qwen3的最大亮点在于其“混合推理”能力,将“快思考”与“慢思考”集成于同一模型中,大幅降低算力消耗。用户可根据需求选择适合的思考模式:复杂问题可通过多步推理解决,简单问题则实现快速响应。此外,Qwen3支持119种语言,预训练数据量达36万亿个token,远超前代Qwen2.5。

阿里云还开源了六个Dense模型及两个MoE模型权重,进一步推动大模型技术的发展。据测试,Qwen3在代码、数学等领域表现优异,部分小模型性能甚至媲美更大规模的前代产品。这一突破为全球用户提供了更多高效、灵活的选择。

相关内容

热门资讯

省政协召开“双推”协商活动和打...   本报讯 记者陈思伊报道 3月20日,省政协以视频会议形式召开2026年度“双推”协商活动和打造“...
吃干榨尽一块磷 转自:贵州日报贵州磷化集团瓮福化工公司全景。(企业供图) 贵州日报天眼新闻记者 方亚丽3月初,黔南州...
传统矿业向新向智 转自:贵州日报毕节市黔西市青龙煤矿地面原煤生产系统。 贵州日报天眼新闻记者 金秋时 摄 2025年3...
市知识产权保护中心护航企业“出... (来源:沈阳日报)转自:沈阳日报  本报讯(沈阳日报、沈报全媒体记者岳雨)记者3月20日获悉,沈阳市...
微软大刀阔斧重组AI部门   炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! (来源:虎嗅APP)...