阿里通义千问大模型Qwen3发布并开源
创始人
2025-04-29 17:14:51

4月29日,阿里巴巴通义千问发布新版Qwen3系列模型,包括2个MoE模型和6个dense模型。

通义千问表示,作为Qwen系列全新一代的混合推理模型,Qwen3在GPQA、AIME24/25、LiveCodeBench等多个权威评测中表现出极具竞争力的结果。在相同计算资源下,Qwen3模型以更小的规模实现了对更大体量上一代模型的超越,真正做到了“小而强大”。

Qwen3融合了推理与非推理能力,在逻辑分析和创意生成等任务中表现卓越。预训练数据量达到月36万亿 tokens,并通过多轮大规模强化学习与精细优化,在推理、工具调用、指令遵循及多语言能力等方面显著提升。

其中,Qwen3-235B-A22B表现尤为突出,刷新了开源模型的智能水平新高,显存占用仅为性能相近模型的三分之一。无论是数学推理、代码生成还是综合逻辑分析,Qwen3均展现出卓越能力,稳居全球开源模型前列。在工具调用方面表现优异,大幅降低了复杂任务的实现门槛,同时还支持119种语言,覆盖全球主要语种,满足多样化需求。

Qwen3引入了“思考模式”和“非思考模式”,使模型能够在不同场景下表现出最佳性能。在思考模式下,模型会进行多步推理和深度分析,类似于人类在解决复杂问题时的“深思熟虑”。在非思考模式下,模型优先追求响应速度和效率,适用于简单任务或实时交互。

相关内容

热门资讯

我国科学家首次发现水稻多年生“... (来源:黑龙江日报)转自:黑龙江日报新华社上海3月20日电(记者张建松 胡喆)“时雨及芒种,四野皆插...
“创赢未来”创业大赛黑龙江省选... (来源:黑龙江日报)转自:黑龙江日报本报讯(记者李播)近日,“创赢未来”2026创业大赛黑龙江省选拔...
“春风行动暨就业援助季”招聘活... (来源:黑龙江日报)转自:黑龙江日报 求职者在了解用人单位的需求。本报记者 苏强摄本报讯(记...
国际能源署的石油稳价术 随着中东局势骤然升温,全球能源市场开始剧烈波动。就在市场恐慌情绪蔓延之际,国际能源署(IEA)3月1...
双城农机“体检”忙 (来源:黑龙江日报)转自:黑龙江日报 检修播种机。 检修农机。本报记者 肖劲彪摄春回大地...