阿里通义千问大模型Qwen3发布并开源
创始人
2025-04-29 17:14:51

4月29日,阿里巴巴通义千问发布新版Qwen3系列模型,包括2个MoE模型和6个dense模型。

通义千问表示,作为Qwen系列全新一代的混合推理模型,Qwen3在GPQA、AIME24/25、LiveCodeBench等多个权威评测中表现出极具竞争力的结果。在相同计算资源下,Qwen3模型以更小的规模实现了对更大体量上一代模型的超越,真正做到了“小而强大”。

Qwen3融合了推理与非推理能力,在逻辑分析和创意生成等任务中表现卓越。预训练数据量达到月36万亿 tokens,并通过多轮大规模强化学习与精细优化,在推理、工具调用、指令遵循及多语言能力等方面显著提升。

其中,Qwen3-235B-A22B表现尤为突出,刷新了开源模型的智能水平新高,显存占用仅为性能相近模型的三分之一。无论是数学推理、代码生成还是综合逻辑分析,Qwen3均展现出卓越能力,稳居全球开源模型前列。在工具调用方面表现优异,大幅降低了复杂任务的实现门槛,同时还支持119种语言,覆盖全球主要语种,满足多样化需求。

Qwen3引入了“思考模式”和“非思考模式”,使模型能够在不同场景下表现出最佳性能。在思考模式下,模型会进行多步推理和深度分析,类似于人类在解决复杂问题时的“深思熟虑”。在非思考模式下,模型优先追求响应速度和效率,适用于简单任务或实时交互。

相关内容

热门资讯

“罐”军是如何炼成的 □本报记者 康亚飞 全球每10个易拉罐罐体,就有1个产自巩义;国内每3个罐盖,也有1个来自巩义。 党...
《自然》:中国在近90%关键技... 观点网讯:12月14日,根据《自然》杂志报道,中国在近90%的关键技术领域处于全球领先地位。独立智库...
突发!300551,控制权变更...   炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!   12月13日,古...
国家税务总局:持续深化违规招商... 国家税务总局召开党委扩大会议,传达学习中央经济工作会议精神。会议强调,全国税务系统要准确把握中央关于...
2025房地产业人工智能大会举... 12月12日,由中国房地产业协会主办,上海克而瑞信息技术有限公司、北京中房研协技术有限公司协办,中国...