阿里通义千问大模型Qwen3发布并开源
创始人
2025-04-29 17:14:51

4月29日,阿里巴巴通义千问发布新版Qwen3系列模型,包括2个MoE模型和6个dense模型。

通义千问表示,作为Qwen系列全新一代的混合推理模型,Qwen3在GPQA、AIME24/25、LiveCodeBench等多个权威评测中表现出极具竞争力的结果。在相同计算资源下,Qwen3模型以更小的规模实现了对更大体量上一代模型的超越,真正做到了“小而强大”。

Qwen3融合了推理与非推理能力,在逻辑分析和创意生成等任务中表现卓越。预训练数据量达到月36万亿 tokens,并通过多轮大规模强化学习与精细优化,在推理、工具调用、指令遵循及多语言能力等方面显著提升。

其中,Qwen3-235B-A22B表现尤为突出,刷新了开源模型的智能水平新高,显存占用仅为性能相近模型的三分之一。无论是数学推理、代码生成还是综合逻辑分析,Qwen3均展现出卓越能力,稳居全球开源模型前列。在工具调用方面表现优异,大幅降低了复杂任务的实现门槛,同时还支持119种语言,覆盖全球主要语种,满足多样化需求。

Qwen3引入了“思考模式”和“非思考模式”,使模型能够在不同场景下表现出最佳性能。在思考模式下,模型会进行多步推理和深度分析,类似于人类在解决复杂问题时的“深思熟虑”。在非思考模式下,模型优先追求响应速度和效率,适用于简单任务或实时交互。

相关内容

热门资讯

商务部:将20家日本实体列入出... 根据《中华人民共和国出口管制法》和《中华人民共和国两用物项出口管制条例》等法律法规有关规定,为维护国...
电梯困人应急演练 安全课堂搬进...   地铁站开展电梯困人应急演练。  6月28日,福州地铁2号线鼓山站开展电梯困人实景应急演练暨特种设...
政产学研金服用齐聚高新区!这场... 近日,全国高校区域技术转移转化中心(福建)新型功能材料分中心(以下简称“分中心”)成功举办科技成果直...
AI主动推荐楼盘——揭秘“被动... 传统房产线上营销,一直处于被动获客状态,房企花钱投放广告、优化搜索排名,苦苦等待购房者主动点击浏览。...
“夏天第一豆”远销海外 连江毛豆正丰收上市。  毛豆有“夏天第一豆”的美誉。眼下,连江6000多亩毛豆陆续上市,不仅丰富了市...