阿里(09988)通义千问推出新模型Qwen3-30B-A3B-Thinking-2507
创始人
2025-07-31 07:52:33
0

7月31日,阿里(09988)通义千问向大家介绍新模型Qwen3-30B-A3B-Thinking-2507,一个更睿智、更敏捷、更全能的新推理模型。目前,Qwen3-30B-A3B-Thinking-2507已在魔搭社区、HuggingFace上开源。

相较于4月29日开源的Qwen3-30-A3B模型,新模型在推理能力、通用能力及上下文长度上有了显著提升:

数学超强,代码贼溜:新模型在聚焦数学能力的AIME25评测中斩获85.0的高分,在代码能力测试LiveCodeBench v6中得分66.0,两项核心推理能力均超越Gemini2.5-Flash(thinking)、Qwen3-235B-A22B(thinking);新模型的知识水平(GPQA、MMLU-Pro)也较上一版本进步显著。

善解人意,全面升级:在写作(WritingBench)、Agent能力(BFCL-v3)、多轮对话和多语言指令遵循(MultiIF)等通用能力评测中,Qwen3-30B-A3B-Thinking-2507均超越Gemini2.5-Flash(thinking)、Qwen3-235B-A22B(thinking)。

更长的上下文理解:原生支持256K tokens,可扩展至1M tokens。

此外,新模型的思考长度(thinking length)也增加了,推荐在高度复杂的推理任务中设置更长的思考预算,以充分发挥它的潜力。

相关内容

热门资讯

毕业实习物流企业物流操作员实习... 一.实习目的  结合两年系统的物流理论的学习,对物流的定义、基本功能、各个作业流程有了一定的理论基础...
师范生幼儿园教师教育实习工作实...  实习是我们师范生即将踏上漫漫人生征途的标志,是人生的另一个起点,对我们的生涯规划有着重要的意义。但...
多只绩优量化基金开启限购   在业绩、规模双增长后,多只绩优量化产品开始集中限购。近日,国金基金旗下产品接连限购,申购限额已调...
大学生顶岗实习周记总结范文 幼... 顶岗实习的生活也就过去了近四分之三了,而刚过去的十一月份确实让我们感觉到了累,因为这一个月之内我们做...
城中区:多彩夏令营开启暑假新模... 本报讯(记者 衣凯玥)为进一步丰富少先队员们的假期生活,强化少年儿童法治教育,引导少先队员厚植爱党、...