DeepSeek-V3 & R1 合体,快手开源 "Auto Think" 大模型
创始人
2025-06-04 17:10:58

IT之家 6 月 4 日消息,快手 Kwaipilot 团队近日开源了 KwaiCoder-AutoThink-preview 自动思考大模型,针对近期深度思考大模型存在的“过度思考”问题进行了深入研究。团队提出了一种全新的自动思考模型训练范式,同时基于传统强化学习算法(GRPO),提出了带有过程监督的强化学习方法 Step-SRPO,以进一步提升模型在复杂任务中的表现。

据介绍,该模型融合了“思考”和“非思考”能力,号称“DeepSeek-V3 & R1 合体”,具备根据问题难度自动切换思考形态的能力。通过进行这种思考形态训练,模型在多个“思考”和“非思考”评测榜单上均实现了性能提升,其中在部分代码和数学类的任务上,开启自动思考模式下的模型得分提升高达 20 分左右。官方表示,在部分榜单中,即使模型没有开启思考模式,受益于更优的推理形态,性能也有小幅上涨。

快手技术表示,Kwaipilot 未来将基于 preview 版本模型,进一步增强推理能力,支持更完善的思考中工具使用能力,也会将全部技术细节、训练方法开源。IT之家附模型开源地址:

相关内容

热门资讯

50岁无子女?五分之一成年人面... 核心事件:针对美国无子女群体养老长期护理保障需求,梳理相关成本趋势与养老规划核心要求。关键数据:1....
如东县最新或2023(历届)计... 10月10日上午,如东县召开全县征兵工作会议,部署今年征兵工作,今年,如东县征集任务数为506人。 ...
宜兴市最新或2023(历届)征... 昨天,我市召开全市征兵工作会议,回顾我市去冬征兵工作情况,部署今冬征兵任务。市委常委、市人武部部长朱...
海安县最新或2023(历届)新...   11月1日是我县今冬征兵体检的第一天,首批来自大公镇的90多名应征青年在县人武部参加了体检。县委...
泰兴市最新或2023(历届)征...  9月29日下午,我市召开征兵工作会议。要求各乡镇(街道)、部门高标准做好征兵工作,确保圆满完成今年...