DeepSeek-V3 & R1 合体,快手开源 "Auto Think" 大模型
创始人
2025-06-04 17:10:58

IT之家 6 月 4 日消息,快手 Kwaipilot 团队近日开源了 KwaiCoder-AutoThink-preview 自动思考大模型,针对近期深度思考大模型存在的“过度思考”问题进行了深入研究。团队提出了一种全新的自动思考模型训练范式,同时基于传统强化学习算法(GRPO),提出了带有过程监督的强化学习方法 Step-SRPO,以进一步提升模型在复杂任务中的表现。

据介绍,该模型融合了“思考”和“非思考”能力,号称“DeepSeek-V3 & R1 合体”,具备根据问题难度自动切换思考形态的能力。通过进行这种思考形态训练,模型在多个“思考”和“非思考”评测榜单上均实现了性能提升,其中在部分代码和数学类的任务上,开启自动思考模式下的模型得分提升高达 20 分左右。官方表示,在部分榜单中,即使模型没有开启思考模式,受益于更优的推理形态,性能也有小幅上涨。

快手技术表示,Kwaipilot 未来将基于 preview 版本模型,进一步增强推理能力,支持更完善的思考中工具使用能力,也会将全部技术细节、训练方法开源。IT之家附模型开源地址:

相关内容

热门资讯

协助企业骗取退税超千万元 福州...   近日,国家税务总局福州市税务局稽查局依法查处一起涉税中介机构帮助代理企业骗取出口退税案件。该中介...
王柳君:航空航天科普“追光者”   气象员数年间华丽转身  王柳君:航空航天科普“追光者”  从一名气象员,到航空航天科普领域的公益...
屏西花园旧改项目进入攻坚冲刺阶... 在鼓楼区屏西片区,一场关于安居的“圆梦行动”正吹响战斗号角。记者18日从福州城投集团所属市城乡建总获...