DeepSeek-V3 & R1 合体，快手开源 "Auto Think" 大模型_知识

DeepSeek-V3 & R1 合体，快手开源 "Auto Think" 大模型

创始人

2025-06-04 17:10:58

IT之家 6 月 4 日消息，快手 Kwaipilot 团队近日开源了 KwaiCoder-AutoThink-preview 自动思考大模型，针对近期深度思考大模型存在的“过度思考”问题进行了深入研究。团队提出了一种全新的自动思考模型训练范式，同时基于传统强化学习算法（GRPO），提出了带有过程监督的强化学习方法 Step-SRPO，以进一步提升模型在复杂任务中的表现。

据介绍，该模型融合了“思考”和“非思考”能力，号称“DeepSeek-V3 & R1 合体”，具备根据问题难度自动切换思考形态的能力。通过进行这种思考形态训练，模型在多个“思考”和“非思考”评测榜单上均实现了性能提升，其中在部分代码和数学类的任务上，开启自动思考模式下的模型得分提升高达 20 分左右。官方表示，在部分榜单中，即使模型没有开启思考模式，受益于更优的推理形态，性能也有小幅上涨。

快手技术表示，Kwaipilot 未来将基于 preview 版本模型，进一步增强推理能力，支持更完善的思考中工具使用能力，也会将全部技术细节、训练方法开源。IT之家附模型开源地址：

上一篇：《藏海传》不仅是主角的成长史，也是肖战的

下一篇：纵览网丨Apple Filling 文件共享协议即将从 macOS 中彻底消失

DeepSeek-V3 & R1 合体，快手开源 "Auto Think" 大模型

相关内容

热门资讯