DeepSeek-V3 & R1 合体,快手开源 "Auto Think" 大模型
创始人
2025-06-04 17:10:58

IT之家 6 月 4 日消息,快手 Kwaipilot 团队近日开源了 KwaiCoder-AutoThink-preview 自动思考大模型,针对近期深度思考大模型存在的“过度思考”问题进行了深入研究。团队提出了一种全新的自动思考模型训练范式,同时基于传统强化学习算法(GRPO),提出了带有过程监督的强化学习方法 Step-SRPO,以进一步提升模型在复杂任务中的表现。

据介绍,该模型融合了“思考”和“非思考”能力,号称“DeepSeek-V3 & R1 合体”,具备根据问题难度自动切换思考形态的能力。通过进行这种思考形态训练,模型在多个“思考”和“非思考”评测榜单上均实现了性能提升,其中在部分代码和数学类的任务上,开启自动思考模式下的模型得分提升高达 20 分左右。官方表示,在部分榜单中,即使模型没有开启思考模式,受益于更优的推理形态,性能也有小幅上涨。

快手技术表示,Kwaipilot 未来将基于 preview 版本模型,进一步增强推理能力,支持更完善的思考中工具使用能力,也会将全部技术细节、训练方法开源。IT之家附模型开源地址:

相关内容

热门资讯

海北消防八招筑牢冬日防火墙 红门开放,群众走进消防救援站,沉浸式感受高原消防生活。科普教育基地常态化开放,为高原群众提供可持续、...
最新或2023(历届)北京生育...   生育保险基金合理结存量为相当于6至9个月待遇支付额。生育保险基金累计结余超过9个月的统筹地区,应...
北京生育保险待遇领取条件是哪些...  北京生育保险待遇领取条件是哪些,待遇标准是怎么样的,本文以图表的形式清晰的为您呈现。  生育保险领...
北京市流动人口婚育证明办理指南...  北京市规定,流动人口的外地成年育龄妇女必须在户籍地办理婚育证明,但办理人也可以委托老家亲戚代办。 ...
北京市生育服务证如何办理 办理...  北京市生育服务证办理流程指南  办理条件:北京市户口育龄夫妻(夫妻双方为北京户口或夫妻一方为北京户...