炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!
(转自:研报虎)
行业事件
DeepSeek于5月29日完成小版本升级,当前版本为DeepSeek-R1-0528(下称“新版R1”),官网、App及API均已同步更新。
深度思考能力提升:接近o3、Gemini-2.5-Pro
新版R1模型深度思考能力进一步提升:基座模型仍使用2024年12月发布的DeepSeek V3 Base,但在后训练过程中投入了更多算力,显著提升了模型的思维深度与推理能力。新版R1模型在数学、编程与通用逻辑等多个基准测评中位于国产模型领先水平,接近OpenAI o3、Gemini-2.5-Pro水平。其中在数学测试AIME2025中,新版R1准确率从旧版的70%提升至87.5%,平均每题使用的token数量从旧版的12K提升至23K,背后系模型在解题过程中进行了更为深入的思考,进而提升准确率。此外,用新版R1蒸馏后的思维链训练的Qwen3-8B表现也较为出色,在AIME 2024测试中仅次于新版R1,有望推动AI小模型的开发与应用。
文字处理能力提升:幻觉改善、写作优化
在文字处理及生成方面,新版R1进行持续优化:1)幻觉改善:针对“幻觉”问题进行优化,在改写润色、总结摘要、阅读理解等场景中,幻觉率降低了45-50%,能更有效地提供更为准确、可靠的结果;2)创意写作:针对议论文、小说、散文等文体实现进一步优化,能够输出篇幅更长、结构内容更为完整的长篇作品,同时呈现出更加贴近人类偏好的写作风格。
复杂任务处理能力提升:工具调用及代码水平增强
据新智元、机器之心及我们一手测评,新版R1在调用工具、编写代码等类Agent功能上也实现提升。如在“构建一个词评分系统”“将小球碰撞实验可视化”“在线生成游戏、网页”等需要较强的深度理解能力、代码能力的任务中,新版R1的表现显著优于旧版,且接近OpenAI o3、Claude-4-Sonnet等海外头部推理模型水平。
投资建议:强于大市
我们认为:1)模型角度看,自2025年初DeepSeek R1开源、性能居于全球前列,国产AI大模型和海外差距逐步缩小。此次新版R1发布虽然仅为版本更新,但在性能跑分及实际使用中均提升显著,关注DeepSeek下一代R2模型发布节奏。2)应用角度看,2025年系AI应用落地之年,而AIAgent作为AI应用的重要落地方向,已成为全球科技巨头的共识。其中海外市场,基于底层模型推理能力提升,Anthropic Claude、OpenAIGPT等头部应用逐步从chatbot向Agent形态进化,Cursor等专业Agent商业化进程加速;国内市场,腾讯、阿里巴巴、字节跳动等互联网大厂相继布局Agent类产品,有望基于模型能力提升以及国内广大C端用户生态,孵化全民级别的AI应用。关注头部企业Agent类产品发布节奏。建议关注AI模型&应用布局较早的公司:恺英网络、昆仑万维(维权)、巨人网络、盛天网络、奥飞娱乐、上海电影、美图公司。
风险提示:技术发展缓慢,AI应用落地缓慢,政策监管趋严的风险。
上一篇:诵林公家训 赢文创好礼