IBM watsonx.ai上线DeepSeek-R1蒸馏模型
创始人
2025-02-11 19:23:49

(全球TMT2025年2月11日讯)IBM日前宣布,DeepSeek-R1的Llama 3.1 8B和Llama 3.3 70b蒸馏版本现已在IBM的企业级AI开发平台watsonx.ai上提供。DeepSeek-R1是中国AI初创公司DeepSeek的推理大语言模型(LLM),被认为是世界上最强大的开源模型之一,通过在基础模型DeepSeek-V3上直接使用强化学习(RL)开发,并使用知识蒸馏技术微调多个Llama和Qwen模型。

IBM 通过“按需部署目录”在watsonx.ai中提供两种Llama蒸馏变体,允许用户部署专用实例进行安全推理。用户还可以使用自定义基础模型导入功能导入DeepSeek-R1模型的其他变体,如Qwen蒸馏模型。DeepSeek-R1以其卓越的推理能力支持广泛应用,包括规划、编码和数学问题解决等。开发人员可在watsonx.ai中使用DeepSeek-R1等已部署的模型和解决方案功能构建AI解决方案。

相关内容

热门资讯

志高机械:6月29日获融资买入... 6月29日,志高机械跌1.94%,成交额707.45万元。两融数据显示,当日志高机械获融资买入额48...
奥美森:6月29日获融资买入5... 6月29日,奥美森涨1.27%,成交额942.69万元。两融数据显示,当日奥美森获融资买入额53.5...
森麒麟:摩洛哥工厂未满产却要在... 投资者提问:董秘你好,本公司摩洛哥工厂还没满产 就要在欧洲快速建厂处于什么原因?董秘回答(森麒麟SZ...
南特科技:6月29日获融资买入... 6月29日,南特科技涨2.89%,成交额2748.04万元。两融数据显示,当日南特科技获融资买入额9...
美德乐:6月29日获融资买入6... 6月29日,美德乐跌1.83%,成交额2194.00万元。两融数据显示,当日美德乐获融资买入额68....