IBM watsonx.ai上线DeepSeek-R1蒸馏模型
创始人
2025-02-11 19:23:49
0

(全球TMT2025年2月11日讯)IBM日前宣布,DeepSeek-R1的Llama 3.1 8B和Llama 3.3 70b蒸馏版本现已在IBM的企业级AI开发平台watsonx.ai上提供。DeepSeek-R1是中国AI初创公司DeepSeek的推理大语言模型(LLM),被认为是世界上最强大的开源模型之一,通过在基础模型DeepSeek-V3上直接使用强化学习(RL)开发,并使用知识蒸馏技术微调多个Llama和Qwen模型。

IBM 通过“按需部署目录”在watsonx.ai中提供两种Llama蒸馏变体,允许用户部署专用实例进行安全推理。用户还可以使用自定义基础模型导入功能导入DeepSeek-R1模型的其他变体,如Qwen蒸馏模型。DeepSeek-R1以其卓越的推理能力支持广泛应用,包括规划、编码和数学问题解决等。开发人员可在watsonx.ai中使用DeepSeek-R1等已部署的模型和解决方案功能构建AI解决方案。

相关内容

热门资讯

最新或2023(历届)跑出一片... 《跑出一片天》主要讲述一个小男孩在追求跑步梦想的路上,突破重重的困难阻碍,坚持追梦的故事。 下面是跑...
最新或2023(历届)关于励志... 《跑出一片天》是个不错的国产儿童励志片,贴近生活取悦大众,传递无限信心正能量。下面是太阳教育网提供的...
国务院国资委已着手启动新的国资... (来源:新基建投融圈)当前,国资国企改革站在了完成三年攻坚任务与谋划下阶段改革的新历史交汇点。按照计...
最新或2023(历届)黄冈中学... 太阳教育网为大家整理了最新或2023(历届)湖北省中小学暑假放假时间安排表,最新或2023(历届)湖...
体检10年未预警却患癌症,每年... 新民晚报 图近日,北京张女士称在爱康国宾体检 10 年未能查出患癌风险,这一相关话题引发广泛关注。2...