Kimi杨植麟称“训练成本很难量化”,仍将坚持开源策略
创始人
2025-11-11 19:45:12

北京时间11月11日,人工智能初创公司月之暗面Kimi CEO杨植麟等人在社交平台Reddit上解答网友提问,回应关于模型训练成本等问题。

Kimi近半年时间持续投入开源模型的研发与更新。11月6日发布了最新版本的开源思考模型Kimi K2 Thinking。彼时有消息称,Kimi K2 Thinking的训练成本为460万美元,低于DeepSeek V3模型的560万美元和OpenAI GPT-3的数十亿美元。

针对该数据,杨植麟在此次对话中回应称:(460万美元)不是官方数字,由于大部分投入都花在研究与实验上,因此训练成本很难量化。

网友也提出Kimi K2 Thinking推理长度过长、榜单成绩与实际体验不符等质疑,杨植麟表示现阶段该模型优先考虑绝对性能,token效率会在后续得到改善,榜单高分与实测的脱节问题也会在模型通用能力得到补齐后被逐渐消解。

当下,越来越多的中国开源大模型在国际市场中被调用。记者搜索OpenRouter模型调用榜单,最新一周内,排名前二十名的模型产品中,中国开源模型产品占五席,具体包括MiniMax M2、DeepSeek V3、GLM4.6、DeepSeek V3.1、DeepSeek V3.2 Exp。Kimi因OpenRouter平台接口问题,目前只能以API形式被使用。

持续的模型更新与庞大训练量需要算力资源支持,Kimi团队表示所使用的芯片是携带InfiniBand(一种面向高性能计算和AI训练的网络互连技术)的H800 GPU,性能虽然比不上美国的高端卡,数量也处于劣势,但每张卡都被用到了极致。

整体来看,月之暗面Kimi未来很长一段时间内仍将坚持开源策略,重点推进Kimi K2 Thinking模型的应用与优化。在优先文本模型前提下兼顾多模态模型推进,避开与OpenAI等头部厂商在AI浏览器等具体赛道的直接竞争,通过架构创新、开源策略与成本控制尝试建立差异化优势。

(本文来自第一财经)

相关内容

热门资讯

@西安人,明天早点出门! 西安中考将于6月20日至22日进行6月20日至22日,西安市初中学业水平考试将如期进行。为帮助广大考...
鼓点铿锵 粽香万里——赛龙舟等... 转自:新华社  新华社北京6月19日电 综合新华社驻外记者报道:龙舟劈波连四海,粽叶飘香越万山。连日...
舟山岱山用无人机巡检新生互花米... (来源:中国环境网)转自:中国环境网近日,浙江省舟山市岱山县数据服务中心无人机在例行巡检,发现双合至...
小县城里的大生意:安徽定远为世... 转自:中国新闻网中新网定远6月19日电(刘鸿鹤 韩苏原)2026年美加墨世界杯激战正酣,远在万里之外...
今晚,这条“金龙”在苏州刷屏了... 在苏州过端午究竟有多惊艳?今晚(6月19日)苏州相门前的护城河水域上演震撼一幕500米长的金龙巡游为...