Anthropic指控中国AI公司违规蒸馏Claude,RLHF专家Lambert反驳:中国AI成功不靠走捷径
创始人
2026-02-25 21:24:15

Anthropic指控DeepSeek、月之暗面、MiniMax三家公司通过约2.4万个虚假账号违规蒸馏Claude模型,生成超过1600万次对话用于训练自家模型,引发行业热议。RLHF领域专家Nathan Lambert对此指出,中国AI公司的成功并非靠走捷径,而是依赖扎实的基础设施建设和持续的技术创新。

Lambert将三家公司的情况分别分析,认为DeepSeek涉及的15万次交互量级极小,更像是内部实验而非系统性行为。月之暗面涉及340万次交互,集中在智能体推理、工具调用等Claude核心能力方向。MiniMax规模最大,约1300万次,目标为代理编码和复杂任务编排。月暗与MiniMax合计约1650万次,估算token成本达数百万美元。

Lambert强调蒸馏存在明显天花板,真正顶级的模型能力依赖强化学习而非简单模仿。他指出,模型需要通过自主探索、试错迭代来获得解题路径,这是蒸馏无法提供的。不同模型间的数据分布差异也让蒸馏效果大打折扣,需要大量工程优化才能发挥作用。

值得注意的是,Anthropic自身深陷版权争议。该公司曾被曝以破坏性方式扫描全球书籍,从盗版网站下载大量侵权内容,最终支付15亿美元和解金。马斯克公开批评Anthropic大规模窃取训练数据却指控他人。这种双重标准让Anthropic的指控显得缺乏说服力。

Lambert认为,Anthropic此时公开点名中国公司,技术防御并非首要动机,更像是向美国国防部递交的投名状。此前美国防部刚威胁Anthropic配合提供不受限制的使用权限,否则将其标记为供应链危险。这种选择性执法暴露了其地缘政治考量。

业内普遍认为,蒸馏能帮助模型快速入场,但要达到顶级水平必须依靠自主的强化学习训练。DeepSeek、月之暗面、MiniMax均具备完善的基础设施和优秀人才,绝非仅靠小聪明企图弯道超车的小作坊。Anthropic提出的蒸馏争议,折射出AI行业在规则模糊地带快速行动后,面临规则收紧时的复杂博弈。(爱范儿)

相关内容

热门资讯

Linux 7.0发布 Lin... 快科技2月25日消息,Linux内核7.0-rc1首个候选版本已正式发布,Linus Torvald...
人为何会暴饮暴食、发胖?这位教... 20年前,因为一个偶然的机会,上海交通大学特聘教授赵立平察觉到,肠道细菌与人体健康有关,从而开启了当...
福州“神兽们”报到,“超短学期... 2月25日福州的“神兽们”都背上书包重返校园报到啦!不少中小学生这几天有点焦虑——新学期马上开学了!...
美股开盘:美股三大指数集体高开 (来源:科创100ETF基金)  美股三大指数集体高开,标普500指数涨0.42%,道指涨0.35%...
美股异动 | 锂矿概念股走强 ... 周三,锂矿概念股走强,Sigma Lithium(SGML.US)大涨超32%,美国雅保(ALB.U...