Anthropic指控中国AI公司违规蒸馏Claude，RLHF专家Lambert反驳：中国AI成功不靠走捷径_知识

Anthropic指控中国AI公司违规蒸馏Claude，RLHF专家Lambert反驳：中国AI成功不靠走捷径

创始人

2026-02-25 21:24:15

Anthropic指控DeepSeek、月之暗面、MiniMax三家公司通过约2.4万个虚假账号违规蒸馏Claude模型，生成超过1600万次对话用于训练自家模型，引发行业热议。RLHF领域专家Nathan Lambert对此指出，中国AI公司的成功并非靠走捷径，而是依赖扎实的基础设施建设和持续的技术创新。

Lambert将三家公司的情况分别分析，认为DeepSeek涉及的15万次交互量级极小，更像是内部实验而非系统性行为。月之暗面涉及340万次交互，集中在智能体推理、工具调用等Claude核心能力方向。MiniMax规模最大，约1300万次，目标为代理编码和复杂任务编排。月暗与MiniMax合计约1650万次，估算token成本达数百万美元。

Lambert强调蒸馏存在明显天花板，真正顶级的模型能力依赖强化学习而非简单模仿。他指出，模型需要通过自主探索、试错迭代来获得解题路径，这是蒸馏无法提供的。不同模型间的数据分布差异也让蒸馏效果大打折扣，需要大量工程优化才能发挥作用。

值得注意的是，Anthropic自身深陷版权争议。该公司曾被曝以破坏性方式扫描全球书籍，从盗版网站下载大量侵权内容，最终支付15亿美元和解金。马斯克公开批评Anthropic大规模窃取训练数据却指控他人。这种双重标准让Anthropic的指控显得缺乏说服力。

Lambert认为，Anthropic此时公开点名中国公司，技术防御并非首要动机，更像是向美国国防部递交的投名状。此前美国防部刚威胁Anthropic配合提供不受限制的使用权限，否则将其标记为供应链危险。这种选择性执法暴露了其地缘政治考量。

业内普遍认为，蒸馏能帮助模型快速入场，但要达到顶级水平必须依靠自主的强化学习训练。DeepSeek、月之暗面、MiniMax均具备完善的基础设施和优秀人才，绝非仅靠小聪明企图弯道超车的小作坊。Anthropic提出的蒸馏争议，折射出AI行业在规则模糊地带快速行动后，面临规则收紧时的复杂博弈。（爱范儿）

上一篇：让 Anthropic 破防的「蒸馏」风波，美国 AI 大牛泼冷水：中国 AI 成功不靠走捷径

下一篇：AI开始倒反天罡了

Anthropic指控中国AI公司违规蒸馏Claude，RLHF专家Lambert反驳：中国AI成功不靠走捷径

相关内容

热门资讯