(来源:AI信息Gap)
好消息,Anthropic 之前泄露的最强模型 Claude Mythos,刚刚正式官宣了!
坏消息,暂不对个人用户开放。你我用不上。
Anthropic 史上最强模型,强到连自己都不敢公开发布。
今天凌晨,Anthropic 发起了一个叫 Project Glasswing 的网络安全计划。
最新模型 Mythos Preview 已经定向开放给 12 家合作伙伴和 40 多家基础设施组织,专门用来找软件漏洞。
苹果、亚马逊、谷歌、微软、英伟达、思科、CrowdStrike、摩根大通、Palo Alto Networks、博通、Linux 基金会。
来看看这个模型有多猛。
SWE-bench Verified,目前最受认可的 AI 编程基准测试之一。Claude Opus 4.6 准确率 80.8%,Mythos 直接拉到 93.9%。离满分不远了。
更难的 SWE-bench Pro,差距更夸张,53.4% vs 77.8%,接近 25 个百分点。
推理能力。GPQA Diamond 94.6%,Humanity's Last Exam 带工具版本 64.7%,全都大幅领先 Opus 4.6。
电脑操控能力,BrowseComp Mythos 86.9%,Opus 4.6 83.7%。关键 Mythos 用的 token 只有 Opus 的五分之一。同样的活,又好又省。
在 Mythos 面前,当前最强的 Opus 4.6 简直像个弟弟。
Anthropic 今天亮出 Mythos,不只为了秀肌肉。
过去几周,Mythos 模型已经在所有主流操作系统和浏览器中发现了数千个零日漏洞。很多是高危级别。
今年 2 月,Opus 4.6 上线后以「开箱即用」的能力在开源软件中找到了大约 500 个零日漏洞。Mythos 找到的是数千个。差了一个数量级。
OpenBSD,号称全球最安全的操作系统之一,专门用来跑防火墙和关键基础设施。Mythos 找到了一个存在 27 年的漏洞。远程攻击者只要建立连接,整台机器直接崩溃。这个 Bug 从 1999 年就在那里,没有任何人类或自动化工具发现过。
Anthropic 披露的发现成本:「不到 2 万美元。」
从发现漏洞到写出完整的攻击代码,全程自主完成,没有人类参与。
所以,Mythos 强到 Anthropic 不敢发布了。
Project Glasswing 这个名字取自一种叫「玻璃翼蝶」的蝴蝶。它的翅膀完全透明,藏在环境里几乎看不见。跟软件里那些藏了几十年的漏洞一样。
网络安全公司 CrowdStrike 的 CTO Elia Zaitsev 说,「漏洞从被发现到被利用的时间窗口已经崩塌。以前要几个月,现在用 AI 可能只需要几分钟。」这也是 Anthropic 拉上开源社区的原因。Linux 基金会 CEO Jim Zemlin 说,「安全专业知识一直是有钱公司的奢侈品,开源维护者只能自己扛。Project Glasswing 让每个维护者都能用上顶级安全能力。」
Anthropic 拿出了 1 亿美元的模型使用额度分给合作方,另外向 Linux 基金会旗下的 Alpha-Omega 和 OpenSSF 捐了 250 万美元,向 Apache 软件基金会捐了 150 万美元。
合作方用完免费额度后,Mythos Preview 的定价是每百万输入 token 25 美元,每百万输出 token 125 美元。Opus 4.6 的 API 价格是 5 美元和 25 美元。
Mythos 是 Opus 的 5 倍。
Mythos 并非凭空出现。
3 月底,Anthropic 的博客系统出了配置错误,3000 份内部文件被意外公开。其中就有一篇关于 Claude Mythos 的草稿博文,内部代号「卡皮巴拉」(Capybara)。
泄露文件显示,Mythos 是 Anthropic 模型体系中全新的第四层级,位于 Opus 之上。此前 Claude 模型只有三层,Haiku、Sonnet、Opus。
今天的正式公告,把 3 月份的泄露变成了「剧透」。
Anthropic 这两天风头正劲。
前一天刚宣布和谷歌、博通签了一笔大单。数吉瓦级别的 TPU 算力,2027 年上线。
同时公布年化收入突破 300 亿美元。2025 年底还是 90 亿,不到半年翻了超过三倍。直接超过了 OpenAI 披露的 250 亿美元。Anthropic 营收首次反超 OpenAI。
二级市场反应一致。彭博社上周报道,6 亿美元的 OpenAI 股票打九折都卖不掉,同一时间 20 亿美元的资金排队抢购 Anthropic 的股份。高盛给 Anthropic 股票照收 15%-20% 的佣金,OpenAI 的直接免了。
2 月 G 轮融资的时候,Anthropic 说有 500 多家企业每年花超过 100 万美元用 Claude。现在超过 1000 家。不到两个月,翻了一倍。
Anthropic 明确表示不会公开发布 Mythos Preview。计划先在即将推出的新一代 Opus 上测试安全防护措施,等防护体系成熟之后再逐步放开 Mythos 级别的能力。
所以,Mythos 你大概率用不上。但它的能力,会以某种形式流入下一代公开模型。
年入 300 亿反超 OpenAI,反而不是今天最大的新闻。
最大的新闻是,最强的模型,不开放。
我是木易,Top2 + 美国 Top10 CS 硕,现在是 AI 产品经理。