Claude Mythos 意外泄露:Anthropic 最强模型强到不敢发
Claude Mythos 意外泄露:Anthropic 最强模型强到不敢发
Liuwx前言
2026年3月27日,AI 圈迎来一场爆炸性消息——不是来自官方发布会,而是一场资料外泄事件。Anthropic(Claude 背后的公司)因为内容管理系统的配置失误,意外曝光了正在测试的最强新模型 Claude Mythos(代号 Capybara 🦫)。
这个模型在编程、推理、网络安全等方面全面碾压当前的顶配 Claude Opus 4.6,但 Anthropic 却迟迟不敢发布——因为它太强了,强到可能被黑客用于大规模网络攻击。
一、事件概述
(一)泄露经过
网络安全公司 LayerX Security 和剑桥大学研究人员发现,Anthropic 用于发布官博的内容管理系统(CMS)存在配置失误——所有上传的文件默认公开可访问。
结果,近 3000 份内部文件被公开"晒"在互联网上,包括博客草稿、图片、PDF,甚至一份员工育儿假文件。
《财富》杂志意外检索到一篇带有完整结构的博客草稿,曝光了 Claude Mythos 的存在。
(二)事件核心
1 | 泄露来源:Anthropic 官方 CMS 配置失误 |
二、Claude Mythos 是什么?
(一)全新顶配层级
目前 Anthropic 的模型分为三档:
| 层级 | 定位 | 代表模型 |
|---|---|---|
| Opus | 顶配 | Claude Opus 4.6 |
| Sonnet | 中配 | Claude Sonnet 4 |
| Haiku | 入门 | Claude Haiku |
而 Capybara(Mythos) 是一个全新的、比 Opus 更强的档位:
“Capybara 是一个新的模型层级:比我们迄今最强的 Opus 系列更大、更智能——但同时也更贵。”
(二)命名玄机
“Capybara”(水豚🦫)打破了 Anthropic 传统的命名体系——Haiku、Sonnet、Opus 都是文学或音乐相关的词。这种刻意的断裂暗示:
这不是 Opus 的下一代,而是另一个层级的东西,不在原来的序列里。
(三)性能对比
| 能力维度 | Claude Opus 4.6 | Claude Mythos |
|---|---|---|
| 软件编程 | 顶尖 | ✅ 显著提升 |
| 学术推理 | 顶尖 | ✅ 显著提升 |
| 网络安全 | 已能发现未知漏洞 | 🔴 远超任何模型 |
| 价格 | 最贵 | 更贵 |
三、为什么 Anthropic 不敢发布?
(一)网络安全能力过强
泄露文件指出:
“Mythos 在网络安全能力方面目前远超任何其他 AI 模型,它的存在预示着即将到来的一波 AI 模型浪潮,这些模型能够以远超防御方的速度发现和利用漏洞。”
换句话说:这个模型可能比现有的任何黑客工具都要厉害。
(二)攻击能力链
Mythos 在三个维度的提升,恰好构成完整的"攻击能力链":
1 | 编程能力 → 理解系统、编写利用代码 |
(三)历史教训
Anthropic 曾披露,已有具备国家背景的黑客组织尝试利用 Claude 发起攻击。在一次事故中,对方借助 Claude Code 渗透了约 30 家机构(包括科技公司、金融机构和政府部门)。
四、Anthropic 的应对策略
(一)发布策略转变
以往大模型发布:先向开发者和普通用户开放,安全问题事后处理。
Mythos 发布策略:
1 | 先给网络安全防御机构 → 让他们提前加固系统 → 再考虑更广泛发布 |
这背后是一种相当直白的承认:这个模型对攻击方的潜在价值,可能大于对普通用户的价值。
(二)官方回应
Anthropic 在回应 Fortune 采访时确认:
“我们将这个模型视为一次**『阶跃式进化』**,是我们迄今构建的最强大的模型。”
五、更多爆料:高管闭门会
泄露文件还显示,Anthropic 将在英国举办闭门活动:
1 | 活动定位:小规模深度交流 |
六、行业背景
(一)AI 网络安全能力竞赛
| 公司 | 模型 | 网络安全能力 |
|---|---|---|
| OpenAI | GPT-5.3 Codex | 首次标记为"高危能力"模型 |
| Anthropic | Claude Opus 4.6 | 能在真实代码库中发现未知漏洞 |
| Anthropic | Claude Mythos | 🔴 远超以上所有模型 |
(二)IPO 时间线
据 The Information 消息,Anthropic 正在推进 IPO 计划,预计最快在今年第四季度上市。
七、待确认信息
⚠️ 以下信息需要进一步核实
- [ ] Mythos 和 Capybara 是否为同一模型
- [ ] 具体发布时间
- [ ] 定价策略
- [ ] 早期访问客户名单
- [ ] CMS 是如何被配置错误的
八、参考资料
- Fortune - Anthropic says it’s testing ‘Mythos,’ a powerful new AI model, after data leak reveals its existence
- 新智元 - 刚刚,Anthropic王炸Claude泄露!全面碾压Opus 4.6引爆全网
- DataLearner - 重磅!Anthropic官方数据泄露,正在测试新的大模型Claude Mythos
- AI前线 - Claude最新模型意外曝光:全面碾压Opus 4.6,强到让Anthropic不敢发布
总结
这次泄露事件暴露了一个事实:当模型能力逼近现实系统边界时,AI 公司需要面对的已经不只是"能不能做出来",而是"能不能安全地发布"。
Claude Mythos 的存在意味着 AI 模型的能力已经到达了一个新的临界点——强到连开发者自己都需要重新思考发布的节奏和方式。
关键看点:
- ✅ Claude Mythos 已完成训练,性能全面超越 Opus 4.6
- ✅ 网络安全能力过强,Anthropic 采取谨慎发布策略
- ✅ 命名"Capybara"暗示这是全新层级,非 Opus 继任者
- ⏳ 发布时间待定,可能先开放给网络安全防御机构
📌 本文基于公开泄露信息整理,部分细节可能随官方回应而更新。
整理时间:2026-03-28


