Hacker News 中文摘要

文章摘要

文章核心内容：测试发现，AI网络安全能力并不完全依赖模型大小，而是与系统设计及深度安全专业知识密切相关。Anthropic推出的Mythos模型虽能自主发现大量漏洞，但验证了网络安全能力具有"锯齿状"特征——小型开源模型也能复现类似分析结果。这表明真正的护城河在于系统整体架构而非单一模型。

文章总结

标题：AI网络安全后Mythos时代：参差不齐的前沿

核心观点：系统而非模型才是护城河

摘要：
Anthropic发布的Mythos模型在发现和修复关键软件漏洞方面表现卓越，但实验表明，小型、廉价的开源模型同样能复现其大部分漏洞分析能力。AI网络安全能力呈现参差不齐的特点——并非随模型规模线性提升，真正的护城河在于内置深度安全专业知识的系统，而非模型本身。Mythos验证了这一方向，但尚未定论。

背景与实验验证

Anthropic的突破
- Mythos模型自主发现了数千个零日漏洞，包括OpenBSD中27年的老漏洞和FFmpeg中16年的缺陷，甚至能构建复杂的漏洞利用链（如Linux内核提权攻击）。
- Anthropic为此成立Project Glasswing联盟，承诺投入1亿美元资源支持开源安全。
小型模型的意外表现
- 测试中，8个小型开源模型（包括仅36亿参数的模型，成本0.11美元/百万token）成功检测出Mythos展示的FreeBSD漏洞；51亿参数的模型复现了OpenBSD漏洞的核心利用链。
- 在基础安全推理任务中，小型开源模型甚至优于多数前沿大模型，能力排名因任务不同而剧烈波动，呈现明显的“参差不齐性”。

关键发现

漏洞检测的民主化
- FreeBSD漏洞（缓冲区溢出）被所有测试模型识别，包括最廉价的模型；而需要数学推理的OpenBSD漏洞（有符号整数溢出）则区分了模型能力，但部分小型模型仍能解析核心逻辑。
- 假阳性测试：在区分真实漏洞与假阳性时，小型模型（如36亿参数的GPT-OSS-20b）表现优于多数大模型，甚至某些前沿模型完全失败。
利用构造的差距与局限
- 模型能推理漏洞可利用性（如绕过FreeBSD的栈保护机制），但自主设计多阶段攻击链（如分15次写入ROP链）仍需Mythos级创造力。
- 防御场景中，漏洞发现与修复比完整利用构造更关键，而前者已可通过当前模型实现。

行业启示

系统的核心地位
- 有效的AI安全依赖模块化流程（代码扫描、漏洞检测、验证、补丁生成等），而非单一模型。Anthropic的框架与AISLE等团队的系统设计高度相似，但模型选择可多样化。
- 经济性优势：廉价模型可广泛覆盖代码扫描，通过“量”弥补“质”，降低全流程成本。
生态建设的紧迫性
- Mythos验证了AI安全的价值，但能力并非垄断。当前瓶颈在于：
  - 安全专业知识嵌入系统架构
  - 维护者信任的建立
  - 开发流程的集成

局限与未来

未测试端到端自主发现：实验提供代码片段而非全库扫描，但实际系统会通过迭代提示生成类似上下文。
代理工具未启用：若赋予模型代码执行等工具，能力差距可能进一步缩小。
防御优先：Project Glasswing的使命更需可靠发现与修复，而非完整攻击链，而这一目标已具备技术基础。

结语：
AI网络安全能力已广泛存在于当前模型中，包括开源方案。行业需聚焦于构建系统、流程和信任生态，而非等待某个“终极模型”。

附录：部分模型测试结果摘要
| 模型 | FreeBSD漏洞检测 | OpenBSD漏洞分析 | 假阳性测试 |
|---------------------|----------------|-----------------|------------|
| GPT-OSS-20b (3.6B) | ✅ | ❌ | ✅ |
| DeepSeek R1 (开源) | ✅ | ❌ | ✅ |
| GPT-OSS-120b (5.1B) | ✅ | ✅（完整链） | ❌ |

（完整数据与实验记录参见原文附录）

评论总结

总结评论内容如下：

支持小模型有效性观点
- 论据：多个小型开源模型成功识别了漏洞代码片段，成本低廉
- 引用：
  "Eight out of eight models detected Mythos's flagship FreeBSD exploit" (评论1)
  "小型模型在已知漏洞位置时表现良好" (评论5)
质疑实验方法局限性
- 主要批评：预先隔离漏洞代码使任务简化，与真实场景不符
- 引用：
  "isolating the relevant code changes the situation so much" (评论1)
  "如同在已知1平方公里范围内找网球 vs 整个亚马逊丛林" (评论6)
强调完整代码审查的重要性
- 观点：真实漏洞常涉及多模块交互，片段检测不具代表性
- 引用：
  "Heartbleed漏洞在完整上下文中才显价值" (评论11)
  "Mythos需要扫描整个代码库而非片段" (评论7)
对虚假阳性率的质疑
- 关键缺失：多数评论指出缺乏误报率数据影响结论可信度
- 引用：
  "Without showing false-positive rates this analysis is useless" (评论15)
  "仅返回true的测试工具也能达到100%检出率" (评论16)
关于模型能力的辩证讨论
- 补充观点：大模型在漏洞利用阶段更具优势
- 引用：
  "Opus 4.6开发漏洞利用的成功率显著低于Mythos" (评论5)
  "发现漏洞位置本身就是最困难的部分" (评论9)

注：所有评论均未显示评分数据（评分均为None），故未纳入认可度分析。争议焦点集中在实验设计合理性（是否公平比较）和指标完整性（缺乏误报数据）两方面。

小型模型同样发现了Mythos所发现的漏洞 -- Small models also found the vulnerabilities that Mythos found