Hacker News 中文摘要

文章摘要

Cloudflare测试了Anthropic公司开发的Mythos Preview安全大模型，发现其识别系统漏洞的能力较之前模型有显著提升。该模型被用于扫描50多个代码库，既能帮助修复漏洞，也能预测攻击者可能利用的新技术。文章分享了模型表现优异之处、不足之处，以及为适应规模化应用所需进行的架构改进。

文章总结

项目Glasswing：Mythos模型带来的启示

核心突破：Mythos Preview的进化

Anthropic公司开发的Mythos Preview作为Project Glasswing项目的一部分，展现了安全领域大语言模型的显著进步： 1. 漏洞链构建：能像资深研究员一样，将多个低级漏洞（如释放后使用漏洞）串联成完整攻击链，形成ROP链等系统控制方案 2. 漏洞验证自动化：通过编写测试代码→编译执行→验证结果的闭环流程，自动确认漏洞的可利用性，消除传统扫描工具的猜测性结论

模型局限与挑战

非一致性防御机制：即使移除了商业模型的常规安全限制，Mythos仍会随机拒绝合法安全请求。相同代码分析请求可能因表述方式不同获得相反结论
信号噪声问题：
- 内存不安全语言（如C/C++）误报率显著高于Rust等安全语言
- 模型存在"过度发现"倾向，90%的输出包含"可能"、"理论上"等模糊表述
- 改进点：通过提供具体函数+信任边界+架构文档的限定范围，可将发现质量提升至接近人类研究员水平

工程实践关键发现

专用框架的必要性：
- 通用代码代理直接扫描仓库效率低下，仅能覆盖0.1%代码表面
- 成功方案采用50个并行代理，每个专注特定攻击类型（如命令注入）
验证架构优化：
- 对抗性审查：使用不同模型的独立代理进行二次验证
- 阶段拆分：将"是否存在漏洞"与"攻击是否可达"分为独立验证阶段
- 追踪系统：通过跨仓库符号索引确认漏洞实际暴露点

安全团队应对策略

速度陷阱：单纯追求2小时补丁SLA可能导致更严重的回归问题
防御架构原则：
- 前置防护层阻断漏洞触达路径
- 设计隔离架构限制漏洞影响范围
- 建立全局同步修复机制

项目团队与声明

该研究由Cloudflare安全团队在受控环境中完成，所有发现漏洞均通过正式管理流程处理。核心成员包括Albert Pedersen等安全工程师。

（注：原文中的图片描述、具体案例细节及技术术语均保留专业表述，仅去除重复性说明和宣传性内容）

评论总结

以下是评论内容的总结，平衡呈现不同观点并保留关键引用：

对漏洞严重性和数据透明度的质疑（评论1/4/10/11）主要观点：要求公布具体漏洞数据，认为缺乏量化指标关键引用：

"how severe were the most severe vulnerabilities found?"（评论1）
"why don't you share real data on how many security vuln it found?"（评论4）
"Disappointed that the post is very slim on details... No hard numbers"（评论10）

对AI写作和营销性质的批评（评论2/11/13）主要观点：怀疑内容由LLM生成，认为像营销宣传关键引用：

"it's interesting to see that even large organisations are outsourcing their blogs to LLMs"（评论2）
"seems like a balanced promotion article probably written using LLM itself"（评论11）

对技术价值的肯定（评论5/7/12）主要观点：肯定漏洞发现流程和技术创新关键引用：

"the vulnerability discovery workflow might actually give good results"（评论5）
"The idea that a cluster of actors can work on a shared... is an incredibly useful model"（评论12）

关于安全范式的讨论（评论6/7）主要观点：认为应从根本上改进代码安全假设关键引用：

"write code under the assumption that hackers will be running LLMs against their code"（评论6）
"if these models will be able to generate more secure code by default"（评论7）

其他争议性观点

质疑Cloudflare本身是安全漏洞（评论8："World's largest MITM"）
预测AI能力将超越质疑（评论9："blast through the naive expectations"）

总结：评论呈现两极分化，支持方肯定技术突破，反对方则质疑数据透明度和内容真实性，核心争议集中在具体漏洞数据的缺失和AI在安全领域的实际效用。

"玻璃翼计划：Mythos的启示" -- Project Glasswing: what Mythos showed us