Hacker News 中文摘要

RSS订阅

"玻璃翼计划:Mythos的启示" -- Project Glasswing: what Mythos showed us

文章摘要

Cloudflare测试了Anthropic公司开发的Mythos Preview安全大模型,发现其识别系统漏洞的能力较之前模型有显著提升。该模型被用于扫描50多个代码库,既能帮助修复漏洞,也能预测攻击者可能利用的新技术。文章分享了模型表现优异之处、不足之处,以及为适应规模化应用所需进行的架构改进。

文章总结

项目Glasswing:Mythos模型带来的启示

核心突破:Mythos Preview的进化

Anthropic公司开发的Mythos Preview作为Project Glasswing项目的一部分,展现了安全领域大语言模型的显著进步: 1. 漏洞链构建:能像资深研究员一样,将多个低级漏洞(如释放后使用漏洞)串联成完整攻击链,形成ROP链等系统控制方案 2. 漏洞验证自动化:通过编写测试代码→编译执行→验证结果的闭环流程,自动确认漏洞的可利用性,消除传统扫描工具的猜测性结论

模型局限与挑战

  • 非一致性防御机制:即使移除了商业模型的常规安全限制,Mythos仍会随机拒绝合法安全请求。相同代码分析请求可能因表述方式不同获得相反结论
  • 信号噪声问题
    • 内存不安全语言(如C/C++)误报率显著高于Rust等安全语言
    • 模型存在"过度发现"倾向,90%的输出包含"可能"、"理论上"等模糊表述
    • 改进点:通过提供具体函数+信任边界+架构文档的限定范围,可将发现质量提升至接近人类研究员水平

工程实践关键发现

  1. 专用框架的必要性

    • 通用代码代理直接扫描仓库效率低下,仅能覆盖0.1%代码表面
    • 成功方案采用50个并行代理,每个专注特定攻击类型(如命令注入)
  2. 验证架构优化

    • 对抗性审查:使用不同模型的独立代理进行二次验证
    • 阶段拆分:将"是否存在漏洞"与"攻击是否可达"分为独立验证阶段
    • 追踪系统:通过跨仓库符号索引确认漏洞实际暴露点

安全团队应对策略

  • 速度陷阱:单纯追求2小时补丁SLA可能导致更严重的回归问题
  • 防御架构原则
    • 前置防护层阻断漏洞触达路径
    • 设计隔离架构限制漏洞影响范围
    • 建立全局同步修复机制

项目团队与声明

该研究由Cloudflare安全团队在受控环境中完成,所有发现漏洞均通过正式管理流程处理。核心成员包括Albert Pedersen等安全工程师。

(注:原文中的图片描述、具体案例细节及技术术语均保留专业表述,仅去除重复性说明和宣传性内容)

评论总结

以下是评论内容的总结,平衡呈现不同观点并保留关键引用:

  1. 对漏洞严重性和数据透明度的质疑(评论1/4/10/11) 主要观点:要求公布具体漏洞数据,认为缺乏量化指标 关键引用:
  • "how severe were the most severe vulnerabilities found?"(评论1)
  • "why don't you share real data on how many security vuln it found?"(评论4)
  • "Disappointed that the post is very slim on details... No hard numbers"(评论10)
  1. 对AI写作和营销性质的批评(评论2/11/13) 主要观点:怀疑内容由LLM生成,认为像营销宣传 关键引用:
  • "it's interesting to see that even large organisations are outsourcing their blogs to LLMs"(评论2)
  • "seems like a balanced promotion article probably written using LLM itself"(评论11)
  1. 对技术价值的肯定(评论5/7/12) 主要观点:肯定漏洞发现流程和技术创新 关键引用:
  • "the vulnerability discovery workflow might actually give good results"(评论5)
  • "The idea that a cluster of actors can work on a shared... is an incredibly useful model"(评论12)
  1. 关于安全范式的讨论(评论6/7) 主要观点:认为应从根本上改进代码安全假设 关键引用:
  • "write code under the assumption that hackers will be running LLMs against their code"(评论6)
  • "if these models will be able to generate more secure code by default"(评论7)
  1. 其他争议性观点
  • 质疑Cloudflare本身是安全漏洞(评论8:"World's largest MITM")
  • 预测AI能力将超越质疑(评论9:"blast through the naive expectations")

总结:评论呈现两极分化,支持方肯定技术突破,反对方则质疑数据透明度和内容真实性,核心争议集中在具体漏洞数据的缺失和AI在安全领域的实际效用。