Hacker News 中文摘要

文章摘要

Anthropic公司发起的"Project Glasswing"项目旨在利用AI模型Claude Mythos Preview检测关键软件漏洞。项目启动一个月来，已与约50个合作伙伴共同发现上万高危漏洞，当前挑战在于漏洞验证和修复速度跟不上AI检测速度。文章分享了初期成果，包括Mythos Preview在开源项目扫描中的表现，以及对未来发布Mythos类模型的规划。

文章总结

项目Glasswing：初步进展报告

核心内容概述

我们上月启动了Glasswing项目，旨在通过AI协作强化全球关键软件安全。目前，约50家合作伙伴已使用Claude Mythos预览版发现了上万高危漏洞，软件安全修复速度成为新瓶颈。

早期成果

漏洞披露策略
遵循行业惯例的90天披露周期（或补丁发布后约45天），我们通过协调漏洞披露政策平衡用户安全与透明度，当前仅提供典型案例和统计概览。
合作伙伴验证
- Cloudflare在核心系统中发现2,000个漏洞（400个高危级），误报率低于人工检测
- 英国AI安全研究所确认Mythos是首个完整攻破其双网络靶场的模型
- Mozilla在Firefox 150中修复271个漏洞，效率较前代提升10倍
开源项目扫描
扫描1,000+关键开源项目后，发现6,202个高危漏洞（总23,019个）。经第三方验证的1,752个漏洞中，90.6%为真实漏洞，62.4%确认为高危。典型案例包括wolfSSL加密库的证书伪造漏洞（CVE-2026-5194）。

行业影响

Palo Alto Networks补丁数量增长5倍
微软预计补丁发布量将持续增加
银行案例：成功拦截150万美元欺诈转账

挑战与应对

当前瓶颈在于人工验证和修复速度。我们建立漏洞仪表盘跟踪进度，并建议： - 开发者：缩短补丁周期，优化更新机制
- 防御方：强化多因素认证、日志记录等基础防护

工具支持

推出Claude Security企业版，已修复2,100+漏洞
开放合作伙伴使用的扫描工具链（含代码映射、子代理扫描等模块）
思科开源Foundry Security Spec

未来计划

与开源安全基金会合作支持维护者
开发更严格防护措施后公开发布Mythos级模型
扩展政府及关键合作伙伴网络

评论总结

以下是评论内容的总结，按观点分类呈现：

对Mythos能力的质疑

认为缺乏与Opus 4.7的对比数据（评论1："no data to prove this wasn't doable with Opus 4.7"）
质疑漏洞真实性（评论2："Is this suspected vulns or actual vulns?"；评论17："How much is RL’ing on every CVE?"）

对发布策略的批评

认为存在商业利益优先（评论11："make a load of money before general release"）
不满非公开验证（评论9："posting stuff when it can’t be verified"；评论5："BOOO RELEASE THE MODEL"）

对技术效果的肯定

用户实证支持（评论6："90% accurate...shocked how many issues it found"）
独立验证数据（评论12："90.6% true positives...clear step change"）

应用场景讨论

关注关键基础设施（评论16："prioritize GitHub repos over internet software"）
建议漏洞类型分析（评论19："publish vulnerability type statistics"）

行业影响预测

认为将改变开发流程（评论6："regular part of development lifecycle"）
类比自动驾驶（评论15："like manual driving becoming obsolete"）

成本效益质疑

要求成本透明度（评论22："how much did it cost to find 1451 bugs?"）
质疑商业动机（评论23："just some money printing scheme"）

典型评论引用： - 支持方：评论6称"约90%准确率...连'低危'发现也实际可被利用"（"90% accurate...even 'Low' findings are actually exploitable"） - 反对方：评论9批评"无法验证的营销需要停止"（"this trend of posting unverifiable stuff needs to end"）

注：所有评论均无评分数据（None），观点分布较均衡，支持方多引用实证数据，反对方侧重方法论和商业伦理质疑。