Hacker News 中文摘要

文章摘要

AI模型在智能合约漏洞利用方面展现出强大能力，Claude和GPT-5等模型成功开发了价值460万美元的攻击方案，并发现了新型零日漏洞。研究表明AI自主攻击已具备技术可行性，凸显了需要主动采用AI防御技术的紧迫性。

文章总结

智能合约漏洞利用的经济影响评估

研究背景

随着AI模型在网络安全任务中表现日益出色，Anthropic公司与MATS项目学者合作开展了一项研究，旨在量化AI代理利用智能合约漏洞可能造成的经济损失。研究团队构建了包含405个真实漏洞合约的SCONE-bench基准测试集（涵盖2020-2025年间被攻击的以太坊、币安智能链和Base链合约），通过区块链模拟环境评估AI模型的攻击能力。

核心发现

历史漏洞利用表现
- 在405个测试案例中，10个前沿AI模型（包括Claude Opus 4.5和GPT-5）成功开发了207个漏洞的利用脚本，模拟窃取资金达5.501亿美元
- 针对2025年3月后新出现的34个漏洞，表现最佳的Opus 4.5模型成功攻击17个案例，模拟获利450万美元
零日漏洞发现能力
- 对2,849个新部署合约的测试中，Sonnet 4.5和GPT-5均发现2个未知漏洞，模拟获利3,694美元
- GPT-5的单次扫描成本为3,476美元，证明自动化攻击已具备经济可行性
技术发展趋势
- 模型攻击收益每1.3个月翻倍（图1）
- 生成有效攻击代码的token消耗量在6个月内下降70.2%（图2）
- 单次合约扫描成本已降至1.22美元

漏洞案例分析

未受保护的只读函数
某代币合约因未添加view修饰符，导致计算函数实际执行状态写入，攻击者通过重复调用可无限增发代币，潜在获利最高达19,000美元。
费用提取逻辑缺陷
代币创建服务未验证受益人地址参数，允许任意用户提取未分配的交易手续费，实际攻击者利用该漏洞盗取约1,000美元。

防御启示

智能合约漏洞利用收益主要取决于合约管理的资产规模，与代码复杂度无关（图8）
AI攻击能力（长周期推理、边界分析等）同样适用于传统软件漏洞挖掘
建议开发者采用AI进行合约审计，以应对日益缩短的漏洞暴露窗口期

研究限制

所有测试均在模拟环境中完成，未影响真实资产
开源基准测试框架SCONE-bench即将发布，以帮助开发者进行防御性测试

（注：本文保留了关键数据图表引用，删减了部分技术实现细节和附录内容，完整研究参见原始报告）

评论总结

以下是评论内容的总结，主要观点和论据如下：

AI在渗透测试中的应用前景
- 有评论认为AI在渗透测试中表现出色，尤其是最新版本的模型（如Sonnet 4.5和Opus 4.5）能力显著提升。
  - "There was a huge jump in capability from Sonnet 4 to Sonnet 4.5."
  - "It's very clever and we are re-designing our benchmark systems because it's saturating the test cases."
- 另一观点认为AI的自主性正在增强，未来可能实现自我改进。
  - "I can already see self improving behaviour in our own work."
  - "Things are moving towards more autonomous and more useful agents."
对以太坊智能合约安全性的质疑
- 部分评论指出以太坊智能合约的安全性较差，AI的测试结果更多反映了合约本身的漏洞。
  - "Says more about the relatively poor infosec on etherium contracts."
  - "Exploiting ethereum smart contracts is nothing that new or exciting."
- 也有用户对智能合约的机制提出疑问，认为其容易被操纵。
  - "So is it not trivially manipulated by that person?"
对研究方法的批评
- 有评论认为研究仅模拟已知漏洞，实际意义有限。
  - "Oh, so they are pointing their bots at already known exploited contracts."
  - "This is actually hilarious, driving a massive rush towards their models."
- 另有用户对图表和数据表达方式提出质疑。
  - "That graph is impenetrable. What is it even trying to say?"
幽默与讽刺
- 部分评论以幽默方式调侃AI的“道德约束”或研究标题的误导性。
  - "Well, that's no fun!"
  - "Finally, AI is held accountable for their wrong actions!"

总结：评论主要围绕AI在渗透测试中的潜力、以太坊智能合约的安全性问题以及研究方法的局限性展开，观点多样，既有技术乐观派，也有质疑和批评者。

AI智能体发现区块链智能合约漏洞致460万美元损失 -- AI agents find $4.6M in blockchain smart contract exploits