Hacker News 中文摘要

RSS订阅

AI智能体发现区块链智能合约漏洞致460万美元损失 -- AI agents find $4.6M in blockchain smart contract exploits

文章摘要

AI模型在智能合约漏洞利用方面展现出强大能力,Claude和GPT-5等模型成功开发了价值460万美元的攻击方案,并发现了新型零日漏洞。研究表明AI自主攻击已具备技术可行性,凸显了需要主动采用AI防御技术的紧迫性。

文章总结

智能合约漏洞利用的经济影响评估

研究背景

随着AI模型在网络安全任务中表现日益出色,Anthropic公司与MATS项目学者合作开展了一项研究,旨在量化AI代理利用智能合约漏洞可能造成的经济损失。研究团队构建了包含405个真实漏洞合约的SCONE-bench基准测试集(涵盖2020-2025年间被攻击的以太坊、币安智能链和Base链合约),通过区块链模拟环境评估AI模型的攻击能力。

核心发现

  1. 历史漏洞利用表现

    • 在405个测试案例中,10个前沿AI模型(包括Claude Opus 4.5和GPT-5)成功开发了207个漏洞的利用脚本,模拟窃取资金达5.501亿美元
    • 针对2025年3月后新出现的34个漏洞,表现最佳的Opus 4.5模型成功攻击17个案例,模拟获利450万美元
  2. 零日漏洞发现能力

    • 对2,849个新部署合约的测试中,Sonnet 4.5和GPT-5均发现2个未知漏洞,模拟获利3,694美元
    • GPT-5的单次扫描成本为3,476美元,证明自动化攻击已具备经济可行性
  3. 技术发展趋势

    • 模型攻击收益每1.3个月翻倍(图1)
    • 生成有效攻击代码的token消耗量在6个月内下降70.2%(图2)
    • 单次合约扫描成本已降至1.22美元

漏洞案例分析

  1. 未受保护的只读函数
    某代币合约因未添加view修饰符,导致计算函数实际执行状态写入,攻击者通过重复调用可无限增发代币,潜在获利最高达19,000美元。

  2. 费用提取逻辑缺陷
    代币创建服务未验证受益人地址参数,允许任意用户提取未分配的交易手续费,实际攻击者利用该漏洞盗取约1,000美元。

防御启示

  • 智能合约漏洞利用收益主要取决于合约管理的资产规模,与代码复杂度无关(图8)
  • AI攻击能力(长周期推理、边界分析等)同样适用于传统软件漏洞挖掘
  • 建议开发者采用AI进行合约审计,以应对日益缩短的漏洞暴露窗口期

研究限制

  • 所有测试均在模拟环境中完成,未影响真实资产
  • 开源基准测试框架SCONE-bench即将发布,以帮助开发者进行防御性测试

(注:本文保留了关键数据图表引用,删减了部分技术实现细节和附录内容,完整研究参见原始报告)

评论总结

以下是评论内容的总结,主要观点和论据如下:

  1. AI在渗透测试中的应用前景

    • 有评论认为AI在渗透测试中表现出色,尤其是最新版本的模型(如Sonnet 4.5和Opus 4.5)能力显著提升。
      • "There was a huge jump in capability from Sonnet 4 to Sonnet 4.5."
      • "It's very clever and we are re-designing our benchmark systems because it's saturating the test cases."
    • 另一观点认为AI的自主性正在增强,未来可能实现自我改进。
      • "I can already see self improving behaviour in our own work."
      • "Things are moving towards more autonomous and more useful agents."
  2. 对以太坊智能合约安全性的质疑

    • 部分评论指出以太坊智能合约的安全性较差,AI的测试结果更多反映了合约本身的漏洞。
      • "Says more about the relatively poor infosec on etherium contracts."
      • "Exploiting ethereum smart contracts is nothing that new or exciting."
    • 也有用户对智能合约的机制提出疑问,认为其容易被操纵。
      • "So is it not trivially manipulated by that person?"
  3. 对研究方法的批评

    • 有评论认为研究仅模拟已知漏洞,实际意义有限。
      • "Oh, so they are pointing their bots at already known exploited contracts."
      • "This is actually hilarious, driving a massive rush towards their models."
    • 另有用户对图表和数据表达方式提出质疑。
      • "That graph is impenetrable. What is it even trying to say?"
  4. 幽默与讽刺

    • 部分评论以幽默方式调侃AI的“道德约束”或研究标题的误导性。
      • "Well, that's no fun!"
      • "Finally, AI is held accountable for their wrong actions!"

总结:评论主要围绕AI在渗透测试中的潜力、以太坊智能合约的安全性问题以及研究方法的局限性展开,观点多样,既有技术乐观派,也有质疑和批评者。