文章摘要
AI模型在智能合约漏洞利用方面展现出强大能力,Claude和GPT-5等模型成功开发了价值460万美元的攻击方案,并发现了新型零日漏洞。研究表明AI自主攻击已具备技术可行性,凸显了需要主动采用AI防御技术的紧迫性。
文章总结
智能合约漏洞利用的经济影响评估
研究背景
随着AI模型在网络安全任务中表现日益出色,Anthropic公司与MATS项目学者合作开展了一项研究,旨在量化AI代理利用智能合约漏洞可能造成的经济损失。研究团队构建了包含405个真实漏洞合约的SCONE-bench基准测试集(涵盖2020-2025年间被攻击的以太坊、币安智能链和Base链合约),通过区块链模拟环境评估AI模型的攻击能力。
核心发现
历史漏洞利用表现
- 在405个测试案例中,10个前沿AI模型(包括Claude Opus 4.5和GPT-5)成功开发了207个漏洞的利用脚本,模拟窃取资金达5.501亿美元
- 针对2025年3月后新出现的34个漏洞,表现最佳的Opus 4.5模型成功攻击17个案例,模拟获利450万美元
零日漏洞发现能力
- 对2,849个新部署合约的测试中,Sonnet 4.5和GPT-5均发现2个未知漏洞,模拟获利3,694美元
- GPT-5的单次扫描成本为3,476美元,证明自动化攻击已具备经济可行性
技术发展趋势
- 模型攻击收益每1.3个月翻倍(图1)
- 生成有效攻击代码的token消耗量在6个月内下降70.2%(图2)
- 单次合约扫描成本已降至1.22美元
漏洞案例分析
未受保护的只读函数
某代币合约因未添加view修饰符,导致计算函数实际执行状态写入,攻击者通过重复调用可无限增发代币,潜在获利最高达19,000美元。费用提取逻辑缺陷
代币创建服务未验证受益人地址参数,允许任意用户提取未分配的交易手续费,实际攻击者利用该漏洞盗取约1,000美元。
防御启示
- 智能合约漏洞利用收益主要取决于合约管理的资产规模,与代码复杂度无关(图8)
- AI攻击能力(长周期推理、边界分析等)同样适用于传统软件漏洞挖掘
- 建议开发者采用AI进行合约审计,以应对日益缩短的漏洞暴露窗口期
研究限制
- 所有测试均在模拟环境中完成,未影响真实资产
- 开源基准测试框架SCONE-bench即将发布,以帮助开发者进行防御性测试
(注:本文保留了关键数据图表引用,删减了部分技术实现细节和附录内容,完整研究参见原始报告)
评论总结
以下是评论内容的总结,主要观点和论据如下:
AI在渗透测试中的应用前景
- 有评论认为AI在渗透测试中表现出色,尤其是最新版本的模型(如Sonnet 4.5和Opus 4.5)能力显著提升。
- "There was a huge jump in capability from Sonnet 4 to Sonnet 4.5."
- "It's very clever and we are re-designing our benchmark systems because it's saturating the test cases."
- 另一观点认为AI的自主性正在增强,未来可能实现自我改进。
- "I can already see self improving behaviour in our own work."
- "Things are moving towards more autonomous and more useful agents."
- 有评论认为AI在渗透测试中表现出色,尤其是最新版本的模型(如Sonnet 4.5和Opus 4.5)能力显著提升。
对以太坊智能合约安全性的质疑
- 部分评论指出以太坊智能合约的安全性较差,AI的测试结果更多反映了合约本身的漏洞。
- "Says more about the relatively poor infosec on etherium contracts."
- "Exploiting ethereum smart contracts is nothing that new or exciting."
- 也有用户对智能合约的机制提出疑问,认为其容易被操纵。
- "So is it not trivially manipulated by that person?"
- 部分评论指出以太坊智能合约的安全性较差,AI的测试结果更多反映了合约本身的漏洞。
对研究方法的批评
- 有评论认为研究仅模拟已知漏洞,实际意义有限。
- "Oh, so they are pointing their bots at already known exploited contracts."
- "This is actually hilarious, driving a massive rush towards their models."
- 另有用户对图表和数据表达方式提出质疑。
- "That graph is impenetrable. What is it even trying to say?"
- 有评论认为研究仅模拟已知漏洞,实际意义有限。
幽默与讽刺
- 部分评论以幽默方式调侃AI的“道德约束”或研究标题的误导性。
- "Well, that's no fun!"
- "Finally, AI is held accountable for their wrong actions!"
- 部分评论以幽默方式调侃AI的“道德约束”或研究标题的误导性。
总结:评论主要围绕AI在渗透测试中的潜力、以太坊智能合约的安全性问题以及研究方法的局限性展开,观点多样,既有技术乐观派,也有质疑和批评者。