文章摘要
OpenAI正通过Daybreak项目扩大漏洞修复的普及范围,已为浏览器、网络基础设施及FreeBSD、Linux内核等系统发现并生成关键补丁。同时推出Codex Security插件更新、GPT-5.5-Cyber模型及Daybreak网络安全合作伙伴计划,以加速漏洞发现与修复。
文章总结
好的,这是根据您的要求,对原文主要内容进行的中文重述,已保留关键细节并删减了与主题无关的内容:
标题:Daybreak:为全球每个组织提供安全保障的工具
OpenAI正在扩展其“Daybreak”项目,旨在以机器速度普及对易受攻击软件的修补工作。例如,其模型已能发现并生成针对主流浏览器、网络基础设施以及FreeBSD和Linux内核等操作系统的关键漏洞的补丁。为扩大这些能力的影响,OpenAI推出了以下举措:
- Codex Security: 发布更新版插件,将内部及客户使用模型的经验融入解决方案,以加速发现和修补现有系统漏洞,并自动防止新漏洞进入生产环境。
- GPT-5.5-Cyber: 在初步预览后,向受信任的防御者发布完整版本。该模型在CyberGym基准测试中达到85.6%的性能,超越了GPT-5.5的81.8%。
- Daybreak网络安全合作伙伴计划: 使安全合作伙伴能够通过其产品和服务,将最强大模型的安全能力惠及更多组织。
- “修补地球”计划: 与Trail of Bits、HackerOne等机构合作,帮助广泛使用的开源项目将发现转化为修复。已有超过30个开源项目承诺参与,包括cURL、Go、Python等。
网络安全防御的转折点
AI已改变网络安全的格局。过去,发现漏洞是瓶颈;现在,由于AI加速了漏洞发现,防御者被海量漏洞报告淹没,因此修补漏洞成为了新的瓶颈。前沿AI模型能导航大型代码库、推理攻击路径、验证假设并发现隐藏的安全问题。防御者迫切需要这些能力,也需要工具来修复新发现的漏洞。
漏洞报告本身无法保护任何人,价值在于验证、理解影响、开发测试补丁、协调披露并帮助部署修复。OpenAI正与合作伙伴一起投资改进这些后续步骤,以增强防御者能力,将模型能力转化为实际的风险降低。
前沿防御能力不应集中在少数人手中。Daybreak整合了OpenAI模型的前沿网络能力、可信访问、Codex Security工作流及生态系统合作伙伴,帮助经批准的防御者在现有工作流中验证漏洞、确定风险优先级、生成和测试修复方案。目标是让组织在日益加速的网络威胁环境中保持安全。
从发现到修复:Codex Security
自3月发布研究预览版以来,Codex Security已扫描超过3000万个代码库中的3000万次提交,人工审核员标记了超过7万个已修复的发现,另有超过50万个发现被自动判定为已修复。这正是当前修补工作所需的规模。
Codex Security的核心理念是:通过直接集成到Codex中,为每位软件开发者配备一名“安全工程师”。它不仅能生成警报,还能理解代码和威胁模型,识别漏洞,判断受影响代码是否可达,收集验证证据,开发针对性补丁并验证结果。人类始终控制着调查哪些发现、应用哪些更改以及共享哪些信息。
今天发布的更新版插件支持开箱即用的防御性安全工作流。开发者可以运行深度扫描或审查近期更改,生成包含严重性、代码位置、验证证据和修复指导的报告,追踪攻击路径,构建威胁模型,验证发现,并生成针对特定代码库的补丁以供审查。该插件还能对来自扫描器、公告、漏洞赏金报告或工单系统的现有发现进行分类、验证,并大规模自动生成补丁,以快速关闭积压的漏洞。
更新GPT-5.5-Cyber:能力与许可性的结合
OpenAI发布了GPT-5.5-Cyber的更新版本,该模型在高级授权网络安全工作中既更许可又更强大。它是目前发现和帮助修补软件漏洞的最强模型,同时保留了GPT-5.5的通用智能和处理长复杂任务的能力。该模型能在大型代码库中进行更深入的分析,帮助防御者完成完整的修复循环。
在CyberGym基准测试中,更新后的GPT-5.5-Cyber达到85.6%,高于GPT-5.5的81.8%。在ExploitGym和SEC-bench Pro等更严苛的基准测试中,它也显著优于GPT-5.5。OpenAI正与美国政府就网络安全方法进行持续对话,包括与相关机构合作进行部署前测试和标准实施。
对于大多数防御者而言,带有可信访问和Codex Security的GPT-5.5仍是合适的起点。GPT-5.5-Cyber则面向需要最先进网络能力和更许可行为的已验证防御者,并配以更强的验证、监控和审查。
与安全生态系统合作
作为扩展的一部分,OpenAI还启动了“Daybreak网络安全合作伙伴计划”,与领先的安全软件和服务提供商合作。参与伙伴可以在其产品和服务中使用GPT-5.5,让客户受益于其防御能力,同时将直接模型访问权保留在合作伙伴手中。OpenAI将与合作伙伴合作,加强在安全生态系统中负责任地部署这些能力所需的安全保障、监控和滥用预防标准。
“修补地球”计划:为开源项目落地修复
“修补地球”计划旨在帮助维护者从发现漏洞转向修复漏洞。OpenAI资助专家安全研究员,并为他们配备Codex Security和先进模型,与开源维护者直接合作。由于AI使得更快发现和修补更多漏洞成为可能,这也给维护者带来了更多工作。因此,该计划围绕专家人工安全审查构建。每次合作都从研究员与维护者的咨询开始,维护者定义优先级和披露流程,研究员则端到端管理验证和去重工作,显著减轻维护者负担。参与项目可获得ChatGPT Pro、Codex Security有条件访问权限和API积分。初始的五天冲刺已发现数百个待审查问题,合并了数十个补丁。
保护关键基础设施和敏感系统
OpenAI正与全球各国政府和机构密切合作,提升其防御性网络安全能力,保护关键基础设施。过去一个月,已与澳大利亚、加拿大、法国、德国、日本、韩国及欧盟机构建立了可信访问合作伙伴关系。OpenAI计划与符合条件的关键基础设施运营商(包括政府网络)直接合作,为其运营的系统制定专门的安全保障措施。
未来展望
Daybreak整合了模型、Codex Security、“修补地球”计划、专家研究员、维护者、安全合作伙伴、关键基础设施运营商和可信访问控制,以帮助人类防御者应对挑战。公共和私营部门的组织可以与OpenAI Daybreak合作,识别、验证和修复其构建和依赖的软件中的漏洞。目标是超越使用模型发现更多漏洞,迈向一个软件更安全、网络更具韧性的世界。
评论总结
根据评论内容,主要观点和论据如下:
1. 对模型发布方式的评价(正面) - 评论2(lionkor)认为OpenAI的发布方式成熟,不像某些公司“太危险不能发布”的幼稚说法,并用锤子类比说明工具本身无过。 - 评论12(elashri)指出,如果政府不干预,这将是“保持沉默”的好例子,尤其是对像Anthropic那样靠炒作撒谎的公司。
2. 对模型可用性和公平性的质疑(负面) - 评论7(taspeotis)抱怨付费用户无法使用最佳模型进行代码安全审计,认为不公平:“I pay money to Anthropic, and I pay money to OpenAI, and neither of them will let me use their best models for securing the software I work on.” - 评论11(theplumber)质疑为何付费用户仍无访问权限,并讽刺地建议“pay a security researcher to run codex on my code”。 - 评论17(egorfine)从非美国用户角度批评访问限制,指出KYC要求排除了大量人群:“I happen to be a citizen of a country that is not the USA... in the eyes of OpenAI I do not exist.”
3. 对政治因素的猜测(负面) - 评论10(mentalgear)指出OpenAI发布Claude Mythos级模型无政府限制,而Anthropic的模型被以“安全”理由撤回,暗示与OpenAI联合创始人向现任政府捐款有关:“It certainly has nothing to do with openAI's co-founders donating to the current administrations election fund.”
4. 对模型实际效果的关注(中性/正面) - 评论15(lisa_luoyf)好奇模型在混乱真实环境中的表现:“how well this holds up in messy real-world environments”。 - 评论16(Recursing)推荐实际测试,称其在自己项目中发现了真实安全问题,误报很少:“It found a real security issue in a project of mine, with very few false-positives.”
5. 对监管和合规的担忧(中性) - 评论9(spwa4)询问欧盟CRA是否强制欧洲公司付费使用此模型并更新软件。
6. 对基准测试的质疑(负面) - 评论14(sigbeta)认为基准测试无意义,因为模型不可部署:“whats the point of a benchmark if its not deployable? another glasswing pr stunt to me.”
总结: 评论者对OpenAI发布网络安全模型的态度分化明显。正面观点认为发布方式成熟、模型实际有效;负面观点集中于访问限制不公平、政治干预嫌疑、以及非美国用户被排除在外。同时,对模型在真实环境中的表现和监管影响存在关注。