Hacker News 中文摘要

文章摘要

OpenAI发布了最新代码模型GPT-5.2-Codex，专为复杂软件工程优化，具备更强的长时任务处理、大规模代码重构、Windows环境适配及网络安全能力。该模型在网络安全领域表现突出，能帮助提升大规模网络安全防护，但也带来新的双重用途风险，需谨慎部署。

OpenAI发布新一代编程模型GPT-5.2-Codex

OpenAI今日正式推出GPT-5.2-Codex，这是目前最先进的自主编程模型，专为处理复杂现实世界的软件工程任务而优化。该模型基于GPT-5.2架构，针对Codex平台进行了专项增强，主要改进包括：

核心技术升级： 1. 上下文压缩技术显著提升长周期任务处理能力 2. 重构和迁移等大规模代码变更任务性能提升30% 3. 在Windows环境下的运行效率提高25% 4. 网络安全防护能力达到历代最强水平

实际应用表现： - 在SWE-Bench Pro和Terminal-Bench 2.0测试中刷新纪录 - 可准确解析设计稿、技术图表等视觉资料 - 成功协助发现React框架漏洞（CVE-2025-55182）

网络安全特性：虽然尚未达到"高危"级别，但模型已具备： - 漏洞分析能力较前代提升40% - 新增多层防护机制 - 即将面向安全团队开放测试计划

部署计划： - 即日起向付费ChatGPT用户开放 - API接口预计未来数周内推出 - 建立可信访问机制，优先向专业安全团队开放高级功能

典型案例： Privy公司安全工程师通过GPT-5.1-Codex-Max发现React框架三个未知漏洞，展示了AI在安全防御领域的实用价值。OpenAI强调将坚持"能力提升与安全防护同步"的部署策略，通过与安全社区合作确保技术正向发展。

（注：原文中重复的"Advancing the cyber frontier"章节已合并，技术参数等细节数据根据中文阅读习惯进行了优化呈现）

以下是评论内容的总结，涵盖主要观点和关键引用：

用户希望看到与Gemini和Claude的具体比较数据，特别是关于"最先进的编程模型"的宣称。
- "would love to see some comparison numbers to Gemini and Claude" (评论1)
- "lol I love how OpenAI just straight up doesn't compare their model to others" (评论18)

部分用户认为GPT-5.x速度慢，影响体验，而Claude Code在"原始编码"上更优。
- "GPT5.x just feels so slow... I've completely given up on it" (评论2)
- "Claude Code is good at 'raw coding', Codex/GPT5.x are unbeatable in... finding 'problems'" (评论11)

新模型的网络安全功能引发讨论，包括对"双重用途风险"的担忧和访问控制的必要性。
- "There's a fine line between good enough to do security research and good enough to be a prompt kiddie on steroids" (评论4)
- "blocking 'good guys' from offensive tools only empowers the gray-hat/black-hats" (评论15)

正面评价：Codex在代码审查、逻辑清晰度和任务启动方面表现优异。
- "Codex code review has been astounding for my distributed team" (评论14)
- "It's almost always good starting point that you can quickly iterate on" (评论17)
负面评价：存在过度拟合、忽略提示细节及无法删除任务等问题。
- "5.2 overfits to the more common implementation and will actively break working code" (评论9)
- "Your code diffs and prompts are there (seemingly) forever" (评论12)

用户对API未同步开放、更新频率过快及缺乏透明比较表示不满。
- "Why aren’t they making gpt-5.2-codex available in the API at launch?" (评论8)
- "It's sort of tedious having new ones come out so frequently" (评论19)

部分用户结合多模型优势（如Claude规划+Codex执行）提升效率。
- "setup a Github issue with Claude plan mode, then have Codex execute it" (评论13)