Hacker News 中文摘要

RSS订阅

OpenAI在API中发布GPT-5.5和GPT-5.5 Pro -- OpenAI releases GPT-5.5 and GPT-5.5 Pro in the API

文章摘要

OpenAI于2026年4月发布了GPT-5.5系列模型,支持100万token上下文窗口及图像输入等新功能,同时推出GPT Image 2图像生成模型和更新后的Agents SDK工具包。

文章总结

OpenAI API 更新日志(2024-2026年精选)

2026年4月

  • GPT-5.5系列发布
    23日推出面向专业复杂任务的GPT-5.5GPT-5.5-pro,支持100万token上下文窗口、图像输入、结构化输出、函数调用等功能,默认采用中等推理强度。

    • 新增API端点:v1/responsesv1/chat/completionsv1/batch
    • 亮点:内置计算机操作、托管Shell、补丁应用、MCP集成及网络搜索能力
  • GPT Image 2图像模型
    21日发布新一代图像生成与编辑模型,支持灵活尺寸、高保真输入、按token计费,批量API请求享5折优惠。

  • Agents SDK升级
    15日更新代理工具包,新增沙盒运行环境、开源框架自定义及记忆存储控制功能。

2026年3月

  • 轻量级模型
    17日推出GPT-5.4 mini(支持工具搜索/计算机操作)和GPT-5.4 nano(专注高速低成本任务)。

  • Sora视频API扩展
    12日新增可复用角色引用、20秒生成长度、1080p输出(专业版$0.7/秒)及视频编辑端点(/v1/videos/edits替代旧版remix功能)。

2026年2月

  • 文件与交互增强
    24日扩展input_file支持更多文档类型,新增phase参数标记对话阶段(中间注释/最终答案)。
    23日推出WebSocket模式响应API及实时音频模型gpt-realtime-1.5

2025年关键更新

  • GPT-5系列(8月):发布基础版、mini版和nano版,引入最小推理强度模式及自定义工具调用。
  • 代码专用模型:推出gpt-5-codex等针对Codex环境的优化版本。
  • 企业功能:10月上线企业密钥管理(EKM)和IP白名单,9月支持图像/文件作为工具调用输出。

2024年里程碑

  • GPT-4o系列(5月):发布旗舰模型GPT-4o及经济型GPT-4o mini,显著提升速度与性价比。
  • 开发者工具:10月DevDay推出实时API、模型蒸馏、图像微调、评估系统及提示缓存功能。
  • 管理功能:4月引入项目层级管理,支持按项目设置API密钥和成本限制。

(注:以上为精简摘要,完整日志包含更多技术细节与历史版本信息。)

评论总结

以下是评论内容的总结:

  1. 发布速度与安全措施

    • 有用户质疑OpenAI快速发布GPT-5.5是否与Deepseek的竞争有关("Faster than anticipated because of Deepseek release?")
    • 另有用户指出安全措施可能未充分落实,引用官方前一天的表态与快速发布的矛盾("API deployments require different safeguards... And now this")
  2. API使用与成本争议

    • 用户关注专业API的实际应用场景("Is anyone here actually using pro models through the API?")
    • 多则评论批评定价过高,指出其成本是GPT-5.4的两倍且效率不佳("Exactly double the cost of GPT 5.4","7x the cost" compared to Claude Opus 4.7)
  3. 模型性能问题

    • 开发者测试显示在WordPress插件场景表现垫底("worst model of the leaderboard performance wise")
    • 编程场景中用户抱怨模型未按指令执行("had to prod a model to actually do what I told it to")
  4. 知识更新与版本混乱

    • 用户发现API文档与模型自报的知识截止日期不一致("lists the knowledge cutoff as Dec 01, 2025 but... says June 2024")
    • 企业用户反映版本推送延迟("still seeing only 5.4... will take a few hours")
  5. 伦理与替代方案

    • 有评论呼吁考虑支持OpenAI的伦理影响("ethical aspects of giving money to OpenAI versus alternatives")
    • 自由派用户批评安全过滤机制过度,以医疗应用为例说明其必要性("doctors are using ChatGPT... communicate with non-English speaking patients")

关键引用保留:
- 成本对比:"$5 per MTok input... $30 output" (QuadrupleA)
- 性能质疑:"I dont understand how it can be so bad" (guilamu)
- 安全争议:"Freedom to read about things is good" (rvnx)