文章摘要
OpenAI于2026年4月发布了GPT-5.5系列模型,支持100万token上下文窗口及图像输入等新功能,同时推出GPT Image 2图像生成模型和更新后的Agents SDK工具包。
文章总结
OpenAI API 更新日志(2024-2026年精选)
2026年4月
GPT-5.5系列发布
23日推出面向专业复杂任务的GPT-5.5和GPT-5.5-pro,支持100万token上下文窗口、图像输入、结构化输出、函数调用等功能,默认采用中等推理强度。- 新增API端点:
v1/responses、v1/chat/completions、v1/batch - 亮点:内置计算机操作、托管Shell、补丁应用、MCP集成及网络搜索能力
- 新增API端点:
GPT Image 2图像模型
21日发布新一代图像生成与编辑模型,支持灵活尺寸、高保真输入、按token计费,批量API请求享5折优惠。Agents SDK升级
15日更新代理工具包,新增沙盒运行环境、开源框架自定义及记忆存储控制功能。
2026年3月
轻量级模型
17日推出GPT-5.4 mini(支持工具搜索/计算机操作)和GPT-5.4 nano(专注高速低成本任务)。Sora视频API扩展
12日新增可复用角色引用、20秒生成长度、1080p输出(专业版$0.7/秒)及视频编辑端点(/v1/videos/edits替代旧版remix功能)。
2026年2月
- 文件与交互增强
24日扩展input_file支持更多文档类型,新增phase参数标记对话阶段(中间注释/最终答案)。
23日推出WebSocket模式响应API及实时音频模型gpt-realtime-1.5。
2025年关键更新
- GPT-5系列(8月):发布基础版、mini版和nano版,引入最小推理强度模式及自定义工具调用。
- 代码专用模型:推出
gpt-5-codex等针对Codex环境的优化版本。 - 企业功能:10月上线企业密钥管理(EKM)和IP白名单,9月支持图像/文件作为工具调用输出。
2024年里程碑
- GPT-4o系列(5月):发布旗舰模型GPT-4o及经济型GPT-4o mini,显著提升速度与性价比。
- 开发者工具:10月DevDay推出实时API、模型蒸馏、图像微调、评估系统及提示缓存功能。
- 管理功能:4月引入项目层级管理,支持按项目设置API密钥和成本限制。
(注:以上为精简摘要,完整日志包含更多技术细节与历史版本信息。)
评论总结
以下是评论内容的总结:
发布速度与安全措施
- 有用户质疑OpenAI快速发布GPT-5.5是否与Deepseek的竞争有关("Faster than anticipated because of Deepseek release?")
- 另有用户指出安全措施可能未充分落实,引用官方前一天的表态与快速发布的矛盾("API deployments require different safeguards... And now this")
API使用与成本争议
- 用户关注专业API的实际应用场景("Is anyone here actually using pro models through the API?")
- 多则评论批评定价过高,指出其成本是GPT-5.4的两倍且效率不佳("Exactly double the cost of GPT 5.4","7x the cost" compared to Claude Opus 4.7)
模型性能问题
- 开发者测试显示在WordPress插件场景表现垫底("worst model of the leaderboard performance wise")
- 编程场景中用户抱怨模型未按指令执行("had to prod a model to actually do what I told it to")
知识更新与版本混乱
- 用户发现API文档与模型自报的知识截止日期不一致("lists the knowledge cutoff as Dec 01, 2025 but... says June 2024")
- 企业用户反映版本推送延迟("still seeing only 5.4... will take a few hours")
伦理与替代方案
- 有评论呼吁考虑支持OpenAI的伦理影响("ethical aspects of giving money to OpenAI versus alternatives")
- 自由派用户批评安全过滤机制过度,以医疗应用为例说明其必要性("doctors are using ChatGPT... communicate with non-English speaking patients")
关键引用保留:
- 成本对比:"$5 per MTok input... $30 output" (QuadrupleA)
- 性能质疑:"I dont understand how it can be so bad" (guilamu)
- 安全争议:"Freedom to read about things is good" (rvnx)