文章摘要
作者通过逆向工程OpenAI新发布的GPT-5-Codex-Mini模型的Codex CLI工具,成功实现了直接调用该模型绘制鹈鹕的功能,并制作视频展示了整个过程。
文章总结
标题:逆向工程Codex CLI工具,让GPT-5-Codex-Mini为我绘制鹈鹕
2025年11月9日,OpenAI发布了一款名为GPT-5-Codex-Mini的新模型,该模型被描述为"GPT-5-Codex的更紧凑、更具成本效益的版本"。目前该模型仅通过Codex CLI工具和VS Code扩展提供,官方表示API访问权限"即将推出"。
作者决定通过逆向工程Codex CLI工具,直接向新模型发送提示。他录制了一段视频展示整个过程和最终成果。
逆向工程过程: 1. 作者注意到OpenAI并未打算让用户直接访问该模型,但Codex CLI是一个开源项目(Apache 2.0许可证),这为逆向工程提供了可能。 2. Codex CLI使用Rust编写,作者通过克隆GitHub仓库并运行Codex自身来构建工具。 3. 作者设计了一个新的子命令"codex prompt",允许直接向OpenAI API发送提示。 4. 经过多次迭代和调试,作者成功实现了该功能,并添加了--debug选项用于调试。
测试结果: 作者尝试让不同模型生成"骑自行车的鹈鹕"SVG图像: - 默认GPT-5-Codex模型:生成的鹈鹕形象较为简单 - GPT-5模型:自行车更精细,鹈鹕呈现线条画风格 - GPT-5-Codex-Mini:生成的图像质量较差,鹈鹕和自行车都显得抽象
调试信息: 通过--debug选项,作者发现: 1. Codex CLI使用的私有API端点是https://chatgpt.com/backend-api/codex/responses 2. API请求必须包含默认指令 3. 可以在用户提示前发送开发者角色的消息
作者将工作代码推送到了GitHub仓库的一个分支中,供有兴趣的人查看。整个过程展示了如何通过逆向工程访问尚未完全开放的AI模型功能。
(注:原文中的具体代码细节和完整终端输出等内容因技术性较强且与主要叙事关系不大,在此摘要中进行了适当简化。)
评论总结
以下是评论内容的总结:
对LLM过度依赖的批评
- 认为人们过度依赖LLM,削弱了自身的研究和问题解决能力
- "People are delegating way too much to LLMs. In turn, this makes your own research or problem-solving skills less sharp."
- "Installing Rust projects is usually as simple as calling
cargo install."
对LLM特殊训练方向的调侃
- 幽默地提出LLM可能被训练来完成奇怪的任务
- "How long before large language models are specifically trained on drawing pelicans riding a bicycle."
对文章和实验的积极评价
- 认为文章有趣,并建议扩展模型数量
- "Was a fun idea and fun read. Thank you."
- "Did you consider expanding the number of models by getting all calls through open router?"
对模型表现的详细分析
- 分享了不同模型在SVG挑战中的表现差异
- "Qwen 30B A3B is the only one that cutely starts on the landscaping and background."
- "Mistral Large & Nemo are just convinced that front shot is better than portrait."
对API限制的失望
- 表达了对ChatGPT API限制的失望
- "those ChatGPT endpoint accept only one system prompt, and one system prompt only"
- "Translating all the tools calls when you cannot control the prompt seemed like a bit of a dead end"