文章摘要
OpenAI研究员曾宣称GPT-5解决了10个未解数学难题,但随后在业界批评下撤回声明。DeepMind CEO指出其沟通不当,相关推文已被删除。
文章总结
OpenAI研究人员误报GPT-5数学突破事件始末
核心事件: 2025年10月,OpenAI研究员凯文·威尔(Kevin Weil)在社交平台X发文称GPT-5"解决了10个长期未解决的埃尔德什问题",并推进了另外11个问题的研究。该声明被多名OpenAI研究员转发,引发广泛关注。
事实澄清: 1. 数学界反驳:数学家托马斯·布鲁姆(Thomas Bloom)指出,所谓"未解决问题"仅是其个人网站(erdosproblems.com)上标注的"开放问题",实际指代"个人未知的解决方案",而非学界公认的未解难题。GPT-5只是发现了布鲁姆遗漏的已有研究成果。
业界批评:
- DeepMind CEO 戴密斯·哈萨比斯(Demis Hassabis)称此事"令人尴尬"
- Meta AI负责人杨立昆(Yann LeCun)批评OpenAI陷入自我炒作
研究人员撤回:相关推文被删除,涉事研究员承认表述不当。
事件影响: - 加剧外界对OpenAI"急于求成"的负面印象 - 引发对AI领域过度宣传的质疑 - 暴露顶尖研究人员在重大声明前缺乏事实核查的问题
AI真实价值: 数学家陶哲轩(Terence Tao)指出,GPT-5的实际价值在于: - 高效完成文献检索工作(尤其针对术语不统一或文献分散的领域) - 加速数学研究中的基础性工作 - 推动数学研究的"工业化"进程
关键启示: 当前AI更适合作为研究辅助工具,而非独立解决复杂数学问题。人类专家在成果审核与整合环节仍不可替代。
(注:原文中关于订阅服务、作者介绍等非核心内容已省略,图片描述转为文字说明)
评论总结
评论总结
1. 关于GPT-5数学能力的争议
- 观点:GPT-5并未真正解决未解数学问题,而是通过文献检索找到已知结果。
- 关键引用:
- "OpenAI researchers claimed... the model only found known results" (评论1)
- "GPT-5 was still doing some cognitive lifting to piece it together" (评论8)
- 关键引用:
- 批评:OpenAI的声明被指误导,数学家认为其夸大成果。
- 关键引用:
- "Mathematician Thomas Bloom... criticized the announcement as misleading" (评论1)
- "Another instance of openAI manipulating results" (评论5)
- 关键引用:
2. 对AI行业泡沫的批评
- 观点:AI行业存在炒作泡沫,资源浪费在不可验证的生成式AI上。
- 关键引用:
- "All while so vast resources are being wasted on non-verifiable gen AI slob" (评论5)
- "we are in peak damage control phase of the hype cycle" (评论9)
- 关键引用:
- 对比:DeepMind的务实研究(如AlphaFold)更值得关注。
- 关键引用:
- "DeepMind’s seemingly legitimate AI-assisted cancer treatment breakthrough" (评论15)
- 关键引用:
3. 对OpenAI沟通失误的讨论
- 观点:OpenAI高管的表述存在歧义,但可能是无心之过。
- 关键引用:
- "The main mistake is by Kevin Weil... misunderstood the tweet" (评论14)
- "That seems like an easy mistake to entirely honestly make" (评论16)
- 关键引用:
- 辩护:部分用户认为外界反应过度。
- 关键引用:
- "This seems like a genuine mistake, not malice" (评论17)
- 关键引用:
4. 对LLM能力的现实评估
- 观点:LLM在推理能力上进展有限,更适合辅助性任务(如文献检索)。
- 关键引用:
- "AI models... are currently most helpful for speeding up basic research tasks" (评论1)
- "they’re (still) little beyond... leading a game of Dungeons and Dragons" (评论12)
- 关键引用:
- 质疑:GPT-5的输出可能存在虚假信息。
- 关键引用:
- "It only produces a highly convincing counterfeit" (评论18)
- 关键引用:
5. 对OpenAI研究方向的质疑
- 观点:OpenAI缺乏真正解决数学问题的努力。
- 关键引用:
- "OpenAI does not have a serious effort to actually work on unsolved math problems" (评论11)
- 关键引用:
总结
评论主要围绕GPT-5的数学能力争议展开,批评OpenAI夸大成果和行业炒作,但也有人为其沟通失误辩护。同时,评论指出LLM当前更适合辅助任务,并对AI发展方向提出质疑。不同观点反映了对AI技术期望与现实的落差。