Hacker News 中文摘要

文章摘要

OpenAI研究员曾宣称GPT-5解决了10个未解数学难题，但随后在业界批评下撤回声明。DeepMind CEO指出其沟通不当，相关推文已被删除。

核心事件： 2025年10月，OpenAI研究员凯文·威尔（Kevin Weil）在社交平台X发文称GPT-5"解决了10个长期未解决的埃尔德什问题"，并推进了另外11个问题的研究。该声明被多名OpenAI研究员转发，引发广泛关注。

事实澄清： 1. 数学界反驳：数学家托马斯·布鲁姆（Thomas Bloom）指出，所谓"未解决问题"仅是其个人网站（erdosproblems.com）上标注的"开放问题"，实际指代"个人未知的解决方案"，而非学界公认的未解难题。GPT-5只是发现了布鲁姆遗漏的已有研究成果。

业界批评：
- DeepMind CEO 戴密斯·哈萨比斯（Demis Hassabis）称此事"令人尴尬"
- Meta AI负责人杨立昆（Yann LeCun）批评OpenAI陷入自我炒作
研究人员撤回：相关推文被删除，涉事研究员承认表述不当。

事件影响： - 加剧外界对OpenAI"急于求成"的负面印象 - 引发对AI领域过度宣传的质疑 - 暴露顶尖研究人员在重大声明前缺乏事实核查的问题

AI真实价值： 数学家陶哲轩（Terence Tao）指出，GPT-5的实际价值在于： - 高效完成文献检索工作（尤其针对术语不统一或文献分散的领域） - 加速数学研究中的基础性工作 - 推动数学研究的"工业化"进程

关键启示： 当前AI更适合作为研究辅助工具，而非独立解决复杂数学问题。人类专家在成果审核与整合环节仍不可替代。

（注：原文中关于订阅服务、作者介绍等非核心内容已省略，图片描述转为文字说明）

观点：GPT-5并未真正解决未解数学问题，而是通过文献检索找到已知结果。
- 关键引用：
  - "OpenAI researchers claimed... the model only found known results" (评论1)
  - "GPT-5 was still doing some cognitive lifting to piece it together" (评论8)
批评：OpenAI的声明被指误导，数学家认为其夸大成果。
- 关键引用：
  - "Mathematician Thomas Bloom... criticized the announcement as misleading" (评论1)
  - "Another instance of openAI manipulating results" (评论5)

观点：AI行业存在炒作泡沫，资源浪费在不可验证的生成式AI上。
- 关键引用：
  - "All while so vast resources are being wasted on non-verifiable gen AI slob" (评论5)
  - "we are in peak damage control phase of the hype cycle" (评论9)
对比：DeepMind的务实研究（如AlphaFold）更值得关注。
- 关键引用：
  - "DeepMind’s seemingly legitimate AI-assisted cancer treatment breakthrough" (评论15)

观点：OpenAI高管的表述存在歧义，但可能是无心之过。
- 关键引用：
  - "The main mistake is by Kevin Weil... misunderstood the tweet" (评论14)
  - "That seems like an easy mistake to entirely honestly make" (评论16)
辩护：部分用户认为外界反应过度。
- 关键引用：
  - "This seems like a genuine mistake, not malice" (评论17)

观点：LLM在推理能力上进展有限，更适合辅助性任务（如文献检索）。
- 关键引用：
  - "AI models... are currently most helpful for speeding up basic research tasks" (评论1)
  - "they’re (still) little beyond... leading a game of Dungeons and Dragons" (评论12)
质疑：GPT-5的输出可能存在虚假信息。
- 关键引用：
  - "It only produces a highly convincing counterfeit" (评论18)

观点：OpenAI缺乏真正解决数学问题的努力。
- 关键引用：
  - "OpenAI does not have a serious effort to actually work on unsolved math problems" (评论11)

评论主要围绕GPT-5的数学能力争议展开，批评OpenAI夸大成果和行业炒作，但也有人为其沟通失误辩护。同时，评论指出LLM当前更适合辅助任务，并对AI发展方向提出质疑。不同观点反映了对AI技术期望与现实的落差。