文章摘要
OpenAI和Deepmind宣布与Codeforces合作,共同推动编程竞赛和技术创新,Codeforces平台将举办全球编程比赛,吸引更多开发者参与。
文章总结
OpenAI和Deepmind近日在Codeforces上宣布,他们的模型在2025年国际大学生程序设计竞赛(ICPC)世界总决赛中取得了金牌级别的表现。这一消息通过两条相隔仅5分钟的推文发布,分别来自OpenAI和Deepmind的团队成员。
根据OpenAI的推文,他们的模型在ICPC的监督下成功解决了所有12道问题,展示了AI在编程竞赛中的强大能力。而Deepmind的团队则使用了Gemini模型,解决了10道问题。这一成就标志着AI首次在重大编程竞赛中超越了所有参赛的人类选手,尽管ICPC的题目可能更倾向于AI友好的风格,但这仍然是一个里程碑式的事件。
此外,OpenAI的模型表现尤为突出,完全自动化地解决了所有问题,而Deepmind的团队则是由人类与AI合作完成。这一进展引发了关于AI在编程竞赛中未来应用的广泛讨论,同时也引发了对这些高级模型成本和可用性的关注。
总的来说,OpenAI和Deepmind的这次宣布不仅展示了AI在编程领域的潜力,也为未来的技术发展提供了新的方向。
评论总结
评论主要围绕AI模型在编程竞赛中的表现展开,观点分为支持和质疑两派。
支持观点: 1. AI模型表现卓越:评论者认为AI模型在IMO、IOI、ICPC等竞赛中取得金牌成绩,甚至超越人类团队,展示了其强大的能力。 - "So this year SotA models have gotten gold at IMO, IoI, ICPC and beat 9/10 humans in that atcoder thing that tested optimisation problems." (评论1) - "our OpenAI reasoning system got a perfect score of 12/12" (评论5)
- 技术突破:评论者认为这些成果标志着AI技术的重大进步,尽管存在透明度问题,但结果本身令人印象深刻。
- "I think this is huge news, and I cannot imagine anything other than models with this capability having a massive impact all over the world." (评论2)
- "Still extremely impressive either way." (评论15)
质疑观点: 1. 透明度不足:评论者质疑这些结果的真实性,认为缺乏第三方监督和详细的技术细节,难以完全信任。 - "Unfortunately there was very little transparency on how they managed those results and the only source was a Twitter post." (评论2) - "Sharing links to a couple of tweets is not a blog post." (评论6)
计算资源不公:评论者指出,AI模型使用了远超普通用户的计算资源,导致结果不具备普遍性,且成本高昂。
- "By that it seems that they're just cranking up the compute beyond reasonable levels in order to gain PR points against each other." (评论4)
- "It's not a case of Google outwitting the worlds best programmers, but rather that by searching for solutions for 30 min on god knows what kind of cloud hardware." (评论11)
实用性存疑:评论者认为,尽管AI在竞赛中表现出色,但在日常任务中仍不可靠,且成本过高,实际应用价值有限。
- "Whats the point? These models are still unreliable in every day work." (评论14)
- "Still great work, but it's less useful if the cost is actually higher than hiring someone with the same level." (评论7)
总结:评论者对AI模型在编程竞赛中的表现持两极态度,一方面认可其技术突破,另一方面质疑其透明度、资源使用和实际应用价值。