文章摘要
生成式AI发展并不顺利,大型语言模型仍存在可信度问题,无法确保准确性,这与其预期表现存在差距。
文章总结
生成式AI的发展现状并不乐观
作者:Gary Marcus
发布日期:2026年1月12日
核心问题概述
可信度问题
大型语言模型(LLMs)仍然无法被完全信任。最新调查显示,谷歌AI提供的健康建议中仍存在严重错误。记忆而非理解
研究表明,LLMs输出的内容大部分只是对训练数据的记忆,而非真正的理解。这与Geoffrey Hinton早期观点相左。实际价值有限
数据显示,AI仅能完成约2.5%的工作任务(根据《华盛顿邮报》引用的"远程劳动指数"研究),对世界的量化贡献仍然有限。扩展瓶颈
模型规模的扩大已无法有效解决上述问题,技术发展遇到明显瓶颈。
专家观点
作者警告称,基于这种不成熟技术来调整经济和地缘政策是危险的。虽然生成式AI存在商业价值,但其实际影响力远低于开发者宣传的水平。
(原文包含多个新闻截图和详细数据引用,此处保留核心事实和结论性内容,省略了重复性论据和订阅推广等非核心信息)
评论总结
以下是评论内容的总结:
- 对AI技术的批评观点:
- 认为AI被过度炒作,实际效果有限(评论4:"AI has some use cases, but isn’t the world-changing paradigm shift it's marketed as")
- 指出当前AI生成内容质量不佳(评论13:"shitty products that shitty people use to spam us with slop")
- 质疑文章质量低劣(评论1:"just 4 screenshots of articles, not even its own commentary")
- 对AI技术的支持观点:
- 显著提高工作效率(评论5:"saving a small fortune on design and photography";评论21:"reducing my ADO ticket time estimates by 75%")
- 在编程领域的成功应用(评论9:"would have been a week+ of work...in a few hours";评论11:"tasks that would have taken 6-12 hours down to 15-30 minutes")
- 技术进步显著(评论14:"would have been considered pure magic 5 years ago")
- 中立/平衡观点:
- 认为AI是工具而非万能药(评论17:"should be a source of inspo. Not the end all be all")
- 指出评估标准存在问题(评论22:"The goalposts keep getting pushed")
- 承认技术不完美但前景可期(评论7:"new technology is always buggy for awhile")
- 对Gary Marcus的争议:
- 批评其预测不准确(评论18:"Many of these have already been achieved")
- 质疑其专业性(评论15:"How on Earth do people keep taking Gary Marcus seriously?")
- 技术局限性讨论:
- 认为当前AI无法实现AGI(评论4:"not a precursor to AGI";评论19:"GenAI alone won't reach that")
- 指出特定场景下的不足(评论20:"usually amounts to some toy PoC")
- 未来展望:
- 担忧监管风险(评论25:"models banned entirely")
- 技术演进预期(评论24:"Gartner hype cycle"引用)
- 实际影响尚不明确(评论26:"we don't really know yet")