Hacker News 中文摘要

RSS订阅

坦白讲，生成式AI发展得并不顺利 -- Let's be honest, Generative AI isn't going all that well

原文链接 | HN讨论 | 2026-01-14 10:18:34

文章摘要

生成式AI发展并不顺利，大型语言模型仍存在可信度问题，无法确保准确性，这与其预期表现存在差距。

文章总结

生成式AI的发展现状并不乐观

作者：Gary Marcus
发布日期：2026年1月12日

核心问题概述

可信度问题
大型语言模型（LLMs）仍然无法被完全信任。最新调查显示，谷歌AI提供的健康建议中仍存在严重错误。
记忆而非理解
研究表明，LLMs输出的内容大部分只是对训练数据的记忆，而非真正的理解。这与Geoffrey Hinton早期观点相左。
实际价值有限
数据显示，AI仅能完成约2.5%的工作任务（根据《华盛顿邮报》引用的"远程劳动指数"研究），对世界的量化贡献仍然有限。
扩展瓶颈
模型规模的扩大已无法有效解决上述问题，技术发展遇到明显瓶颈。

专家观点

作者警告称，基于这种不成熟技术来调整经济和地缘政策是危险的。虽然生成式AI存在商业价值，但其实际影响力远低于开发者宣传的水平。

（原文包含多个新闻截图和详细数据引用，此处保留核心事实和结论性内容，省略了重复性论据和订阅推广等非核心信息）

评论总结

以下是评论内容的总结：

对AI技术的批评观点：

认为AI被过度炒作，实际效果有限（评论4："AI has some use cases, but isn’t the world-changing paradigm shift it's marketed as"）
指出当前AI生成内容质量不佳（评论13："shitty products that shitty people use to spam us with slop"）
质疑文章质量低劣（评论1："just 4 screenshots of articles, not even its own commentary"）

对AI技术的支持观点：

显著提高工作效率（评论5："saving a small fortune on design and photography"；评论21："reducing my ADO ticket time estimates by 75%"）
在编程领域的成功应用（评论9："would have been a week+ of work...in a few hours"；评论11："tasks that would have taken 6-12 hours down to 15-30 minutes"）
技术进步显著（评论14："would have been considered pure magic 5 years ago"）

中立/平衡观点：

认为AI是工具而非万能药（评论17："should be a source of inspo. Not the end all be all"）
指出评估标准存在问题（评论22："The goalposts keep getting pushed"）
承认技术不完美但前景可期（评论7："new technology is always buggy for awhile"）

对Gary Marcus的争议：

批评其预测不准确（评论18："Many of these have already been achieved"）
质疑其专业性（评论15："How on Earth do people keep taking Gary Marcus seriously?"）

技术局限性讨论：

认为当前AI无法实现AGI（评论4："not a precursor to AGI"；评论19："GenAI alone won't reach that"）
指出特定场景下的不足（评论20："usually amounts to some toy PoC"）

未来展望：

担忧监管风险（评论25："models banned entirely"）
技术演进预期（评论24："Gartner hype cycle"引用）
实际影响尚不明确（评论26："we don't really know yet"）