文章摘要
AI之所以令人印象深刻,部分原因在于我们在语义网和个人计算领域的失败。现代大型语言模型(LLM)能够从互联网的混乱中提取答案,而传统搜索引擎和文件管理系统则难以有效组织和检索信息。例如,ChatGPT能迅速回答复杂问题,而Google的AI工具却表现不佳。这种成功反映了我们在信息组织方面的不足,促使AI通过搜索捷径来弥补这一缺陷。
文章总结
人工智能之所以令人印象深刻,是因为我们在语义网和个人计算上的失败
除非有人专门写过相关文章,否则普通的全文搜索引擎无法回答这样的问题:
在瑞典国王古斯塔夫四世·阿道夫向法国宣战的那一年,英国建立的第一个小型殖民地的国旗上出现了哪种动物?
但ChatGPT在几秒钟内就给出了正确答案。
多米尼加国旗上的Sisserou鹦鹉是该国独有的物种。英国于1805年在该岛建立了小型殖民地。
相比之下,谷歌的AI工具表现糟糕。

现代基于大语言模型(LLM)的人工智能最出色的应用之一,就是从互联网的混乱中提取答案。它的成功部分归因于我们未能构建出有效组织信息的系统。
这种产品模式并不新鲜。以Google Drive为例:它本质上是一个云端的文件系统,带有文件夹和文件,但其体验却比过去30年几乎所有的桌面文件管理应用都要差。在那里整理文件既困难又繁琐。因此,谷歌选择了一条捷径:全文搜索。只需将所有内容丢进去,稍后通过输入关键词来查找。
放弃结构、依赖搜索的模式已悄然成为主流。这里的“搜索”是一个广义的术语:它可以指经典的文本匹配,也可以指在复杂模型和权重中进行多维度的标记匹配。为什么还要创建一个组织良好的电子商务网站?只需添加一个搜索栏,并在每个商品页面上堆砌关键词即可。为什么还要编写高质量的用户文档?只需添加一个支持聊天机器人。
还记得语义网吗?互联网本应演变为语义结构化、相互链接、机器可读的数据,从而带来巨大的机遇。但这从未实现。不仅数据仍然是非结构化的,缺乏元数据,甚至由于从简单的、部分结构化的HTML转向了由JavaScript驱动的动态div堆砌,非结构化数据的表示也变得难以被机器读取。
我们也从未实现真正的个人计算。计算机本可以成为个人知识库,具有类似HyperCard的结构化语义连接,充分利用语义网和开放标准。
我的观点是,如果所有知识都以结构化的方式存储,并具有丰富的语义链接,那么非常原始的自然语言处理算法就可以解析像文章开头那样的提问,并使用数量级更少的计算资源找到答案。最重要的是:知识和连接将保持可访问性和可理解性,而不是隐藏在难以穿透的AI模型中。
人工智能并非优雅设计的胜利,而是一种蛮力的解决方案。像ChatGPT这样的大语言模型可以从混乱中推断出结构。它们扫描非结构化的网络,并在一切之上构建短暂的语义地图。这不是传统意义上的知识……或者,也许这正是知识的本质?
评论总结
评论主要围绕以下几个观点展开:
AI与语义网的对比与批评:
- 评论者认为AI(如LLMs)虽然强大,但并未实现语义网的愿景。语义网未能普及的原因在于缺乏统一的结构化数据标准。
- 引用:"Remember Semantic Web? The web was supposed to evolve into semantically structured, linked, machine-readable data that would enable amazing opportunities. That never happened."(评论6)
- 引用:"If all knowledge were stored in a structured way with rich semantic linking, then very primitive natural language processing algorithms could parse question like the example at the beginning of the article."(评论7)
AI的局限性与“暴力破解”:
- 评论者指出,AI的成功更多依赖于大规模计算资源,而非优雅的设计。尽管AI在某些任务上表现出色,但其底层机制并不完美。
- 引用:"AI is not a triumph of elegant design, but a brute-force workaround."(评论15)
- 引用:"LLMs re-hydrate these for us, making them significantly more palatable; if you're used to gnawing dried fruit, they seem amazing."(评论14)
个人计算的失败与AI的替代:
- 评论者认为,个人计算未能充分发挥计算机的潜力,而AI则提供了一种新的交互方式,尽管它仍存在缺陷。
- 引用:"Most people can't use the power of the computers they have effectively. Maintaining the data in Excel spreadsheets for most people is like manual labour."(评论16)
- 引用:"I'm pretty sure AI _is_ 'personal computing'."(评论11)
技术与社会的复杂性:
- 评论者强调,技术发展受制于社会复杂性和不同利益方的博弈,理想的标准化难以实现。
- 引用:"Semantic web was a standard suggested by Google, but unless every browser got on board to break web pages that didn't conform to that standard, then people aren't going to fully follow it."(评论13)
- 引用:"It's not like Google didn't _try_!"(评论29)
AI对搜索引擎的影响:
- 评论者讨论了AI对搜索引擎(如Google)广告业务的潜在威胁,认为AI可能减少用户访问广告页面的需求。
- 引用:"How do LLMs help Google, an ad company, generate more ad revenue. LLMs drive the traffic away from websites, give you answer directly without needing bother with ads."(评论20)
总结:评论者对AI的成就表示认可,但也对其局限性、未能实现语义网愿景以及对社会和技术发展的复杂影响提出了批评。