文章摘要
Claude的记忆系统与ChatGPT截然不同,它每次对话都从零开始,仅在用户明确调用时激活记忆,且仅通过搜索原始聊天记录来回忆,不生成摘要或压缩档案。这种设计反映了两种AI助手在用户需求和产品哲学上的显著差异,展示了AI记忆设计的广阔空间。
文章总结
标题:Claude的记忆系统:一种不同的哲学
主要内容:
本文探讨了Claude与ChatGPT在记忆系统设计上的显著差异,并分析了这些差异背后的用户群体和产品哲学。
Claude的记忆系统工作原理: Claude的记忆系统有两个基本特点:首先,每次对话开始时,Claude都是一张白纸,没有任何预加载的用户档案或对话历史,只有在用户明确调用时,记忆系统才会激活。其次,Claude通过直接搜索用户的原始对话历史来回忆信息,而不是使用AI生成的摘要或压缩档案。
当Claude检测到用户通过诸如“我们之前讨论过什么”、“继续我们上次的话题”或“记得我们谈过”等短语调用记忆时,它会使用两种检索工具:conversation_search和recent_chats。这些工具类似于网页搜索或代码执行,用户可以看到它们实时激活并等待Claude搜索历史记录。搜索完成后,Claude会综合检索到的对话内容来回答问题或继续讨论。
对话搜索:
conversation_search工具帮助用户基于关键词或主题搜索整个对话历史。例如,当用户询问关于某个特定话题的过去对话时,Claude会找到相关对话并综合成一个连贯的总结。
时间聊天检索:
recent_chats工具提供基于时间的对话历史访问。用户可以通过指定时间段来检索最近的对话,Claude会按时间顺序检索并提供总结。
ChatGPT与Claude的对比: ChatGPT和Claude在功能上曾经相似,但如今它们的路径已经显著分化。ChatGPT已经演变为一个面向大众市场的消费产品,而Claude则专注于开发者工具、编码和专业工作流程。这种差异在记忆系统的实现上得到了完美体现。
ChatGPT的数亿周活跃用户来自各种背景,他们希望产品能够自动记住他们的偏好,而无需关心背后的机制。ChatGPT的记忆系统自动加载,创建即时个性化体验,并构建详细的用户档案,以支持未来的目标功能或货币化。
相比之下,Claude的用户群体更为技术化,他们理解大型语言模型的工作原理,并习惯于在每一层级进行显式控制。他们决定何时调用记忆,并愿意为此付出一定的延迟代价。记忆对他们来说只是另一个工具,而不是一个始终开启的功能。这个群体不需要也不希望有广泛的用户画像,他们需要一个强大、可预测的专业工具,同时也更加注重隐私。
记忆设计空间: ChatGPT和Claude作为顶级AI助手,却构建了完全相反的记忆系统,这表明AI记忆设计空间非常广阔,没有唯一的正确答案或通用技术。设计者必须从用户的需求出发,根据第一原则进行构建。
目前,我们仍处于未知领域。这些工具出现不到三年,没有人知道当用户使用同一个AI助手十年后会发生什么。它应该记住多少?如何处理多年积累的上下文?与此同时,AI应用正在经历寒武纪大爆发,每个应用都在尝试自己的记忆方法,而底层模型每周都在变得更强大。没有现成的剧本,也没有确定的最佳实践,只有不断尝试和探索。
结语: 作者表示,随着对记忆系统的深入研究,他越来越着迷。在接下来的几周里,他将剖析不同的架构,分析新的方法,并跟踪最新的研究进展。
评论总结
评论内容主要围绕ChatGPT和Claude的记忆功能及其未来发展展开,观点多样且涉及技术、隐私和商业目标等多个方面。
对ChatGPT的担忧
- richwater认为ChatGPT正在引发与传统社交媒体相似的担忧,尤其是其优化用户注意力的策略令人不安。
引用: "ChatGPT is quickly approaching (perhaps bypassing?) the same concerns that parents, teachers, psychologists had with traditional social media."
引用: "That they're clearly optimizing for people's attention is more worrisome."
- richwater认为ChatGPT正在引发与传统社交媒体相似的担忧,尤其是其优化用户注意力的策略令人不安。
记忆功能的比较与偏好
- qgin喜欢Claude的记忆功能,但关闭了ChatGPT的记忆功能,因为后者在不同任务间产生不相关的联想。
引用: "I love Claude's memory implementation, but I turned memory off in ChatGPT."
引用: "It was weird when it was making associations across things that aren't actually associated in my life." - modeless指出ChatGPT的记忆功能更适合日常对话,而Claude则更适合技术任务。
引用: "Claude's is better suited for solving technical tasks while ChatGPT's is more suited to improving casual conversation."
- qgin喜欢Claude的记忆功能,但关闭了ChatGPT的记忆功能,因为后者在不同任务间产生不相关的联想。
技术实现与未来发展
- ankit219认为ChatGPT的记忆功能旨在创建用户画像,而Claude则更关注长期抽象记忆。
引用: "ChatGPT wants to remember you as a person, while Claude cares about how your previous interactions were."
引用: "Claude's memory implementation feels more oriented towards the long term goal of accessing abstractions and past interactions." - modeless预测未来可能会跳过语言表示,直接存储和检索记忆,这可能是实现AGI的关键突破。
引用: "Someone is going to figure out how to store and retrieve memories in an encoded form that skips the language representation."
- ankit219认为ChatGPT的记忆功能旨在创建用户画像,而Claude则更关注长期抽象记忆。
隐私与数据安全
- threecheese从隐私角度提出对外部记忆存储的担忧,希望避免在推理过程中泄露个人信息。
引用: "I’d prefer to not just spell it out for them. 'Interests: MacOS, bondage, discipline, Baseball'."
- threecheese从隐私角度提出对外部记忆存储的担忧,希望避免在推理过程中泄露个人信息。
技术探索与实验
- LeicaLatte探讨了记忆行为与微调之间的互动,并询问是否有人尝试通过结构化提示利用这些记忆模式。
引用: "Curious about the interaction between this memory behavior and fine-tuning."
引用: "Has anyone experimented with deliberately structuring prompts to take advantage of these memory patterns?"
- LeicaLatte探讨了记忆行为与微调之间的互动,并询问是否有人尝试通过结构化提示利用这些记忆模式。
总结:评论者对ChatGPT和Claude的记忆功能持有不同看法,ChatGPT被认为更注重用户画像和日常对话,而Claude则更偏向技术任务和长期记忆。同时,评论者对未来技术发展、隐私保护以及记忆功能的优化提出了期待和担忧。