Hacker News 中文摘要

文章摘要

文章探讨了人工智能产品在概率时代的开发与应用，指出人们往往难以接受AI技术的快速进步及其不可预测的行为模式。作者通过互联网发展初期的类比，强调新技术带来的颠覆性变化需要时间来被大众理解和接受。最终，技术行业逐渐适应并发展出构建和扩展数字产品的强大本能，达到新的平衡。

文章总结

标题：在概率时代构建AI产品

最近，我试图说服一位朋友，ChatGPT并没有记住所有的医疗记录，当她在输入血液检查结果时，模型只是在做模式匹配，甚至连OpenAI也无法完全预测其行为。她无法相信这一点，我完全理解她的困惑。我们发明了一种我们并不完全理解的技术，它展现出的行为超出了我们的预期，这确实让人难以接受。

这种对AI进步的怀疑并不新鲜。主流直觉和文化影响总是滞后于新技术的能力。三十年前，当我们在互联网上创业时，类似的怀疑也存在。向陌生人寄送支票或免费提供服务在当时看来是荒谬的，但那些理解了零边际成本和无限扩展分发的人最终变得非常富有。他们意识到，旧有的假设不再适用，并据此采取了行动。

如今，AI再次颠覆了科技行业的规则。许多过去的经验已经过时，通用人工智能的出现彻底改变了我们设计、构建和扩展软件的方式，进而影响了以软件为核心的业务。我们正处于一个过渡期，工具的发展速度超过了我们理解它们的框架。这是一个技术、认识论和组织上的变革，卓越的AI公司已经开始以与过去几十年完全不同的方式运作。

就像物理学从牛顿的确定性宇宙转向波函数的奇异世界一样，软件也在经历其量子转变。我们正在离开一个代码可靠且确定性地将输入转化为输出的世界，进入一个机器生成统计分布的新世界。构建概率性软件是我们从未经历过的挑战。

经典世界

今天的科技行业由软件的核心性质塑造。数字产品将已知的输入映射到预期的结果，具有确定性。例如，Instagram用户可以上传图片、发送消息、留言、关注账号；Netflix用户可以搜索、选择并播放视频。用户选择某个动作，并期望得到相应的结果。

我们可以将这些产品视为函数 F: X → Y，其中每个输入 x 是用户在产品中的动作，如“在WhatsApp上发送消息”或“在Uber上预订乘车”。对于每个动作 x，产品会产生一个结果 y。工程师的目标是确保 F(x) 每次都能可靠地产生 y，因此测试驱动开发、谨慎的重构和分层是软件工程的标志。

产品管理和设计也是关于将 x 可靠地映射到 y，只是抽象层次不同。产品经理和设计师的目标是构建一个函数 F，使得输入 x 如“用户第一次观看Instagram故事”能够产生现实世界的结果 y，如“用户一个月后仍在使用产品”。好的产品管理是通过价值漏斗引导用户，设计师和产品经理预先知道他们优化的目标，并努力达到100%的用户转化率。

量子时代

2010年代末，AI模型开始展现出真正的泛化能力。研究人员发现，通过大量数据预训练深度学习模型，可以使其发展出通用能力，这些能力可以转移到下游任务中。例如，Google的T5和OpenAI的GPT-2展示了预训练模型如何发展出通用能力，而无需事先定义所有任务。

这些模型并没有在所有任务上进行显式训练，而是通过大规模数据预训练和少量指令微调，显著提高了在未见任务上的零样本性能。这种“未见”和“通用”能力标志着计算历史上的一个真正转折点。我们不再只是教机器识别垃圾邮件，而是教它们说话；不再只是教机器识别自行车或区分动物，而是赋予它们视觉本身。

这种变化使得AI产品的构建变得复杂。用户可以用ChatGPT做任何事情，从法律建议到情感支持，从代码分析到占星预测。输入空间的基本上是无限的，输出的正确性也不总是有保证。AI模型的输出是一个估计，有时甚至是幻觉。我们无法完全解决幻觉问题，因为有些问题本身就没有“正确”答案。

从工程到经验主义

在概率时代，成功的组织需要从工程思维转向经验主义。传统的工程领导倾向于在概率性软件上施加可靠性指标，但这会削弱模型的灵活性。目标不再是追求完美，而是管理不确定性。AI产品构建者应确定可接受的不可预测性，以保持模型处理复杂性的能力。

每次新模型发布时，所有关于其行为的假设都应被重新审视。Replit在从Sonnet 3.5升级到3.7时，完全重构了产品，这需要科学家的思维方式。模型更新可能意味着完全重写产品，因此必须遵循经验主义方法，唯一的有效假设是“我不知道”。

数据是新的操作系统

尽管模型行为本质上是不可知和不确定的，但构建一个有效的数据功能仍然非常困难。模型的涌现特性使得合成测试变得难以捉摸。工程师需要保持评估数据集与实际用户行为分布同步，但由于输入空间不再有限，传统的测试驱动开发不再适用。生产环境中的A/B测试也变得至关重要，但优化目标本身也难以定义。

在AI产品中，用户探索的是可能性领域，传统的增长漏斗不再适用。我们需要通过聚合“用户轨迹”来理解用户行为。数据成为决定企业成功的关键因素，它是整个组织的共享操作系统，能够描述现实并指导行动。

这次不同

经过几十年的技术创新，世界对科技炒作产生了抗体。主流观众对“世界正在改变”的大胆声明持怀疑态度。但在AI领域，这次确实不同。我们正在从确定性机制转向涌现的未知行为，从规划和工程转向观察和假设。

这种转变是真实的，它影响了科技行业的每个部分，改变了我们制造产品、研究和设计产品以及围绕它们构建工作的方式。采用经验主义方法、思考概率并测量复杂轨迹的组织将定义下一个技术时代。其他组织将继续试图将波函数塞入电子表格，并疑惑为什么他们的确定性仪表板无法捕捉产品的魔力。

欢迎来到概率时代。

评论总结

评论内容主要围绕AI技术的确定性、应用前景及其与人类期望的差距展开，观点多样且争议较大。以下是总结：

AI的确定性与不确定性
- 支持者认为AI的非确定性是其创新之处，类似于人类历史上的多用途工具。
  引用：
  "Humans have been building flexible, multi-purpose tools... since before the invention of the wheel." (thorum)
  "Building with non deterministic systems isnt new." (ankit219)
- 反对者则认为AI的不确定性可能导致不可靠的结果，甚至需要重新构建系统。
  引用：
  "It can regress so much that anything you built on this has to be redone." (ath3nd)
  "We’re throwing away determinism just like that?" (therobots927)
AI的应用与局限性
- 部分评论者认为AI在某些领域（如物理、数学）可以给出确定性答案，但在其他领域（如情感问题）则无法提供“正确”答案。
  引用：
  "But physics questions do. Code vulnerability questions do. Math questions do." (therobots927)
  "What even is the 'correct' when the question is 'should I leave him?'" (therobots927)
- 也有评论者指出AI的不可预测性可能限制其在严肃工作中的应用。
  引用：
  "Probably not an ideal workflow for real work." (bithive123)
AI的未来与行业趋势
- 支持者认为AI的发展是不可避免的，尽管其非确定性可能改变传统的工程思维。
  引用：
  "It seems like that’s the direction we’re inevitably going." (ipdashc)
  "This time it does feel different." (ath3nd)
- 反对者则认为AI的炒作可能形成泡沫，且其复杂性可能导致技术倒退。
  引用：
  "Get ready for the next bubble when the crypto grifters that moved to 'AI' will soon move on to the NEXT-BIG-THING!" (mentalgear)
  "I hope this dark age doesn’t last as long as the last one." (therobots927)
AI与科学方法的关系
- 有评论者指出AI的开发更接近科学方法，而非传统工程。
  引用：
  "It feels more like you’re supposed to be a scientist than an engineer." (ipdashc)
  "Instead of planning we observe and hypothesize." (therobots927)

总结：评论者对AI的确定性和应用前景持不同看法，支持者认为其非确定性是创新，而反对者则担忧其不可靠性和潜在泡沫。同时，AI的开发方式与传统工程思维的差异也引发了争议。

概率时代下的AI产品构建 -- Building AI products in the probabilistic era