文章摘要
过去四年,AI市场经历了显著变化。自GPT-3发布以来,AI领域的扩展规律逐渐明朗,预示着从GPT-2到GPT-3及后续版本的持续进步将带来革命性变革。作者在此期间投资了多家生成式AI公司,如Harvey、Perplexity等,认为应支持最优秀的人才解决重大问题。随着更多非核心AI领域的人意识到这一机遇,以及主要实验室的研究人员和工程师纷纷创业,AI市场变得复杂,作者对AI的理解也愈发模糊。
文章总结
AI市场现状与未来展望
过去四年,AI市场经历了显著的变化。自GPT-3发布以来,AI领域的扩展规律逐渐明朗,预示着从GPT-2到GPT-3、GPT-4等模型的持续进步将带来一场革命。四年前,基于这一趋势,我开始寻找并投资生成式AI公司,如Harvey、Perplexity、Character.AI和BrainTrust等。当时,OpenAI是唯一明确的基础模型公司,而Anthropic尚未推出,Llama还不存在,Google则因内部流程问题暂时未能全力创新。
随着更多非核心AI领域的人士意识到这一机会,以及主要实验室的研究人员和工程师离职创业,AI市场变得更加复杂。我曾表示,“我对AI了解得越多,反而越感到困惑”,因为早期市场中谁将成为赢家并不明确,且底层模型和技术变化迅速。例如,2022年时,AI驱动的软件工程显然将变得重要,但谁会成为赢家尚不清楚。
如今,第一批AI市场已经趋于稳定,一些潜在的赢家已经浮现。这并不意味着未来不会有新的竞争者出现,也不意味着当前的领导者不会被收购或消亡。我们还将看到新的市场在未来几年内逐渐成形,这些市场目前仍充满不确定性。
基础模型包括大型语言模型(LLM)以及语音、图像、视频、音乐、化学、生物、材料、物理等领域的模型。这些模型通常依赖于数据规模、计算能力、训练后的反馈等因素。规模意味着资本,因此要在LLM市场中获胜,需要大量的资本投入。
在LLM市场中,一些核心公司已经明确成为未来的主要参与者,它们通常与超大规模云服务提供商合作,如亚马逊与Anthropic、Google与Gemini、微软与OpenAI等。这些公司有经济动机通过AI采用来增加云服务支出,因此它们会资助这些AI公司,无论这些公司是否是好投资。基础模型公司的收入在短短三年内从零增长到数十亿美元,而云服务在AI上的支出已达到每季度数十亿美元。
LLM领域的核心玩家包括Anthropic、Google、Meta(通过Llama)、微软、Mistral、OpenAI和X.AI。其中三到四家公司在各种基准测试中表现优异,被开发者和企业广泛采用,并推动了行业的大部分支出。还有一些新进入者,如SSI和Thinking Machine Labs,它们可能通过创新方法或持续融资来竞争,或者在未来几年被希望进入市场或加强人才储备的公司收购。
与此同时,中国公司也推出了新的开源项目,如Deepseek、阿里巴巴的Qwen和最近的Kimi,这些项目在基准测试中表现良好。未来,由于资本壁垒,新的核心LLM公司可能难以成立,除非有新的突破性技术出现。
其他基础模型市场尚未出现明确的赢家,尽管多个领域都有前景广阔的公司。代码是生成式AI和LLM最早且最明确的大规模应用之一。例如,GitHub Copilot于2021年10月推出,尽管功能有限,但已被广泛采用并证明其价值。代码的生成式AI应用具有快速增长的潜力,一些公司的收入在头两年内从零增长到5亿美元。
在代码领域,核心赢家已经显现,包括Anthropic的Claude Code、Cognition/Windsurf、Cursor、Google/Windsurf、微软/GitHub、OpenAI等。这些公司将在未来几年内发挥重要作用,尽管大型现有企业仍可能进入这一市场。
法律市场的核心玩家已经稳定,Harvey和CaseText是当前的领导者。其他初创公司如Legora、Crosby、EvenUp、Eve和Supio也在不同领域崭露头角。我们仍处于全流程自动化的早期阶段,但Harvey和EvenUp等公司已经开始构建从开始到结束的完整法律工作流系统。
医疗领域的工具和记录市场也出现了一些主要玩家,如Abridge、Ambience、Commure/Athelas和Nuance(微软)。这些公司的下一步关键是将产品扩展到医疗保健的其他领域。
美国的客户体验市场在短期内已经整合为少数核心初创公司,如Decagon和Sierra,而现有企业如Intercom和Zendesk也在增加生成式AI功能。其他有潜力的初创公司包括Forethought、Maven、Parahelp和Wonderful等。与许多其他市场一样,客户体验领域的生成式AI正在取代或增强人类的工作,而不是作为另一个基于座位的工具。
我们正在从销售座位转向销售认知单位或人类等效劳动力。这一转变在AI公司中尚未得到充分讨论。推理模型的进步和代理基础设施产品将加速这一转变。
专注于这一领域的公司包括Google、OpenAI(chatGPT)、Perplexity和Meta。Perplexity是这一市场中的主要初创公司,而其他玩家大多是现有企业。这可能也适用于其他消费者和专业消费者市场,尽管新的消费者用例仍有很大空间。
三年前,基础模型/LLM、代码、医疗保健、客户服务等领域显然是重要的AI市场,但谁将成为赢家尚不明确。如今,短期内可能发挥作用的领导者已经清晰,尽管新的初创公司或现有企业仍可能在未来加入竞争。
下一批具有高度吸引力和可行性的生成式AI市场包括但不限于以下领域:会计、合规、金融工具、销售工具和代理、安全等。在这些领域,有许多令人兴奋的公司,谁将脱颖而出或获胜将在未来几个月或几个季度内逐渐明朗。
对于这些“新”市场,一个核心问题是阻碍市场形成的原因是什么?部分原因在于某些市场的模型需要在推理或保真度方面取得进展。例如,法律工作流在GPT 3.5上无法运行,但在GPT4上取得了突破,Harvey因此受益。同样,代码工具如Cursor在Claude 3.5(2024年6月发布)之前并不那么有用,直到模型达到一定的保真度。在模型改进之前,早期针对客户的需求进行开发,可以在模型改进后迅速占领市场份额。
这引出了“GPT阶梯”的概念——在某个GPT(或Claude、Gemini、Grok、Llama)版本发布后,特定的新市场将打开。例如,GPT-5(或Claude X、Gemini Y)应该支持一个全新的市场,而这个市场在模型技术尚未成熟时是无法进入的。
除了模型之外,阻碍生成式AI在某个市场采用的其他因素可能包括:市场进入策略、购买行为和竞争;团队问题;以及产品开发时间。有时,市场活动还处于早期阶段,6-12个月后,足够大的产品足迹将出现,赢家也将随之浮现。
一个重大的转变是从纯粹的“AI聊天”工具转向代理工作流。代理是代表用户执行操作的AI软件。这与在Google上查找西班牙旅行信息不同,而是让Google生成一个AI代理,代表用户预订旅行并执行操作。像Devin这样的代码工具和Decagon/Sierra这样的客户服务工具似乎是B2B领域最早采用代理工作流的公司,而像chatGPT、Gemini和Perplexity这样的信息工具正在添加代理,为用户进行深度研究。
随着推理模型和代理的普及,支持代理部署和工作流的新基础设施正在加速发展。许多初创公司正在开发代理框架或基础设施,而咨询或大规模部署公司也在将代理添加到其企业工具库中。
我们正在从销售座位转向销售认知单位或人类等效劳动力。我已经谈论并投资生成式AI驱动的并购大约三年了。从生成式AI的早期阶段就清楚,这种基于Transformer的规模化AI非常擅长人类知识工作,而这正是白领服务经济的重要组成部分。在AI驱动的并购中,购买一家公司而不仅仅是销售软件,可以带来比仅仅销售软件更快的采用和经济效益。
通常,AI的采用不是一个技术问题,而是一个组织、流程和人员问题。你能围绕AI工具重新设计整个组织或其工作方式吗?这通常比AI工具本身更难,需要拥有实际的公司才能在足够短的时间内重新设计组织流程(至少对于初创公司来说——现有企业通常需要很长时间)。
到目前为止,我已经资助了两笔AI驱动的并购,并期待支持更多——如果你在这一领域工作,请联系我!
在另一篇文章中,我谈到了“市场终结行动”——你可以采取什么重大战略行动(并购?大规模资本投资?其他?)来赢得市场第一的位置。随着市场的整合,赢得市场的战略行动变得清晰。这可能会导致各种形式的并购、合作伙伴关系、渠道锁定或其他策略,因为每个市场的少数玩家将整合为一个或少数几个。
由于通过合并两家主要初创公司领导者(通常难以谈判但值得)或现有企业/初创公司对(分销+技术=胜利)来赢得市场的能力,我们应该很快看到大量的整合和并购。
非常激动人心的时刻即将到来。
AI市场现在是几年来最清晰的。在早期的生成式AI市场如代码和法律领域,领导者已经明确,而新市场则充满了颠覆的机会。激动人心的时刻即将到来。
评论总结
AI伴侣市场的潜力
- 评论1指出,AI伴侣市场被严重低估,Character AI是全球使用率仅次于ChatGPT的应用,尤其受到青少年欢迎。
- 引用:"I think the companion market is probably the most overlooked market in AI."
- 引用:"Character AI is the most used AI app after ChatGPT worldwide."
AI在客服中的应用质疑
- 评论2认为,尽管AI客服被广泛宣传,但其实际效果可能不佳,甚至可能导致用户放弃使用。
- 引用:"Customer Service keeps being touted as a success story of LLMs, but... my experiences with AI chatbots are almost always negative."
- 引用:"It can certainly frustrate visitors into using email or abandoning their efforts altogether."
AI代理的实际应用缺乏
- 评论5质疑AI代理在关键业务中的应用,认为目前多为炒作,缺乏实际案例。
- 引用:"I would love to hear some clear use cases that people are actually using AI agents for in production on non-trivial matters."
- 引用:"I’ve yet to hear any real business critical applications of agents that are not just hyped up demos."
AI在法律领域的应用不足
- 评论9指出,AI在法律市场的应用既不全面也不具信息性,现有模型的表现与定制训练的模型相差无几。
- 引用:"Although there is a part on the use of AI in the legal market, but it is neither comprehensive, nor informative."
- 引用:"That benchmark in the report clearly shows that there is not much added value or moat in the custom training of Harvey."
中国AI的崛起
- 评论10认为,中国AI技术发展迅速,可能在未来与美国并驾齐驱,甚至超越。
- 引用:"The Chinese stuff is fucking great, and it’s improving really really fast."
- 引用:"I see no reason why the take in the article is any more plausible than an alternative future where the US has about as much market share in frontier LLMs as Europe does in consumer Internet."
AI术语定义的混乱
- 评论11指出,“代理”一词定义混乱,建议统一使用OpenAI和Anthropic的定义。
- 引用:"The term agent is just way overloaded. This guy defines it completely differently the the big labs."
- 引用:"In the long run the definition used by OpenAI, Anthropic et al will win out."
AI在产品原型设计中的应用
- 评论12提到,AI在产品原型设计中的应用(如Vercel v0和Firebase Studio)是明显的成功案例。
- 引用:"No mention of product prototyping products e.g. vercel v0 or Firebase Studio."
- 引用:"Those to me seem like clear 0->1 wins, especially vercel with their hosting/marketplace integrating well with AI-driven development."
对作者观点的质疑
- 评论13认为,尽管作者是科技领域的权威,但其关于LLM的观点与最新研究趋势不符,尤其是中国的发展。
- 引用:"The author is a respected voice in tech... but the LLM claims are wrong."
- 引用:"They are not only unsupported by recent research trends and general patterns in ML and computing."
总结:评论中对AI在不同领域的应用潜力、实际效果及未来发展提出了多样化的观点,既有对AI伴侣市场和法律应用的肯定,也有对AI客服和代理实际效果的质疑,同时对中国AI的崛起表示关注。