Hacker News 中文摘要

RSS订阅

95%的AI飞行员测试失败 -- 95% of AI Pilots Failing

文章摘要

尽管企业纷纷押注生成式AI,但大多数试点项目未能实现快速收入增长。MIT的研究显示,仅5%的AI项目成功加速收入,其余95%因工具和组织的学习差距而停滞。年轻初创公司通过精准执行和智能合作取得显著成效,而大公司则面临实施难题,核心问题在于学习而非模型质量。

文章总结

企业AI应用的现状与挑战

尽管企业对生成式人工智能(AI)寄予厚望,但大多数试点项目并未取得预期效果。根据麻省理工学院(MIT)NANDA项目发布的最新报告《GenAI Divide: State of AI in Business 2025》,尽管生成式AI在企业中展现出潜力,但大多数旨在推动收入快速增长的项目却未能成功。

报告显示,尽管企业急于整合强大的新模型,但仅有约5%的AI试点项目实现了收入的快速增长,而绝大多数项目停滞不前,对企业的利润表几乎没有产生可衡量的影响。该研究基于对150位企业领导者的访谈、350名员工的调查以及对300个公开AI部署的分析,揭示了成功项目与停滞项目之间的明显差距。

报告的主要作者、MIT NANDA项目研究员Aditya Challapally指出,一些大型企业的试点项目和年轻初创公司在生成式AI方面表现突出。例如,由19或20岁年轻人领导的初创公司“在一年内实现了从零到2000万美元的收入增长”。Challapally解释说,这些成功案例的关键在于它们专注于解决一个痛点,执行得当,并与使用其工具的公司建立了明智的合作关系。

然而,对于95%的企业来说,生成式AI的实施效果不尽如人意。核心问题并非AI模型的质量,而是工具和组织之间的“学习差距”。尽管高管们常常将问题归咎于监管或模型性能,但MIT的研究指出,企业整合过程中的缺陷是主要原因。像ChatGPT这样的通用工具因其灵活性在个人使用中表现出色,但在企业应用中却停滞不前,因为它们无法从工作流程中学习或适应。

此外,资源分配也存在错位。超过一半的生成式AI预算被用于销售和营销工具,但MIT发现,后台自动化带来的投资回报率最高,包括消除业务流程外包、削减外部机构成本以及简化运营。

成功的AI部署关键在于企业如何采用AI。从专业供应商购买AI工具并建立合作伙伴关系的成功率约为67%,而内部构建的成功率仅为三分之一。这一发现在金融服务等高度监管的行业中尤为重要,许多公司计划在2025年构建自己的专有生成式AI系统,但MIT的研究表明,独立开发的公司失败率更高。

其他成功的关键因素包括授权一线经理(而不仅仅是中央AI实验室)推动采用,并选择能够深度集成并随时间适应的工具。

劳动力市场的变化已经开始显现,尤其是在客户支持和行政岗位。企业越来越多地选择不填补空缺职位,而不是大规模裁员。大多数变化集中在之前因被认为价值较低而被外包的工作上。

报告还强调了“影子AI”(未经授权的工具如ChatGPT)的广泛使用,以及衡量AI对生产力和利润影响的持续挑战。

展望未来,最先进的组织已经开始试验能够学习、记忆并在设定范围内独立行动的代理AI系统,这为下一阶段企业AI的发展提供了线索。

评论总结

评论内容主要围绕AI技术的应用、成功率和未来前景展开,观点多样且存在争议。以下是总结:

  1. AI成功率低,但仍有潜力

    • 评论5指出,仅有5%的AI试点项目能快速提升收入,大多数项目未能产生显著影响。
    • 评论11则认为5%的成功率已经不错,随着技术改进和成本下降,未来成功率有望提升。
    • 引用:
      • "5% of AI pilot programs achieve rapid revenue acceleration; the vast majority stall, delivering little to no measurable impact on P&L."(评论5)
      • "5% is pretty damn good, when AI clearly has a lot of room to get better."(评论11)
  2. AI应用的局限性与适用场景

    • 评论7认为,LLM(大语言模型)适用于容忍错误(如假阳性和假阴性)的场景,否则其不准确性难以接受。
    • 评论9批评许多公司只是将LLM简单嵌入应用,缺乏真正的创新,用户需求未被满足。
    • 引用:
      • "Deployments of LLMs is most suitable in areas where the cost of false positives and, crucially, false negatives are low."(评论7)
      • "A ton of companies are just gluing LLM text boxes into apps and then scratching their heads when people don’t use them."(评论9)
  3. 资源分配与AI的实际价值

    • 评论8指出,生成式AI的预算大多用于销售和营销工具,但MIT研究发现,后台自动化带来的投资回报率更高。
    • 评论13提到,AI在某些领域(如生成图像和视频)确实带来了价值,但也存在滥用(如降低客户服务质量)。
    • 引用:
      • "More than half of generative AI budgets are devoted to sales and marketing tools, yet MIT found the biggest ROI in back-office automation."(评论8)
      • "I see value being added for coders, but it’s mostly companies cutting corners making customer service even shittier."(评论13)
  4. 对AI未来的乐观与质疑

    • 评论17认为,LLM的成功率与一般创业失败率(约90%)相比,已经显示出其可行性。
    • 评论20质疑AI是否真的解决了问题,还是只是随机成功。
    • 引用:
      • "The baseline rate for business failure over 5 years is around 90%, so they say. With how much hype surrounds LLM wrapper startups this is still an astounding amount of novel business model creation."(评论17)
      • "Isn’t it more likely that existing problems were solved and that 'AI' wasn’t the key insight?"(评论20)

总结:评论者对AI的成功率、适用场景和未来前景存在分歧。尽管当前AI项目的成功率较低,但许多人认为随着技术进步,其潜力巨大。同时,AI的应用需要更精准地满足用户需求,避免资源浪费。