Hacker News 中文摘要

RSS订阅

代码行数找到了更好的宣传员 -- Lines of Code Got a Better Publicist

文章摘要

文章指出,过去用代码行数衡量程序员价值的做法已被证明是错误的,但如今科技公司却纷纷以AI生成代码的数量作为宣传亮点,如谷歌、Anthropic等公司都高调公布AI生成代码的高比例,这种自相矛盾的做法反映了行业对AI技术的过度追捧。

文章总结

标题:代码行数找到了更好的"代言人"

(注:本文作者是一位从业近三十年的资深技术人)

十五年前,在SaaS公司有两位资深开发者,其中一位的代码产出量比另一位多40%。这能说明他更优秀吗?对企业更有价值吗?显然不能。我们早已明白,代码行数、PR数量这些表面指标根本不能衡量开发者的真实价值。

但令人玩味的是,2026年科技行业却开始大肆宣扬这些指标: - 谷歌宣称75%的新代码由AI生成 - Anthropic表示约80%的生产代码由Claude编写,工程师代码产出提升8倍 - OpenAI同样宣称约80%的代码由AI完成 - Cursor则标榜"每日编写超1亿行企业代码"

这些清一色都是数量指标。所谓"AI编写代码占比"不过是代码行数的华丽包装罢了。(值得注意的是,这些数据发布方恰好都是AI供应商,推广产品对他们至关重要。)

从结果导向到数量崇拜

几年前行业还关注实际成效。GitHub曾发布研究称Copilot使开发效率提升55%——这是一个可验证的结果性指标。而如今这些数量指标永远不会"失败":无论实际交付速度、故障率或客户满意度是否改善,"AI代码占比"总能持续攀升。

被忽视的复杂真相

实际研究结果远比宣传复杂: - 崔氏研究发现AI使近5000名开发者任务完成率提升26%,新手受益最大 - GitClear则显示随着Copilot普及,代码返工率上升而重构减少 - METR研究发现资深开源开发者在熟悉代码库中使用AI反而慢19%,尽管他们自认为快20% - 最新企业调查显示,69%使用AI的公司中,近九成未观测到生产力提升

行业共识是AI带来约10%的组织效率提升——虽有用但远非"取代开发者"的程度。

华而不实的"成熟度模型"

各类AI成熟度评估体系层出不穷: - 卡内基梅隆与埃森哲推出五级八维的AI采用成熟度模型 - 工具商们的评估体系最终都导向"多用我们的产品" - 一项调查显示,219位工程领导者对"AI原生工程"给出了219种不同定义

最具讽刺的是Anthropic:一边宣传"代码产出提升8倍",一边严谨研究显示AI辅助开发者对其所写代码的理解度下降17%,且无显著效率提升。

裁员潮背后的真相

这些数字直接影响企业决策: - Jack Dorsey以AI为由裁减Block公司40%员工(4000余人),称"更小团队借助工具能做得更好" - Atlassian裁员10%(约1600人),承认"AI改变了所需技能组合"

但关键细节是:Dorsey宣布裁员时公司运营状况良好,利润增长。如果AI真能提升效率,为何不将节省的人力投入更多价值创造?这让人怀疑裁员决策另有隐情。

笔者的立场

必须明确: 1. 不反对AI:每位工程师都应日常使用AI工具 2. 但采用只是起点而非终点:我们早已掌握衡量工程效能的方法(DORA指标、可靠性、有效变更率等) 3. 核心问题:你关注的是实际成果,还是华而不实的数量指标?

AI工具确实改变了工作方式,但衡量标准不应倒退。面对各种宣传时,不妨多问一句:这说的是实际成效,还是单纯的数量?

【作者简介】Dave,资深技术人,长期关注开发者效能与技术创新。

评论总结

以下是评论内容的总结,按主要观点分类呈现:

  1. 对AI生成代码的质疑

    • 认为当前过度关注代码行数(LoC)而非实际价值:"the goal is to ship more code"(评论2);"the fact that the thing has a million lines of code is repeated twice"(评论4)
    • 指出关键瓶颈已转移:"Writing. Code. Is. No. Longer. The. Bottleneck. Deciding what to build. Reviewing Code. And testing code. Are the new bottleneck"(评论8)
  2. 行业指标与激励问题

    • 批评LoC作为衡量标准:"When a measure becomes a target, it ceases to be a good measure"(评论6)
    • 指出短期主义危害:"incentives are so skewed to short term that lagging indicators like maintainability are a non starter"(评论17)
  3. AI在实际应用中的局限性

    • 安全关键领域不适用:"none of the evaluated LLMs generated MISRA-compliant code"(评论15)
    • 生产力提升存疑:"people overestimated AI's effect on their time spent on tasks by 40 percentage points"(评论20)
  4. 组织适应性问题

    • 指出管理结构未调整:"Teams have not re-organized to match the new code-input velocity"(评论8)
    • 高层决策仍是瓶颈:"the bureaucratic layer above will likely remain the same"(评论14)
  5. 对AI推广方式的批评

    • 认为存在盲目推广:"Weird baseless push for AI... with no reasoning, no goal"(评论10)
    • 质疑实际价值:"no description of what the thing is, no indication of what value it provides"(评论4)
  6. 开发者态度分歧

    • 部分开发者抗拒:"developers now refuse to work without AI"(评论20)
    • 存在技术傲慢:"Engineers don't want to do QA because it's 'beneath them'"(评论8)
  7. 行业现状观察

    • 处于探索阶段:"We're still in the FA phase of FAFO"(评论9)
    • 实际应用增加:"I'm already using much many more AI-coded projects"(评论13)

关键数据引用: - 安全研究:"none of the evaluated LLMs generated MISRA-compliant code"(评论15) - 生产力调查:"overestimated AI's effect by 40 percentage points"(评论20)

总结显示评论者对AI编码持谨慎态度,主要担忧包括:价值衡量标准扭曲、实际生产力提升有限、安全关键领域不适用,以及组织未能有效适应新技术带来的变化。