文章摘要
文章指出,过去用代码行数衡量程序员价值的做法已被证明是错误的,但如今科技公司却纷纷以AI生成代码的数量作为宣传亮点,如谷歌、Anthropic等公司都高调公布AI生成代码的高比例,这种自相矛盾的做法反映了行业对AI技术的过度追捧。
文章总结
标题:代码行数找到了更好的"代言人"
(注:本文作者是一位从业近三十年的资深技术人)
十五年前,在SaaS公司有两位资深开发者,其中一位的代码产出量比另一位多40%。这能说明他更优秀吗?对企业更有价值吗?显然不能。我们早已明白,代码行数、PR数量这些表面指标根本不能衡量开发者的真实价值。
但令人玩味的是,2026年科技行业却开始大肆宣扬这些指标: - 谷歌宣称75%的新代码由AI生成 - Anthropic表示约80%的生产代码由Claude编写,工程师代码产出提升8倍 - OpenAI同样宣称约80%的代码由AI完成 - Cursor则标榜"每日编写超1亿行企业代码"
这些清一色都是数量指标。所谓"AI编写代码占比"不过是代码行数的华丽包装罢了。(值得注意的是,这些数据发布方恰好都是AI供应商,推广产品对他们至关重要。)
从结果导向到数量崇拜
几年前行业还关注实际成效。GitHub曾发布研究称Copilot使开发效率提升55%——这是一个可验证的结果性指标。而如今这些数量指标永远不会"失败":无论实际交付速度、故障率或客户满意度是否改善,"AI代码占比"总能持续攀升。
被忽视的复杂真相
实际研究结果远比宣传复杂: - 崔氏研究发现AI使近5000名开发者任务完成率提升26%,新手受益最大 - GitClear则显示随着Copilot普及,代码返工率上升而重构减少 - METR研究发现资深开源开发者在熟悉代码库中使用AI反而慢19%,尽管他们自认为快20% - 最新企业调查显示,69%使用AI的公司中,近九成未观测到生产力提升
行业共识是AI带来约10%的组织效率提升——虽有用但远非"取代开发者"的程度。
华而不实的"成熟度模型"
各类AI成熟度评估体系层出不穷: - 卡内基梅隆与埃森哲推出五级八维的AI采用成熟度模型 - 工具商们的评估体系最终都导向"多用我们的产品" - 一项调查显示,219位工程领导者对"AI原生工程"给出了219种不同定义
最具讽刺的是Anthropic:一边宣传"代码产出提升8倍",一边严谨研究显示AI辅助开发者对其所写代码的理解度下降17%,且无显著效率提升。
裁员潮背后的真相
这些数字直接影响企业决策: - Jack Dorsey以AI为由裁减Block公司40%员工(4000余人),称"更小团队借助工具能做得更好" - Atlassian裁员10%(约1600人),承认"AI改变了所需技能组合"
但关键细节是:Dorsey宣布裁员时公司运营状况良好,利润增长。如果AI真能提升效率,为何不将节省的人力投入更多价值创造?这让人怀疑裁员决策另有隐情。
笔者的立场
必须明确: 1. 不反对AI:每位工程师都应日常使用AI工具 2. 但采用只是起点而非终点:我们早已掌握衡量工程效能的方法(DORA指标、可靠性、有效变更率等) 3. 核心问题:你关注的是实际成果,还是华而不实的数量指标?
AI工具确实改变了工作方式,但衡量标准不应倒退。面对各种宣传时,不妨多问一句:这说的是实际成效,还是单纯的数量?
【作者简介】Dave,资深技术人,长期关注开发者效能与技术创新。
评论总结
以下是评论内容的总结,按主要观点分类呈现:
对AI生成代码的质疑
- 认为当前过度关注代码行数(LoC)而非实际价值:"the goal is to ship more code"(评论2);"the fact that the thing has a million lines of code is repeated twice"(评论4)
- 指出关键瓶颈已转移:"Writing. Code. Is. No. Longer. The. Bottleneck. Deciding what to build. Reviewing Code. And testing code. Are the new bottleneck"(评论8)
行业指标与激励问题
- 批评LoC作为衡量标准:"When a measure becomes a target, it ceases to be a good measure"(评论6)
- 指出短期主义危害:"incentives are so skewed to short term that lagging indicators like maintainability are a non starter"(评论17)
AI在实际应用中的局限性
- 安全关键领域不适用:"none of the evaluated LLMs generated MISRA-compliant code"(评论15)
- 生产力提升存疑:"people overestimated AI's effect on their time spent on tasks by 40 percentage points"(评论20)
组织适应性问题
- 指出管理结构未调整:"Teams have not re-organized to match the new code-input velocity"(评论8)
- 高层决策仍是瓶颈:"the bureaucratic layer above will likely remain the same"(评论14)
对AI推广方式的批评
- 认为存在盲目推广:"Weird baseless push for AI... with no reasoning, no goal"(评论10)
- 质疑实际价值:"no description of what the thing is, no indication of what value it provides"(评论4)
开发者态度分歧
- 部分开发者抗拒:"developers now refuse to work without AI"(评论20)
- 存在技术傲慢:"Engineers don't want to do QA because it's 'beneath them'"(评论8)
行业现状观察
- 处于探索阶段:"We're still in the FA phase of FAFO"(评论9)
- 实际应用增加:"I'm already using much many more AI-coded projects"(评论13)
关键数据引用: - 安全研究:"none of the evaluated LLMs generated MISRA-compliant code"(评论15) - 生产力调查:"overestimated AI's effect by 40 percentage points"(评论20)
总结显示评论者对AI编码持谨慎态度,主要担忧包括:价值衡量标准扭曲、实际生产力提升有限、安全关键领域不适用,以及组织未能有效适应新技术带来的变化。