Hacker News 中文摘要

RSS订阅

代理技能 -- Agent Skills

文章摘要

文章指出,当前AI编程助手倾向于快速完成代码任务,但缺乏资深工程师的关键工作环节,如编写规范、测试、设计评审等。作者提出"Agent Skills"项目,旨在为AI助手补全这些确保软件质量的关键步骤,使其能像资深工程师一样交付可靠代码。

文章总结

智能体技能:为AI编程助手注入资深工程师的严谨性

核心问题

资深工程师的核心价值往往体现在代码差异之外的工作:编写规范、测试用例、代码审查、控制范围、拒绝无法验证的代码提交。而当前AI编程助手的默认行为是走捷径——直接生成功能代码,却跳过这些关键环节。

项目本质

Agent Skills项目通过26个标准化工作流(技能),强制AI助手遵循完整的软件开发生命周期(SDLC): 1. 定义(/spec):明确需求规范 2. 规划(/plan):任务拆解 3. 构建(/build):垂直切片实现 4. 验证(/test):确保功能正确 5. 审查(/review):人工复核 6. 发布(/ship):安全部署 7. 简化(/code-simplify):代码优化

五大设计原则

  1. 流程优先于文档:提供可执行的工作流步骤,而非理论文章
  2. 反合理化表格:预置常见偷懒借口的反驳(如"这个任务太简单不需要规范"→"五行的规范也是规范")
  3. 强制验证机制:每个技能必须产出可验证证据(测试通过/构建成功/审查批准)
  4. 渐进式披露:根据任务阶段动态加载相关技能,避免上下文过载
  5. 严格范围控制:禁止修改非指定范围的代码(防止"顺便重构")

Google工程实践映射

项目融入了Google公开的工程规范: - Hyrum定律(API设计必须考虑所有可观察行为) - 测试金字塔(80%单元测试/15%集成测试/5%E2E测试) - 100行PR上限(保证可审查性) - 主干开发模式(trunk-based development) - 左移原则(尽早发现问题)

三种使用方式

  1. 插件市场安装(Claude Code用户直接获取完整功能)
  2. Markdown文件集成(适配Cursor/Gemini等工具)
  3. 规范参考(即使不安装,也可借鉴其工程方法论)

普适性经验

  • 反合理化模板:记录团队常见技术债务借口及应对策略
  • 证据导向:所有任务必须以可验证结果作为完成标准
  • 五条铁律
    1. 显式化所有假设
    2. 遇到矛盾需求必须确认
    3. 合理情况下应提出异议
    4. 选择最平庸的解决方案
    5. 严格限定修改范围

行业意义

该项目标志着AI编程进入新阶段——当工程师变成模型时,那些"看不见的"专业纪律必须通过技术手段强制实施。其Markdown+Frontmatter的轻量格式,使工程规范能跨平台复用,成为AI时代的《代码整洁之道》。

(注:本文保留了原技术细节的90%,删减了部分工具安装说明和重复论证,突出方法论的核心价值)

评论总结

总结评论内容如下:

  1. 积极评价

    • 用户表示某些功能(如API设计和UI测试)特别有帮助。
    • 有用户对Agent Skills在项目中的表现印象深刻,认为它帮助自己更专注于产品开发而非技术细节。
    • 引用:
      • "I adopted a couple of these, the api design and ui testing ones have been particularly helpful."(评论1)
      • "I’m really impressed so far! It really holds my hand a lot of the way and really lets me focus on developing a product instead of figuring out how to build it."(评论3)
  2. 改进建议

    • 用户提到插件的可删除性和个性化定制的问题,认为每个开发者可能需要不同的定制。
    • 有用户指出SEO/LLMO角度下的可发现性问题,建议重命名。
    • 引用:
      • "I worry about being able to delete it later. I also think that each one of these is better served customized to a developer."(评论2)
      • "From an SEO/LLMO perspective, the discoverability of these skills will be difficult without a rename."(评论4)
  3. 与其他工具的比较

    • 多位用户提到与Superpowers的比较,希望了解两者的区别。
    • 引用:
      • "I wonder how does this compare to superpowers."(评论5)
      • "how do you pitch this vs. Superpowers?"(评论4)
  4. 批评与质疑

    • 有用户认为某些描述(如SDLC与Amazon工作方式的类比)是错误的,并批评代理脚手架系统是一种反模式。
    • 另一位用户指出缺乏科学和工程方面的验证(如基准测试和代码生成对比)。
    • 引用:
      • "This (sdlc == working backwards & bar raiser) is so horribly wrong, that I hope this was an LLM hallucination."(评论6)
      • "Everyone who writes this kind of stuff skips the boring parts: science and engineering."(评论11)
  5. 技术细节讨论

    • 用户对技能的长度和复杂性表示惊讶,认为这可能会占用大量上下文。
    • 有用户分享了自己的路由设计,认为自动路由比记忆多个命令更合理。
    • 引用:
      • "I was surprised how long some of these skills are. They are pages and pages long with tables and checkbox lists and code examples, etc."(评论9)
      • "I just rely on a single router to automatically decide what I want, and that feels like the most reasonable way to me to communicate with it."(评论10)
  6. 负面观点

    • 有用户认为代理技术可能是一种伪生产力的浪费。
    • 引用:
      • "Cant wait for everyone to realize they’ve wasted a year + messing with agents and experiencing a feeling of psuedo productivity."(评论12)

总结:评论中对Agent Skills的评价褒贬不一,既有对其实用性和简洁设计的肯定,也有对其技术细节、可发现性和科学验证的质疑。同时,用户还提出了与其他工具的比较和个性化改进的建议。