ChipHub
Agent 与接口 2026年4月15日

Superpowers 火成这样,不奇怪,它刚好踩中了 AI 编程最缺的那一块

一个爆火的 GitHub 项目,想解决的核心问题是 agent 开发里的失控感。它把提需求、做设计、拆计划、TDD、评审和收尾串成默认流程,让 AI 编程更像工程,而不只是补全。

来源参考: GitHub

AI 编程这半年最明显的矛盾,其实大家都已经碰到了。

一方面,coding agent 的速度越来越夸张,几分钟改完一堆文件这件事,已经不稀奇了。另一方面,很多人也越来越清楚,快只是表象。需求没讲清、方案没想透、测试没先立住、改着改着偏航,这些老问题到了 agent 时代一点没消失,反而被放大了。

最近在 GitHub 上很火的 Superpowers,有意思就有意思在这里。它不是再造一个模型,也不是再包一层炫酷 UI,而是试图把“怎么管住 coding agent”这件事产品化、流程化。

它给出的核心思路很简单,也很工程师:先别急着让 agent 动手,把流程提前写进默认动作里。

先看它到底做了什么。

这个项目把一组可组合的 skills 和一套初始指令绑在一起,让 agent 在不同阶段自动切换工作模式。比如刚听到你要做功能时,不是立即生成实现,而是先进入 brainstorming,追问真实需求,把模糊想法拎成能看的设计。设计确认后,再进入 writing-plans,把任务拆成短小、具体、可验证的步骤。等你说可以开工了,再切到 subagent-driven-development 或 executing-plans,让多个子 agent 按计划推进。

中间最硬的一层,是它对 test-driven-developmentrequesting-code-reviewverification-before-completion 这类流程的强制接入。说白了,它想把人类团队里那些“本来应该做,但大家总会偷懒跳过”的动作,提前写进 agent 的操作系统。

这也是我觉得它最值钱的地方。今天大家讨论 AI 编程,注意力经常放在“哪个模型更强”“哪家 IDE 更顺手”“上下文窗口多大”。这些当然重要,但它们更像发动机参数。决定一辆车会不会冲进沟里的,往往还是方向盘、刹车和交通规则。

Superpowers 干的,差不多就是把这三样补上。

第一层价值,是它把 agent 从“回答机器”往“流程执行者”推了一步。

过去不少 agent 产品的默认心智,其实还是高级聊天。你给一句话,它回一段代码,再靠你人工兜底。Superpowers 不太一样,它强调的是每个阶段都先判断要不要触发 skill,而且是 before any task。这种设计看起来有点啰嗦,实际却很符合真实开发。因为多数项目失败,从来不是败在单次代码生成质量不够,而是败在前面几步偷懒,后面一路补锅。

第二层价值,是它公开承认了一件很多人不愿直说的事:AI 写代码的瓶颈,很多时候卡在判断,不是卡在输出。

README 里那句形容很狠,说 implementation plan 要写到让“一个热情很高、审美很差、没有判断力、缺少上下文、还不爱测试的初级工程师”都能照着做。你会发现,这几乎就是今天大量 coding agent 的真实工作画像。它们不是不能产出,而是缺少稳定的自我约束。所以你与其指望 agent 突然拥有资深工程师的判断,不如先给它一套不能轻易跳过的轨道。

第三层价值,是它把“技能”这件事从 prompt 碎片升级成了工程资产。

这里面有 brainstorming、systematic-debugging、using-git-worktrees、finishing-a-development-branch 等一整套模块。它们不是一次性的提示词,而是带触发条件、执行规则和方法论的工作单元。换句话说,Superpowers 想卖的不是某个神 prompt,而是一个可以迁移到 Claude Code、Cursor、Codex、OpenCode、Gemini CLI 这些环境里的行为规范层。

这件事为什么重要。因为未来不同模型之间的能力差距,很可能会越来越像“同一档次里谁更强一点”,但团队真正拉开差距的,会是如何把模型接进自己的工程流程。谁先把需求澄清、计划拆解、测试验证、代码评审这些环节固化成默认动作,谁就更可能把 agent 用成生产力,而不是随机数生成器。

当然,它也不是没有代价。

最大的问题,是这套方法天然更重。你如果只是改一行文案、修一个 CSS 小毛刺,完整走 brainstorming、TDD、plan、review,很可能比直接改还慢。Superpowers 的答案是“如果 skill 适用,就必须用”,这种强约束在团队协作里有价值,但落到个人使用时,摩擦感也会很明显。它更像给容易失控的大任务装护栏,而不是给所有场景都塞一套工业流水线。

第二个不确定性,是它依赖宿主 agent 真的愿意服从流程。这个项目说到底还是在和模型的默认冲动对抗,也就是“看见需求,立刻动手”。如果底层 agent 对指令遵守不稳定,或者平台对 skill 机制支持得不够深,这套框架就会打折扣。它的上限不只取决于 skill 设计,也取决于宿主平台的执行纪律。

但即便这样,我还是觉得这个方向很对。

因为 AI 编程的下一阶段,大概率不只是继续比谁更会补全,还要比谁更会组织补全。重点也不只剩生成能力,还包括生成前后那一圈流程能力。谁能把“先想清楚再动手”变成默认设置,谁就更接近可持续的 agent engineering。

所以如果非要给 Superpowers 下一个判断,我会说,它更像是在教团队怎么给 AI 立规矩。这个方向听起来不性感,但很可能比再多一个“世界最强 coding assistant”更有长期价值。

参考链接

  • GitHub 仓库:obra/superpowers
  • 项目 README 中列出的典型流程包括 brainstormingwriting-planssubagent-driven-developmenttest-driven-developmentrequesting-code-reviewfinishing-a-development-branch