Agent 与接口 2026年4月15日

Superpowers 火成这样，不奇怪，它刚好踩中了 AI 编程最缺的那一块

一个爆火的 GitHub 项目，想解决的核心问题是 agent 开发里的失控感。它把提需求、做设计、拆计划、TDD、评审和收尾串成默认流程，让 AI 编程更像工程，而不只是补全。

来源参考： GitHub

AI 编程这半年最明显的矛盾，其实大家都已经碰到了。

一方面，coding agent 的速度越来越夸张，几分钟改完一堆文件这件事，已经不稀奇了。另一方面，很多人也越来越清楚，快只是表象。需求没讲清、方案没想透、测试没先立住、改着改着偏航，这些老问题到了 agent 时代一点没消失，反而被放大了。

最近在 GitHub 上很火的 Superpowers，有意思就有意思在这里。它不是再造一个模型，也不是再包一层炫酷 UI，而是试图把“怎么管住 coding agent”这件事产品化、流程化。

它给出的核心思路很简单，也很工程师：先别急着让 agent 动手，把流程提前写进默认动作里。

先看它到底做了什么。

这个项目把一组可组合的 skills 和一套初始指令绑在一起，让 agent 在不同阶段自动切换工作模式。比如刚听到你要做功能时，不是立即生成实现，而是先进入 brainstorming，追问真实需求，把模糊想法拎成能看的设计。设计确认后，再进入 writing-plans，把任务拆成短小、具体、可验证的步骤。等你说可以开工了，再切到 subagent-driven-development 或 executing-plans，让多个子 agent 按计划推进。

中间最硬的一层，是它对 test-driven-development、requesting-code-review、verification-before-completion 这类流程的强制接入。说白了，它想把人类团队里那些“本来应该做，但大家总会偷懒跳过”的动作，提前写进 agent 的操作系统。

这也是我觉得它最值钱的地方。今天大家讨论 AI 编程，注意力经常放在“哪个模型更强”“哪家 IDE 更顺手”“上下文窗口多大”。这些当然重要，但它们更像发动机参数。决定一辆车会不会冲进沟里的，往往还是方向盘、刹车和交通规则。

Superpowers 干的，差不多就是把这三样补上。

第一层价值，是它把 agent 从“回答机器”往“流程执行者”推了一步。

过去不少 agent 产品的默认心智，其实还是高级聊天。你给一句话，它回一段代码，再靠你人工兜底。Superpowers 不太一样，它强调的是每个阶段都先判断要不要触发 skill，而且是 before any task。这种设计看起来有点啰嗦，实际却很符合真实开发。因为多数项目失败，从来不是败在单次代码生成质量不够，而是败在前面几步偷懒，后面一路补锅。

第二层价值，是它公开承认了一件很多人不愿直说的事：AI 写代码的瓶颈，很多时候卡在判断，不是卡在输出。

README 里那句形容很狠，说 implementation plan 要写到让“一个热情很高、审美很差、没有判断力、缺少上下文、还不爱测试的初级工程师”都能照着做。你会发现，这几乎就是今天大量 coding agent 的真实工作画像。它们不是不能产出，而是缺少稳定的自我约束。所以你与其指望 agent 突然拥有资深工程师的判断，不如先给它一套不能轻易跳过的轨道。

第三层价值，是它把“技能”这件事从 prompt 碎片升级成了工程资产。

这里面有 brainstorming、systematic-debugging、using-git-worktrees、finishing-a-development-branch 等一整套模块。它们不是一次性的提示词，而是带触发条件、执行规则和方法论的工作单元。换句话说，Superpowers 想卖的不是某个神 prompt，而是一个可以迁移到 Claude Code、Cursor、Codex、OpenCode、Gemini CLI 这些环境里的行为规范层。

这件事为什么重要。因为未来不同模型之间的能力差距，很可能会越来越像“同一档次里谁更强一点”，但团队真正拉开差距的，会是如何把模型接进自己的工程流程。谁先把需求澄清、计划拆解、测试验证、代码评审这些环节固化成默认动作，谁就更可能把 agent 用成生产力，而不是随机数生成器。

当然，它也不是没有代价。

最大的问题，是这套方法天然更重。你如果只是改一行文案、修一个 CSS 小毛刺，完整走 brainstorming、TDD、plan、review，很可能比直接改还慢。Superpowers 的答案是“如果 skill 适用，就必须用”，这种强约束在团队协作里有价值，但落到个人使用时，摩擦感也会很明显。它更像给容易失控的大任务装护栏，而不是给所有场景都塞一套工业流水线。

第二个不确定性，是它依赖宿主 agent 真的愿意服从流程。这个项目说到底还是在和模型的默认冲动对抗，也就是“看见需求，立刻动手”。如果底层 agent 对指令遵守不稳定，或者平台对 skill 机制支持得不够深，这套框架就会打折扣。它的上限不只取决于 skill 设计，也取决于宿主平台的执行纪律。

但即便这样，我还是觉得这个方向很对。

因为 AI 编程的下一阶段，大概率不只是继续比谁更会补全，还要比谁更会组织补全。重点也不只剩生成能力，还包括生成前后那一圈流程能力。谁能把“先想清楚再动手”变成默认设置，谁就更接近可持续的 agent engineering。

所以如果非要给 Superpowers 下一个判断，我会说，它更像是在教团队怎么给 AI 立规矩。这个方向听起来不性感，但很可能比再多一个“世界最强 coding assistant”更有长期价值。

参考链接

GitHub 仓库：obra/superpowers
项目 README 中列出的典型流程包括 brainstorming、writing-plans、subagent-driven-development、test-driven-development、requesting-code-review 和 finishing-a-development-branch