Superpowers：给 AI 编程助手一套完整的软件工程方法论

1. Superpowers 是什么

Superpowers 是一套给 coding agent 装上「工程纪律」的插件，由 Prime Radiant 维护。它不是 prompt 模板库，而是一套建立在 Skills（技能） 之上的完整软件工程方法论——会话启动时通过 bootstrap 机制，让 AI 在正确的时刻自动调用正确的流程。

核心设计：

Skills — 用 Markdown 编写的、可版本控制的行为规范，描述「什么时候用」「必须做什么」「禁止做什么」
Bootstrap — 会话开始时注入 using-superpowers 技能，教会 agent：有技能就必须用，在回复或行动之前先检查技能
自动触发 — 不需要手动输入 /brainstorm。agent 判断你在「开始一项任务」时，默认进入设计讨论，而不是直接写代码

项目刻意保持零第三方依赖——skills 是纯文本，hooks 是 shell 脚本，可在任何支持插件/hooks 的 harness 上运行。

项目仓库：https://github.com/obra/superpowers
原文发布：https://blog.fsck.com/2025/10/09/superpowers/
当前版本：v6.x（2026 年 6 月）

支持 Claude Code、Cursor、Codex、Gemini CLI、OpenCode、Pi、Antigravity、Kimi Code 等十余种 harness。

2. 为什么需要它

AI 编程助手已经能写代码，但常见体验是：

你说「帮我做一个 React Todo 列表」，AI 立刻建项目、写组件——还没问清楚你要什么
代码能跑，但架构随意、测试缺失、边界情况没考虑
改了一个 bug，又引入两个新 bug
长会话里 AI 逐渐「忘记」最初的设计约定

Superpowers 解决的是流程问题：把设计、隔离开发、细粒度计划、TDD、审查、收尾编码进系统，而不是每次靠人提醒。

3. 核心工作流

Superpowers 把一次功能开发拆成七个阶段，每个阶段对应一个 skill，按顺序自动衔接：

brainstorming → using-git-worktrees → writing-plans
       → subagent-driven-development / executing-plans
       → test-driven-development（贯穿实现）
       → requesting-code-review → finishing-a-development-branch

3.1 Brainstorming — 先设计，后编码

触发时机： 任何创造性工作之前——新功能、新组件、行为修改。

做什么：

探索项目上下文（文件、文档、最近提交）
一次只问一个问题，逐步澄清目的、约束、成功标准
提出 2–3 种方案并给出权衡与推荐
分块展示设计，每块都等你确认
写入设计文档（docs/superpowers/specs/YYYY-MM-DD-<topic>-design.md）
设计获批后，才进入 writing-plans

HARD-GATE： 在用户批准设计之前，禁止写代码、搭脚手架或调用任何实现类 skill。「太简单了不需要设计」是被明确禁止的反模式。

可选的 Visual Companion 会在「展示比描述更清楚」时打开本地 Web 界面，方便做选择题式的需求澄清。

3.2 Using Git Worktrees — 隔离的工作空间

设计通过后，在 git 仓库中创建独立 worktree 和新分支，运行项目 setup，确认测试基线干净。同一项目上可并行多个任务，互不干扰。

v5.1+ 改进：若 agent 已在 worktree 内运行则跳过创建；创建前会征求同意；优先使用 harness 原生 worktree 工具。

3.3 Writing Plans — 给「零上下文的初级工程师」看的计划

计划写得足够详细，以至于没有项目上下文的 implementer 也能照做。强调 YAGNI、DRY 和真正的 RED/GREEN TDD。

v6.0 新增结构：

Global Constraints — 每个任务都必须遵守的全局规则（版本下限、依赖限制、命名规范等）
Interfaces — 每个任务明确「消费什么、产出什么」
任务粒度 — 每个任务 2–5 分钟量级，含精确文件路径、完整代码片段、验证步骤

3.4 Subagent-Driven Development — 子 agent 流水线

你说「go」之后，主 agent 作为协调者：

为每个任务 dispatch 一个全新的 implementer 子 agent
子 agent 实现、测试、提交、自审
每个任务完成后 dispatch task reviewer，同时检查 spec 合规与代码质量
全部任务完成后，做一次整分支 broad review
调用 finishing-a-development-branch 处理合并/PR/保留/丢弃

主 agent 不会在任务之间停下来问「要继续吗？」——你批准了计划，它就执行到底。

v6.0 审查流程重构（eval 中约 2× 速度、~50% token 节省）：

旧流程	新流程
每任务两个 reviewer	一个 reviewer，一次 diff，两个 verdict
diff 粘贴进上下文	`task-brief` / `review-package` 脚本写入文件
controller 自选模型	每次 dispatch 必须声明模型
controller 可「指导」reviewer 忽略问题	禁止压制 finding
reviewer 可改 working tree	reviewer 只读

进度记录在 .superpowers/sdd/。

替代路径 executing-plans： 任务紧密耦合、或你希望人工把控节奏时，可选批量执行 + 人工检查点模式。

3.5 Test-Driven Development — 铁律

贯穿整个实现阶段：

NO PRODUCTION CODE WITHOUT A FAILING TEST FIRST

RED： 写失败测试，亲眼看到它失败
GREEN： 写最少代码让测试通过
REFACTOR： 在绿灯下整理

先写了实现代码？删掉，重来。没有「先留着当参考」的例外。

3.6 Requesting Code Review

按严重程度报告问题，Critical 问题阻塞后续进度。

3.7 Finishing a Development Branch

验证测试、呈现选项（合并 / 开 PR / 保留分支 / 丢弃）、清理 worktree。已 forge-neutral，不再硬编码 gh pr create。

4. Skills 机制

工作流本身不是重点，Skills 才是。Skills 是给 LLM 的可执行规范——在适用场景下是强制流程，不是建议。

Skill 文件通常包含：

YAML frontmatter（name、description）— description 决定何时被检索/触发
流程图（Graphviz dot）
Checklist（agent 必须为每项建 todo）
Red Flags 表 — 列出 agent 常见的自我合理化借口及反驳
HARD-GATE — 不可逾越的门槛

4.1 Bootstrap：`using-superpowers`

每个 harness 在会话启动时加载 bootstrap，核心规则：

只要有 1% 的可能某个 skill 适用，就必须 invoke 该 skill——在回复、澄清问题、读文件之前。

常见 Red Flags：

想法	现实
「这只是个简单问题」	问题也是任务，先查 skill
「我需要更多上下文」	skill 检查在澄清问题之前
「我先快速看一下代码库」	skill 会告诉你如何探索
「我记得这个 skill 的内容」	skill 会演进，必须读当前版本
「用 skill 太重量级了」	简单的事也会变复杂，用 skill

优先级：用户显式指令 > Superpowers skills > 默认 system prompt。

4.2 Skills 也会「TDD」

writing-skills skill 要求新 skill 经过对抗性压力测试：用子 agent 模拟真实场景（生产宕机、沉没成本、时间压力），而不是做问答题式的「满分测验」。测试失败后，skill 文案会被加强——这就是 skills 的 RED/GREEN。

4.3 说服原理

writing-skills/persuasion-principles.md 记录了 Meincke et al. (2025) 的研究：对 LLM 使用 Cialdini 的七种说服原则，合规率从 33% 提升到 72%。Superpowers 用 Authority、Commitment、Scarcity、Social proof 等杠杆，让 engineering discipline 在压力下仍被遵守——对抗 LLM 天生的「先动手再说」倾向。

5. Skills 库一览

测试

Skill	作用
`test-driven-development`	RED-GREEN-REFACTOR 铁律 + 测试反模式参考

调试

Skill	作用
`systematic-debugging`	四阶段根因分析
`verification-before-completion`	宣称「修好了」之前必须有证据

协作 / 流程

Skill	作用
`brainstorming`	苏格拉底式设计澄清
`writing-plans`	细粒度实现计划
`executing-plans`	批量执行 + 人工检查点
`subagent-driven-development`	子 agent 流水线 + 双阶段审查
`dispatching-parallel-agents`	并行子 agent 工作流
`requesting-code-review`	发起审查前的清单
`receiving-code-review`	响应审查意见
`using-git-worktrees`	并行开发分支
`finishing-a-development-branch`	合并/PR 决策

元技能

Skill	作用
`writing-skills`	编写与测试新 skill 的完整方法论
`using-superpowers`	技能系统入门与 bootstrap

6. 设计哲学

原则	含义
Test-Driven Development	测试先行，没有商量余地（除非 partner 明确豁免）
Systematic over ad-hoc	流程优于猜测；调试用四阶段法
Complexity reduction	简单是首要目标；YAGNI 不是口号
Evidence over claims	验证通过之前，不得宣称完成

Skills 里刻意使用 「your human partner」 而非「user」——强调结对关系，这是经过测试的设计选择。

7. 安装与支持平台

Superpowers 是 harness-neutral 的：同一套 skills，通过各平台的 hooks/bootstrap 适配不同 runtime。

Harness	安装方式（摘要）
Claude Code	`/plugin install superpowers@claude-plugins-official`
Cursor	Agent 聊天中 `/add-plugin superpowers` 或插件市场搜索
Codex App / CLI	官方 OpenAI plugins 市场
Gemini CLI	`gemini extensions install https://github.com/obra/superpowers`
GitHub Copilot CLI	`copilot plugin install superpowers@superpowers-marketplace`
OpenCode	按 `.opencode/INSTALL.md` 指引
Pi	`pi install git:github.com/obra/superpowers`
Antigravity	`agy plugin install https://github.com/obra/superpowers`
Kimi Code	插件市场或 `/plugins install` 仓库 URL

集成标准： 必须在会话启动时加载 using-superpowers bootstrap。手动复制 skill 文件、或需要每会话手动 opt-in 的方案，不算合格集成。

验收测试

在全新会话中发送：

Let's make a react todo list

若 brainstorming 在写任何代码之前自动触发，则集成有效。

8. 版本演进

时间	里程碑
2025-10	首发，Claude Code 插件
2025-11+	OpenCode、Codex 等 harness 支持扩展
2026-04 (v5.1)	移除 legacy slash commands；worktree skills 重写
2026-06 (v6.0)	SDD 审查流程重构；Kimi/Pi/Antigravity；eval harness 独立为 superpowers-evals

仍在推进的方向：Sharing（个人 skills 共享机制）、Memories（remembering-conversations 各组件已写好，尚未完全串联发布）。

9. 测试与质量保障

Superpowers 把测试分成两层：

tests/ — 插件基础设施测试（hooks、manifest、跨平台 shell）
evals/（superpowers-evals）— 用 Drill harness 驱动真实 Claude Code / Codex / Gemini 会话，LLM verifier 判断 skill 合规性

修改 skill 内容有极高门槛：需要 adversarial pressure testing、before/after eval 证据。

10. 使用建议

10.1 第一次体验

安装后，发一句 Let's make a react todo list，观察 agent 是在问「你要什么样的 Todo」，还是已经 npm create vite 了——差别本身，就是 Superpowers 存在的理由。

10.2 与 OpenSpec 的关系

两者都强调「先对齐再写代码」，但路径不同：

维度	Superpowers	OpenSpec
载体	Skills + bootstrap 自动触发	Markdown 规格 + Slash 命令
重点	工程纪律（TDD、审查、worktree）	行为规格与 Delta 变更
状态管理	skill 流程 + `.superpowers/sdd/`	`openspec/specs/` + `openspec/changes/`

可以组合使用：OpenSpec 管「做什么」，Superpowers 管「怎么做」。

10.3 Telemetry

Brainstorming 的 Visual Companion 默认会从 Prime Radiant 网站加载 logo（含版本号），用于粗略统计使用量——不含项目内容。可通过 SUPERPOWERS_DISABLE_TELEMETRY=1 关闭。

11. 常见问题

Q: Superpowers 会增加多少流程负担？

A: 简单功能的设计可以只有几句话，但 brainstorming 流程不能跳过。收益是减少返工、测试缺失和架构随意。

Q: 必须用 Superpowers 才能用 AI 编程吗？

A: 不是。但如果你经历过「AI 理解偏差导致返工」或「代码能跑但没有测试」的痛苦，这套纪律的投资回报率很高。

Q: 支持 Cursor 吗？

A: 支持。在 Agent 聊天中用 /add-plugin superpowers 或从插件市场安装，确保 bootstrap 在会话启动时加载。

Q: 如何贡献？

A: PR target dev 分支，必须填写 PR template、披露 authoring environment、附 human partner 审阅。详见 CONTRIBUTING。

12. 小结

Superpowers 的核心洞察：

LLM 会写代码，不等于 LLM 会做工程。 设计、测试、审查、版本隔离需要被编码进系统。
Skills 是行为即代码。 可版本控制、可测试、可组合、可跨 harness 移植。
自动触发是关键。 Bootstrap + description 驱动的检索，让「先 brainstorm 再写代码」成为默认路径。

完整工作循环：

1. brainstorming 对齐设计
2. worktree 隔离开发
3. writing-plans 细粒度计划
4. subagent-driven-development 逐任务实现 + 审查
5. TDD 贯穿实现
6. finishing-a-development-branch 收尾

如果你已经在用 AI 编程助手，Superpowers 值得试一次。安装后从 Let's make a react todo list 开始，看 agent 是否先问需求再写代码。