codex-orchestrator

TotalClaw 作者 totalclaw

面向 Codex CLI 的端到端软件交付编排器,支持绿地/棕地双项目模式与自主/门控双执行模式,含严格阶段门、规格驱动开发、测试矩阵与 AGENTS.md 工作流。

安装 / 下载方式

TotalClaw CLI推荐
totalclaw install totalclaw:totalclaw~shalomobongo-codex-conductor
cURL直接下载,无需登录
curl -fsSL https://skills.taituai.com/api/skills/totalclaw%3Atotalclaw~shalomobongo-codex-conductor/file -o shalomobongo-codex-conductor.md
## 概述(中文)

面向 Codex CLI 的端到端软件交付编排器,支持绿地/棕地双项目模式与自主/门控双执行模式,含严格阶段门、规格驱动开发、测试矩阵与 AGENTS.md 工作流。

## 技能正文

# Codex Orchestrator

将 Codex 协调为纪律严明的交付系统,而非一次性生成器。

## 核心模式

同时选择:

- `project_mode`
  - `greenfield`:从零构建
  - `brownfield`:接入并现代化现有系统
- `execution_mode`
  - `autonomous`:门控通过后自动推进
  - `gated`:每个门控暂停等待用户批准

## 指导原则:规格驱动开发

**无规格不写代码。** 不可协商。

任何实现之前,必须有书面规格,包含:
- 构建什么
- 为何需要
- 验收标准(可测试)
- 约束与范围外项

编码智能体 **不得**:
- 猜测需求
- 假设行为
- 添加未请求的功能
- 发明规格中未有的抽象

规格不清晰 → 停止并询问。绝不猜测。

完整规格模板与执行规则见 `references/spec-driven-development.md`。

## 不可跳过的顺序

1.  intake + 规划问卷
2. **规格创建 + 批准**(任何代码之前先写规格)
3. 文档脚手架 + AGENTS.md 契约
4. 模式特定的架构前工作
5. 架构 + ADR 基线(引用规格)
6. 按垂直切片构建(每项任务引用规格)
7. 对照规格验收标准验证
8. 安全/质量门控
9. 发布就绪 + 交接

绝不静默跳过门控。无规格不实现。

## 必读资源

运行前阅读以下参考:

- `references/spec-driven-development.md`(**必须首先阅读** — 统领全部工作)
- `references/planning-questionnaire.md`
- `references/modes.md`
- `references/gate-checklists.md`
- `references/testing-matrix.md`
- `references/manual-test-templates.md`
- `references/codex-runbook.md`
- `references/gate-prompts.md`
- `scripts/agent_exec.py`
- `references/research-playbook.md`(若 `research_mode=true`)

## 脚手架

初始化项目产物:

```bash
python scripts/init_project_docs.py --root <project-path> --mode <greenfield|brownfield>
```

创建/更新:

- `AGENTS.md`(项目工作流契约)
- `docs/*.md` 规划/架构/测试/进度/变更文档
- 棕地文档(brownfield 模式时)
- `.orchestrator/status.json`(机器可读状态)
- `.orchestrator/context.json`(项目/执行/研究模式上下文)

## 规划规则

首先询问用户使用哪个编码智能体(`codex` | `claude` | `opencode` | `pi`)及备用智能体。
然后询问 `references/planning-questionnaire.md` 中的所有必答题。

最低必答项:

- mission
- top user journeys
- v1 scope
- hosting target
- stack preference(或明确要求推荐)
- `project_mode`
- `execution_mode`
- definition of done
- acceptance tests

若 `research_mode=true`,在 G2 之前产出 `docs/research-notes.md` 与架构推荐。

## 模式特定要求

### Greenfield

G2 之前必须完成:

- 需求 + DoD 清晰
- 架构基线
- ADR-0001 含备选方案
- CI/测试基线计划

### Brownfield

G2 之前必须完成(由编码智能体撰写,非编排器):

- 现状架构与系统清单
- 依赖图与风险登记
- 特征化测试基线
- 迁移策略 + 回滚方案
- 兼容性边界文档化

## 门控引擎

使用 `references/gate-checklists.md` 中定义的 `G0` 至 `G7` 门控。

通过脚本更新门控状态:

```bash
python scripts/gate_status.py set --root <project-path> --gate G3 --state PASS --note "slice-1 verified"
```

验证状态 schema:

```bash
python scripts/gate_status.py validate --root <project-path>
```

允许状态:`PENDING | IN_PROGRESS | PASS | FAIL | BLOCKED`。
默认强制执行门控前置条件(顺序 + 模式感知文档检查)。

## 验证规则

使用 `references/testing-matrix.md`。

每次推进的强制检查:

- lint/type/build
- unit/integration/e2e(适用时)
- API 契约健全性(若有 API)
- 安全基线
- 文档同步验证

同时执行 `references/manual-test-templates.md` 中的手动测试脚本。

## 文档规则

每个有意义的步骤:

- 更新 `docs/tasks.md`
- 更新 `docs/progress.md`
- 追加 `docs/change-log.md`
- 更新 `docs/traceability.md`
- 在 `docs/test-results.md` 记录测试证据

用户请求的变更,运行:

```bash
python scripts/change_impact.py --root <project-path> --request "<change request>"
```

然后完成其输出的所有受影响文档 TODO。

## Codex 执行模式

长运行使用 PTY/后台。命令模式见 `references/codex-runbook.md`。

关键规则:每次运行执行 **一个** 任务,而非一次 prompt 完成整个项目。
G4 维护 `docs/g4-task-plan.md` 清单,逐条处理任务。

生成门控专用 prompt:

```bash
python scripts/generate_gate_prompt.py --gate <G1..G7> --agent <codex|claude|opencode|pi> --project-mode <greenfield|brownfield> --execution-mode <autonomous|gated> --research-mode <true|false> --task "<single task summary>" --spec-ref "<spec ref when applicable>"
```

`update_docs_step.py` 现为仅用于恢复/手动记账的备用工具。
主要期望:编码智能体在每个任务中直接更新文档。

必需循环:

1. 验证任务规格存在(无规格 = 不实现)
2. 用规格驱动 prompt 模板启动所选编码智能体
3. 任务完成后编码智能体立即更新文档(含交接清单)
4. 编码智能体唤醒 OpenClaw,附带任务摘要及验证步骤文档位置
5. OpenClaw 智能体自行运行验证:
   - 终端工具中的 CLI 检查
   - 浏览器工具中的浏览器/手动检查(Web 流程)
6. 验证输出符合规格验收标准
7. 验证失败时,OpenClaw 将确切失败信息发回编码智能体并重新运行修复循环
8. 验证通过后才写入最终门控状态(或标记 FAIL/BLOCKED)

执行约束:
- `run_gate.py` 对 G3/G4 任务要求 `--spec-ref`(实现门控)。
- `run_gate.py` 要求编码智能体 + 备用智能体上下文。
- 每项任务需要验证证据(`--validate-cmd` 和/或 `--ui-review-note`)。
- 标记 `--requires-browser-check` 的任务必须包含 `--ui-review-note`。
- `status=PASS` 至少需要一条 `--validate-cmd`。
- 使用 `--agent-dry-run` 时阻止 `status=PASS`。
- G4 的 PASS 在 `docs/g4-task-plan.md` 仍有未勾选任务时被阻止。
- 验证输出记录在 `docs/validation-log.md`。
- 编码智能体必须在每个任务后更新文档,含 `docs/agent-handoff.md`。
- 棕地模式下,若 onboarding 文档未由编码智能体更新,G1/G2 失败。
- 编码智能体 prompt **必须** 包含 `references/spec-driven-development.md` 的规格前言。
- 任何无规格引用的实现 = 自动 FAIL。
- 自主模式下,验证失败触发自动修复重试(默认:2 次),失败详情回传编码智能体。
- 可选严格模式:`--auto-block-on-retry-exhaust` 在重试用尽时自动将门控分类为 BLOCKED。

## 进度可见性

生成快速状态板:

```bash
python scripts/progress_dashboard.py --root <project-path>
```

汇总当前门控、完成百分比、阻塞项与近期活动。

单命令运行单任务门控步骤:

```bash
python scripts/run_gate.py --root <project-path> --gate G2 --agent codex --fallback-agent claude --project-mode brownfield --execution-mode gated --research-mode true --task "architecture baseline refined for API routing" --status IN_PROGRESS --validate-cmd "npm run -s typecheck" --ui-review-note "N/A for architecture-only task"
```

门控级清单全部完成后才标记 PASS:

```bash
python scripts/run_gate.py --root <project-path> --gate G2 --agent codex --task "architecture gate complete" --status PASS --validate-cmd "npm run -s typecheck"
```

Web/UI 任务需 OpenClaw 智能体浏览器验证:

```bash
python scripts/run_gate.py ... --requires-browser-check --ui-review-note "Verified login + CRUD manually in browser via OpenClaw browser tools"
```

打包可分发技能产物:

```bash
python scripts/package_skill.py --skill-dir . --out dist
```

## 终态交付物

完成时提供:

- `docs/progress.md` 100%
- 来自 `.orchestrator/status.json` 的最终门控摘要
- 测试结果摘要 + 未解决风险
- 部署 + 回滚说明
- 下一迭代 backlog

若仍有阻塞,标记为 `PARTIAL_COMPLETE`,并明确阻塞项与负责人。