zeroshot

zeroshot 是一款开源的命令行工具，旨在打造你的“自主工程团队”。它不仅仅是一个代码生成器，而是一个能够独立完成任务规划、代码实现、测试验证及迭代修复的多智能体编排系统。用户只需指向一个任务（如 GitHub Issue、本地文件或一段文字描述），zeroshot 便会自动在隔离环境中运行，直到产出经过严格验证的生产级代码，或在失败时提供可复现的具体原因。

传统 AI 编程助手往往缺乏自我验证能力，容易陷入“盲目自信”的误区。zeroshot 通过引入独立的“规划者”、“执行者”和“验证者”角色，解决了这一痛点。它内置了盲测机制，会循环执行“计划 - 实施 - 验证”流程，确保代码不仅被写出，更能通过自动化测试并符合验收标准，特别适用于对正确性要求高于速度的复杂场景。

这款工具非常适合注重代码质量与可复现性的高级工程师、希望自动化 PR 工作流的开发团队，以及需要处理大量遗留问题的开源维护者。其独特亮点在于支持多种主流 AI 模型（如 Claude Code、OpenAI Codex、Gemini 等）作为后端，并兼容 GitHub、GitLab、Jira 等多个任务管理平台。此外，它还具备崩溃恢复功能，能持久化保存状态，确保长耗时任务的安全执行。

某电商平台的后端团队正面临一个棘手的任务：需要在用户下单流程中紧急引入“乐观锁”机制，以解决高并发下的库存超卖问题，同时必须确保代码能正确处理复杂的版本冲突（如 ABA 问题）。

没有 zeroshot 时

人工实现风险高：资深工程师需手动编写复杂的重试逻辑和版本比对代码，极易因疏忽遗漏边缘情况，导致生产环境出现数据不一致。
验证过程繁琐：开发者需反复手动运行单元测试和集成测试，难以模拟真实的高并发竞争条件，往往依赖直觉而非数据确认修复效果。
迭代效率低下：一旦发现测试失败，需重新分析日志、修改代码并再次提交，整个“编码 - 测试 - 修复”循环耗时数小时甚至数天。
缺乏独立审查：单人开发模式缺乏独立的“第二双眼睛”进行盲测验证，代码质量高度依赖个人状态，难以保证生产级稳定性。

使用 zeroshot 后

自主闭环开发：只需输入“添加带指数退避的乐观锁”指令，zeroshot 自动调度规划器拆解任务，并由实现器在隔离环境中完成编码，精准处理 ABA 问题。
自动化盲测验证：内置的独立验证器自动运行压力测试和边界检查，不依赖开发者主观判断，直到所有测试通过才停止迭代，确保逻辑严密。
无限循环直至达标：若首次提交未通过验证，zeroshot 会自动分析失败原因并重新修改代码，无需人工干预，直到生成可合并的生产级代码。
可复现的交付成果：整个过程的状态持久化保存，即使意外中断也能恢复，最终交付的代码附带明确的验证报告，让团队放心合并。

zeroshot 将原本需要数天的人工试错过程，转化为一个自动运行、自我修正且结果可验证的闭环工程流，让正确性不再依赖运气。

零样本 CLI

🎉 v5.4 新特性： 现已支持 OpenCode CLI！您可以选择 Claude、Codex、Gemini 或 OpenCode 作为 AI 提供商。同时支持 GitHub、GitLab、Jira 和 Azure DevOps 作为问题后端。详情请参阅提供商和多平台问题支持。

npm install -g @covibes/zeroshot

演示（100倍速，90分钟运行，5轮迭代直至批准）

Zeroshot 是一个开源的 AI 编码代理编排 CLI，它运行多代理工作流，以自主方式实现、审查、测试和验证代码变更。

它在隔离环境中运行一个 规划器、一个 实施者 和独立的 验证者，循环执行直到变更被验证或因可操作且可复现的失败而被拒绝。

专为那些正确性比速度更重要的任务而设计。

工作原理

规划：将任务转化为具体的验收标准
实施：在隔离的工作区（本地、工作树或 Docker）中进行更改
验证：由独立的验证者运行自动化检查
迭代：重复执行，直到验证通过，或返回可操作的失败信息
恢复：崩溃安全的状态会被持久化以便恢复

快速开始

zeroshot run 123                    # GitHub 问题编号
zeroshot run feature.md             # Markdown 文件
zeroshot run "添加暗模式"        # 内联文本

或者直接描述一个复杂任务：

zeroshot run "添加带有自动重试的乐观锁：更新用户时，使用指数退避策略最多重试 3 次，合并不冲突的字段更改，并详细提示冲突。处理版本从 A 变为 B 再变回 A 的 ABA 问题。"

为什么不能只用一个 AI 代理？

方法	编写代码	运行测试	盲目验证	迭代直至验证
基于聊天的助手	✅	⚠️	❌	❌
单一编码代理	✅	⚠️	❌	⚠️
Zeroshot（多代理）	✅	✅	✅	✅

使用场景

自主 AI 代码重构
AI 驱动的拉取请求自动化
带有验证的自动化 bug 修复
软件工程中的多代理代码生成
带有盲验证的代理式编码工作流

适合人群

关注正确性和可重复性的高级工程师
自动化 PR 流程和代码审查关卡的团队
标准化代理式工作流的基础架构/平台团队
处理问题积压的开源维护者
希望获得验证而非“感觉”的 AI 高级用户

安装与要求

平台：Linux、macOS。Windows（原生/WSL）暂未支持，因为我们正在强化可靠性和多提供商的正确性。

npm install -g @covibes/zeroshot

要求：Node 18+，至少一个提供商 CLI（Claude Code、Codex、Gemini、Opencode）。

# 安装一个或多个提供商
npm i -g @anthropic-ai/claude-code
npm i -g @openai/codex
npm i -g @google/gemini-cli
# Opencode：详见 https://opencode.ai

# 使用提供商 CLI 进行认证
claude login        # Claude
codex login         # Codex
gemini auth login   # Gemini
opencode auth login # Opencode

# GitHub 认证（用于问题编号）
gh auth login

提供商

Zeroshot 会调用各个提供商的 CLI。您可以选择默认提供商，也可以在每次运行时覆盖：

zeroshot providers
zeroshot providers set-default codex
zeroshot run 123 --provider gemini

有关设置、模型级别和 Docker 挂载，请参阅 docs/providers.md。

为什么需要多个代理？

单代理会话容易失效。上下文会在数千个 token 中被淹没。模型更倾向于“完成”而不是“正确”。

Zeroshot 通过隔离的代理来解决这个问题，这些代理会相互检查彼此的工作。验证者无法对未编写的代码撒谎。如果检查失败？就修复并重试，直到真正有效为止。

区别于其他工具之处

盲验证：验证者永远不会看到工作者的上下文或代码历史
可重复的工作流：任务复杂度决定了代理数量和模型选择
接受/拒绝循环：拒绝结果包含可操作的发现，而非含糊的抱怨
崩溃恢复：所有状态都会持久化到 SQLite 数据库中；随时可以恢复
隔离模式：无隔离、git 工作树或 Docker 容器
成本控制：模型上限可防止 API 费用失控

何时使用 Zeroshot

Zeroshot 在任务具有明确的验收标准时表现最佳。

场景	使用	为什么
添加限流（滑动窗口，按 IP 限制，429 错误）	是	要求清晰
将认证重构为 JWT	是	定义了最终状态
修复登录 bug	是	成功与否可衡量
修复 2410 个 Lint 违规	是	完成标准明确
让应用更快	否	需要先探索
改善代码库	否	无验收标准
查明不稳定测试	否	探索性任务

经验法则：如果您无法描述“完成”意味着什么，那么验证者就无法对其进行验证。

命令概览

# 运行
zeroshot run 123                      # GitHub 问题
zeroshot run feature.md               # Markdown 文件
zeroshot run "添加暗模式"          # 内联文本

# 隔离
zeroshot run 123 --worktree       # git 工作树
zeroshot run 123 --docker         # 容器

# 自动化（--ship 表示 --pr 表示 --worktree）
zeroshot run 123 --pr             # 工作树 + 创建 PR
zeroshot run 123 --ship           # PR + 批准时自动合并

# 后台模式
zeroshot run 123 -d
zeroshot run 123 --ship -d

# 控制
zeroshot list
zeroshot status <id>
zeroshot logs <id> -f
zeroshot resume <id>
zeroshot stop <id>
zeroshot kill <id>
zeroshot watch

# 提供商
zeroshot 提供商
zeroshot 提供商 设置默认 codex

# 代理库
zeroshot 代理 列表
zeroshot 代理 显示 <名称>

# 维护
zeroshot 清理
zeroshot 清除

多平台问题支持

Zeroshot 支持 GitHub、GitLab、Jira 和 Azure DevOps。只需粘贴问题的 URL 或编号即可。在 Git 仓库中工作时，zeroshot 会自动从你的 Git 远程 URL 中检测问题提供商，无需任何配置！

# GitHub
zeroshot 运行 123
zeroshot 运行 https://github.com/org/repo/issues/123

# GitLab（云和自托管）
zeroshot 运行 https://gitlab.com/org/repo/-/issues/456
zeroshot 运行 https://gitlab.mycompany.com/org/repo/-/issues/789

# Jira
zeroshot 运行 PROJ-789
zeroshot 运行 https://company.atlassian.net/browse/PROJ-789

# Azure DevOps
zeroshot 运行 https://dev.azure.com/org/project/_workitems/edit/999

要求：根据你使用的平台，需要相应的 CLI 工具（gh、glab、jira 或 az)。有关设置及自托管实例，请参阅 issue-providers README。

--pr 模式注意事项：请从目标仓库目录运行 zeroshot。拉取请求将在你当前目录的 Git 远程仓库上创建。如果你从其他仓库运行，zeroshot 会发出警告并跳过“Closes #X”引用（拉取请求仍会被创建，但不会自动关闭问题）。

架构

Zeroshot 是一个基于消息驱动的协调层，具有智能默认配置。

调度器会根据任务的复杂性和类型对任务进行分类。
工作流模板会选择代理和验证者。
代理会将结果发布到 SQLite 账本中。
验证者会根据具体发现批准或拒绝。
被拒绝的任务会返回给执行者进行修复。

                                ┌─────────────────┐
                                │      任务       │
                                └────────┬────────┘
                                         │
                                         ▼
                ┌────────────────────────────────────────────┐
                │                 调度器                  │
                │     复杂度 × 任务类型 → 工作流       │
                └────────────────────────┬───────────────────┘
                                         │
           ┌─────────────────────────────┼─────────────────────────────┐
           │                             │                             │
           ▼                             ▼                             ▼
     ┌───────────┐                ┌───────────┐                ┌───────────┐
     │  简单任务  │                │  简单任务   │                │ 标准及以上任务 │
     │  1 个代理  │──────────▶     │  执行者    │                │ 计划者    │
     │ (初级)     │  完成        │ + 1 个验证者│                │ + 执行者  │
     │ 无验证者  │                └─────┬─────┘                │ + 3-5 个验证者│
     └───────────┘                      │                      └─────┬─────┘
                                        ▼                            │
                                 ┌─────────────┐                     ▼
                             ┌──▶│   执行者    │             ┌─────────────┐
                             │   └──────┬──────┘             │   计划者   │
                             │          │                    └──────┬──────┘
                             │          ▼                           │
                             │   ┌─────────────────────┐            ▼
                             │   │ ✓ 验证者         │     ┌─────────────┐
                             │   │   （通用检查）   │ ┌──▶│   执行者    │
                             │   └──────────┬──────────┘ │   └──────┬──────┘
                             │       拒绝   │ 全部通过     │          │
                             └──────────────┘     │      │          ▼
                                                  │      │   ┌──────────────────────┐
                                                  │      │   │ ✓ 要求               │
                                                  │      │   │ ✓ 代码（标准及以上）   │
                                                  │      │   │ ✓ 安全性（关键）      │
                                                  │      │   │ ✓ 测试员（关键）      │
                                                  │      │   │ ✓ 对抗测试           │
                                                  │      │   │   （实际执行）       │
                                                  │      │   │   （实际执行）       │
                                                  │      │   └──────────┬───────────┘
                                                  │      │       拒绝   │ 全部通过
                                                  │      └──────────────┘     │
                                                  ▼                           ▼
     ┌─────────────────────────────────────────────────────────────────────────────┐
     │                                完成                                     │
     └─────────────────────────────────────────────────────────────────────────────┘

复杂度模型

任务	复杂度	代理数量	验证者
修复 README 中的错别字	简单	1	无
添加暗黑模式切换按钮	简单	2	通用验证者
重构认证系统	标准	4	需求验证、代码验证
实现支付流程	关键	7	需求验证、代码验证、安全性验证、测试员验证、对抗测试

按复杂度选择模型

复杂度	计划者	工作者	验证者
极简	-	level1	-
简单	-	level2	1 (level2)
标准	level2	level2	2 (level2)
关键	level3	level2	5 (level2)

等级对应于特定提供商的模型。可通过 zeroshot providers setup <provider> 或 settings.providerSettings 进行配置。（旧版 maxModel 仅适用于 Claude。）

自定义工作流（框架模式）

Zeroshot 是基于消息驱动的，因此您可以定义任意代理拓扑结构。

专家小组：并行的专家 -> 聚合器 -> 决策
分阶段审核：顺序验证者，每个都有否决权
层次化：主管动态生成工作者
动态调整：指挥官在执行过程中添加代理

协调原语：

消息总线（发布/订阅主题）
触发器（条件触发唤醒代理）
账本（SQLite，崩溃恢复）
动态生成（CLUSTER_OPERATIONS）

使用提供商 CLI 创建自定义集群

启动您的提供商 CLI 并描述您的集群：

为安全关键功能创建一个 zeroshot 集群配置：

1. 实现代理（level2）负责实现该功能
2. 四个并行验证者：
   - 安全验证者：OWASP 检查、SQL 注入、XSS、CSRF
   - 性能验证者：避免 N+1 查询、正确索引
   - 隐私验证者：GDPR 合规、数据最小化
   - 代码审查员：整体代码质量
3. 所有验证者必须批准后才能合并
4. 如果任何验证者拒绝，实现代理需修复并重新提交
5. 安全验证者使用 level3（风险最高）

请参考 cluster-templates/base-templates/full-workflow.json，并创建类似的集群，保存为 cluster-templates/security-review.json

内置验证会检查缺失的触发器、死锁以及无效的类型连接，在运行前确保无误。

有关集群模式和示例，请参阅 CLAUDE.md。

崩溃恢复

所有状态都持久化在 SQLite 账本中。您可以在任何时候恢复：

zeroshot resume cluster-bold-panther

隔离模式

Git 工作树（默认用于 --pr/--ship）

zeroshot run 123 --worktree

使用 git 工作树进行轻量级隔离。它会创建一个独立的工作目录和分支。当使用 --pr 和 --ship 时会自动启用。

Docker 容器

zeroshot run 123 --docker

在一个全新的容器中实现完全隔离。您的工作区将保持不变。适合进行高风险实验或并行运行。

何时使用哪种模式

场景	推荐方式
快速任务，自行审查更改	无隔离（默认）
PR 流程，代码审查	`--worktree` 或 `--pr`
高风险实验，可能破坏环境	`--docker`
并行运行多个任务	`--docker`
完全自动，无需审查	`--ship`

默认行为： 代理仅修改文件，不会提交或推送，除非使用明确允许此操作的隔离模式。

Docker 凭证挂载

使用 --docker 时，zeroshot 会挂载凭证目录，以便代理可以访问提供商 CLI 和 AWS、Azure、kubectl 等工具。

默认挂载: gh, git, ssh（GitHub CLI、git 配置、SSH 密钥）

可用预设: gh, git, ssh, aws, azure, kube, terraform, gcloud, claude, codex, gemini

# 通过设置配置（持久化）
zeroshot settings set dockerMounts '["gh", "git", "ssh", "aws", "azure"]'

# 查看当前配置
zeroshot settings get dockerMounts

# 每次运行覆盖
zeroshot run 123 --docker --mount ~/.aws:/root/.aws:ro

# 提供商凭证
zeroshot run 123 --docker --mount ~/.config/codex:/home/node/.config/codex:ro
zeroshot run 123 --docker --mount ~/.config/gemini:/home/node/.config/gemini:ro

# 禁用所有挂载
zeroshot run 123 --docker --no-mounts

# CI：环境变量覆盖
ZEROSHOT_DOCKER_MOUNTS='["aws","azure"]' zeroshot run 123 --docker

有关提供商 CLI 设置和挂载详情，请参阅 docs/providers.md。

自定义挂载（混合预设与显式路径）：

zeroshot settings set dockerMounts '[
  "gh",
  "git",
  {"host": "~/.myconfig", "container": "$HOME/.myconfig", "readonly": true}
]'

容器主目录：预设使用 $HOME 占位符。默认：/root。可通过以下方式覆盖：

zeroshot settings set dockerContainerHome '/home/node'
# 或每次运行：
zeroshot run 123 --docker --container-home /home/node

环境变量传递：预设会自动传递相关环境变量（例如，aws -> AWS_REGION、AWS_PROFILE）。可添加自定义：

zeroshot settings set dockerEnvPassthrough '["MY_API_KEY", "TF_VAR_*"]'

资源

CLAUDE.md - 架构、集群配置模式、代理原语
docs/providers.md - 提供商设置、模型等级和 Docker 挂载
docs/context-management.md - 上下文选择、上下文包和状态快照
Discord - 支持与社区
zeroshot export <id> - 将对话导出为 Markdown
sqlite3 ~/.zeroshot/*.db - 直接访问账本以进行调试

故障排除

问题	解决方法
`claude: command not found`	`npm i -g @anthropic-ai/claude-code && claude auth login`
`codex: command not found`	`npm i -g @openai/codex && codex login`
`gemini: command not found`	`npm i -g @google/gemini-cli && gemini auth login`
`gh: command not found`	安装 GitHub CLI
`--docker` 失败	Docker 必须正在运行：使用 `docker ps` 验证
集群卡住	使用 `zeroshot resume <id>` 继续
代理持续失败	检查 `zeroshot logs <id>` 以查看实际错误
`zeroshot: command not found`	`npm install -g @covibes/zeroshot`
代理行为异常	在 Claude Code 中使用 `/analyze-cluster-postmortem <id>`（如果修复方案具有通用性则会创建问题）

贡献

请参阅 CONTRIBUTING.md，了解开发环境搭建及贡献指南。

请在参与之前阅读 CODE_OF_CONDUCT.md。

如遇安全相关问题，请参阅 SECURITY.md。

TUI

Ratatui（Rust 实现）是目前唯一支持的 TUI。入口点如下：

zeroshot（TTY 环境，无需参数）
zeroshot tui
zeroshot watch

TUI 开发

Rust 版本的 TUI 会通过标准输入输出启动一个 Node 后端。迭代时请同时运行这两部分。

单命令开发循环（自动构建并重启）：

cargo install cargo-watch
npm run dev:tui

安装依赖
```
npm ci
```

以监听模式构建 TUI 后端

npm run build:tui-backend -- --watch
# 或者
npx tsc -p tsconfig.tui-backend.json -w

运行 Rust 版本的 TUI（在另一个终端中）

cd tui-rs
cargo run -p zeroshot-tui -- --ui disruptive

从本仓库本地运行 CLI

若希望全局使用开发分支中的 zeroshot 命令：

npm run dev:link

一条命令即可完成链接并启动 TUI 开发循环：

npm run dev:bootstrap

CLI 集成流程

使用 Node CLI 启动本地的 Rust 二进制文件：

cd tui-rs
cargo build -p zeroshot-tui
cd ..
ZEROSHOT_TUI_BINARY_PATH="$PWD/tui-rs/target/debug/zeroshot-tui" node cli/index.js tui

TUI 自定义配置

ZEROSHOT_TUI_BACKEND_PATH 可指向特定的 lib/tui-backend/server.js
ZEROSHOT_TUI_BINARY_PATH 可指向本地的 Rust 二进制文件
ZEROSHOT_TUI_UI=classic|disruptive 可强制指定 UI 风格

MIT 许可证 - Covibes

基于 Anthropic 的 Claude Code 构建。

Zeroshot 快速上手指南

Zeroshot 是一个开源的 AI 编码代理编排 CLI 工具。它通过运行多智能体工作流（规划者、实现者、独立验证者），在隔离环境中自动执行代码的编写、审查、测试和验证，直到变更被确认或通过可复现的错误报告被拒绝。适用于对代码正确性要求高于速度的场景。

环境准备

系统要求

操作系统：Linux 或 macOS。（Windows 用户建议使用 WSL）
Node.js：版本 18 或更高。

前置依赖 在使用 Zeroshot 之前，你需要安装并登录至少一个 AI 提供商的 CLI 工具，以及对应平台的 Issue 管理工具（如使用 GitHub Issues）。

安装 AI 提供商 CLI（任选其一或多个）：

npm i -g @anthropic-ai/claude-code
npm i -g @openai/codex
npm i -g @google/gemini-cli
# Opencode 请参考其官方文档

认证 AI 提供商：

claude login        # Claude
codex login         # Codex
gemini auth login   # Gemini
opencode auth login # Opencode

安装平台 CLI（用于读取 Issue，以 GitHub 为例）：
```
# 安装 GitHub CLI
gh auth login
```
注：若使用 GitLab、Jira 或 Azure DevOps，请分别安装 glab、jira 或 az 并完成认证。

安装步骤

使用 npm 全局安装 Zeroshot：

npm install -g @covibes/zeroshot

提示：如果下载速度较慢，可配置 npm 国内镜像源（如淘宝源）后再执行安装：
npm config set registry https://registry.npmmirror.com
npm install -g @covibes/zeroshot

安装完成后，可通过以下命令查看可用提供商或设置默认提供商：

zeroshot providers
zeroshot providers set-default codex

基本使用

Zeroshot 支持直接通过 Issue 编号、Markdown 文件或自然语言描述来启动任务。

1. 处理 GitHub/GitLab/Jira Issue 直接输入 Issue 编号（需在对应仓库目录下）或完整 URL：

zeroshot run 123
zeroshot run https://github.com/org/repo/issues/123
zeroshot run PROJ-789

2. 基于本地文件运行 将任务描述写在 Markdown 文件中运行：

zeroshot run feature.md

3. 直接输入自然语言指令 适合简单任务或快速原型：

zeroshot run "Add dark mode"

4. 复杂任务示例 可以直接描述复杂的逻辑需求，Zeroshot 会自动规划并验证：

zeroshot run "Add optimistic locking with automatic retry: when updating a user,
retry with exponential backoff up to 3 times, merge non-conflicting field changes,
and surface conflicts with details. Handle the ABA problem where version goes A->B->A."

常用参数

--worktree：在 git worktree 隔离环境中运行。
--docker：在 Docker 容器中运行（最高隔离级别）。
--pr：完成任务后自动创建 Pull Request。
--ship：创建 PR 并在批准后自动合并。

# 示例：在 Docker 中运行并自动创建 PR
zeroshot run 123 --docker --pr

使用场景

没有 zeroshot 时

使用 zeroshot 后

运行环境要求

快速开始

零样本 CLI

工作原理

快速开始

为什么不能只用一个 AI 代理？

使用场景

适合人群

安装与要求

提供商

为什么需要多个代理？

区别于其他工具之处

何时使用 Zeroshot

命令概览

多平台问题支持

架构

复杂度模型

按复杂度选择模型

使用提供商 CLI 创建自定义集群

崩溃恢复

隔离模式

Git 工作树（默认用于 --pr/--ship）

Docker 容器

何时使用哪种模式

资源

贡献

TUI

TUI 开发

从本仓库本地运行 CLI

CLI 集成流程

TUI 自定义配置

Zeroshot 快速上手指南

环境准备

安装步骤

基本使用

版本历史

常见问题

相似工具推荐

openclaw

stable-diffusion-webui

everything-claude-code

ComfyUI

LLMs-from-scratch

Deep-Live-Cam