conductor
Conductor 是一款专为 Gemini CLI 设计的扩展工具,旨在将 AI 编程助手升级为主动式的项目经理。它通过“上下文驱动开发”理念,强制规范软件开发的生命周期:先明确需求与规划,再编写代码,从而践行“三思而后行”的原则。
传统 AI 编程往往直接生成代码,容易导致风格不一、偏离产品目标或产生难以维护的“技术债”。Conductor 解决了这一痛点,它要求用户在编码前定义清晰的产品背景、技术栈偏好及工作流规范,并将这些信息作为持久化的项目资产。无论是新功能开发还是旧项目重构,Conductor 都能确保 AI 始终在统一的上下文中工作,输出高质量且一致的代码。
这款工具非常适合希望提升工程规范性的软件开发者及技术团队使用。其独特亮点在于引入了“轨道(Track)”概念来管理任务单元,支持在编码前审查详细的规格书与执行计划,让用户牢牢掌握控制权。此外,它还具备智能回滚功能,能基于逻辑任务而非简单的提交哈希进行版本还原,极大提升了迭代安全性。通过 Conductor,团队可以将仓库转化为单一事实来源,让 AI 真正理解并遵循项目的深层逻辑。
使用场景
某初创团队的后端工程师需要在现有的电商系统中紧急开发“会员积分抵扣”功能,且必须严格遵循团队既定的代码规范和数据库设计。
没有 conductor 时
- 需求理解偏差:AI 直接生成代码,常忽略团队特有的“积分过期策略”或数据库字段命名规范,导致返工。
- 缺乏规划步骤:遇到复杂逻辑时,AI 倾向于一次性输出大量代码,一旦方向错误,整段代码需全部推翻重写。
- 上下文丢失:每次新对话都需重新粘贴技术栈要求和风格指南,效率低下且容易遗漏关键约束。
- 协作困难:生成的代码缺乏统一的任务追踪记录,其他成员难以快速理解该功能的实现路径和待办事项。
使用 conductor 后
- 规范自动内化:通过
/conductor:setup预先定义产品目标与技术栈,conductor 确保所有生成代码天然符合团队的命名与架构标准。 - 先规划后编码:执行
/conductor:newTrack后,conductor 强制先生成详细的spec.md和plan.md,开发者确认逻辑无误后才开始实施。 - 持久化上下文:conductor 将项目背景作为持久工件管理,AI 在后续所有交互中都能自动调用深层项目认知,无需重复提示。
- 任务清晰可溯:生成的计划文件将大功能拆解为具体阶段和子任务,进度实时同步至
tracks.md,团队成员可随时审查当前状态。
conductor 通过将“上下文驱动开发”流程化,把 AI 从单纯的代码生成器转变为懂规划、守规范的专业项目合伙人。
运行环境要求
- 未说明 (依赖 Gemini CLI 宿主环境)
未说明 (作为 CLI 扩展运行,具体取决于调用的底层模型服务)
未说明

快速开始
Gemini CLI 的 Conductor 扩展
三思而后行,一次编码到位。
Conductor 是一个 Gemini CLI 扩展,支持 上下文驱动开发。它将 Gemini CLI 变成一位主动的项目经理,遵循严格的流程来明确需求、制定计划并实现软件功能与缺陷修复。
Conductor 不仅仅编写代码,它还确保每个任务都经历一致且高质量的生命周期:上下文 -> 规格与计划 -> 实现。
Conductor 的理念很简单:掌控你的代码。通过将上下文视为与代码同等重要的受管工件,你可以把代码仓库变成单一的事实来源,从而在每次与 AI 交互时都能保持对项目的深度和持久认知。
功能特性
- 先规划再构建:为新项目和现有代码库创建指导 AI 行动的规格和计划。
- 维护上下文:确保 AI 遵循代码风格指南、技术栈选择和产品目标。
- 安全迭代:在编写代码之前审查计划,让你始终掌握主动权。
- 团队协作:为你的产品、技术栈和工作流偏好设置项目级上下文,使其成为团队共享的基础。
- 基于现有项目构建:智能初始化适用于全新项目(Greenfield)和已有项目(Brownfield)。
- 智能回滚:具备 Git 感知能力的回滚命令,能够理解逻辑工作单元(轨道、阶段、任务),而不仅仅是提交哈希值。
安装
从终端运行以下命令即可安装 Conductor 扩展:
gemini extensions install https://github.com/gemini-cli-extensions/conductor --auto-update
--auto-update 是可选参数:如果指定,将在新版本发布时自动更新。
使用方法
Conductor 旨在管理开发任务的完整生命周期。
关于 Token 消耗的说明:Conductor 的上下文驱动方法需要读取和分析项目的上下文、规格和计划。这可能导致 Token 消耗增加,尤其是在大型项目或进行大量规划和实施阶段时。你可以在当前会话中通过运行 /stats model 来查看 Token 消耗情况。
1. 设置项目(仅需执行一次)
当你运行 /conductor:setup 时,Conductor 会帮助你定义项目上下文的核心组成部分。这些上下文随后会被你或团队中的任何成员用于构建新的组件或功能。
- 产品:定义项目上下文(例如用户、产品目标、高层次功能)。
- 产品指南:定义标准(例如文案风格、品牌信息、视觉识别)。
- 技术栈:配置技术偏好(例如编程语言、数据库、框架)。
- 工作流:设定团队偏好(例如 TDD、提交策略)。使用 workflow.md 作为可定制模板。
生成的工件:
conductor/product.mdconductor/product-guidelines.mdconductor/tech-stack.mdconductor/workflow.mdconductor/code_styleguides/conductor/tracks.md
/conductor:setup
2. 开始新轨道(功能或 Bug)
当你准备好处理新功能或 Bug 修复时,运行 /conductor:newTrack。这将初始化一个 轨道——一个高层次的工作单元。Conductor 会帮助你生成两个关键工件:
- 规格:针对具体任务的详细需求。我们要构建什么?为什么?
- 计划:包含阶段、任务和子任务的可执行待办清单。
生成的工件:
conductor/tracks/<track_id>/spec.mdconductor/tracks/<track_id>/plan.mdconductor/tracks/<track_id>/metadata.json
/conductor:newTrack
# 或者附带描述
/conductor:newTrack "在设置页面添加暗模式切换"
3. 实现轨道
一旦你批准了计划,就运行 /conductor:implement。你的编码代理会按照 plan.md 文件逐步执行任务,并在完成时逐一勾选。
更新的工件:
conductor/tracks.md(状态更新)conductor/tracks/<track_id>/plan.md(状态更新)- 项目上下文文件(完成后同步)
/conductor:implement
Conductor 将执行以下步骤:
- 选择下一个待处理的任务。
- 按照定义的工作流执行(例如 TDD:编写测试 -> 失败 -> 实现 -> 通过)。
- 在进展过程中更新计划中的状态。
- 验证进度:在每个阶段结束时引导你进行手动验证,以确保一切按预期工作。
在实施过程中,你还可以:
检查状态:获取项目整体进展的概览。
/conductor:status回滚工作:如有需要,可以撤销某个功能或特定任务。
/conductor:revert审查工作:根据指南和计划审查已完成的工作。
/conductor:review
命令参考
| 命令 | 描述 | 生成的工件 |
|---|---|---|
/conductor:setup |
搭建项目框架并设置 Conductor 环境。每个项目只需执行一次。 | conductor/product.mdconductor/product-guidelines.mdconductor/tech-stack.mdconductor/workflow.mdconductor/tracks.md |
/conductor:newTrack |
启动一个新的功能或 Bug 轨道。生成 spec.md 和 plan.md。 |
conductor/tracks/<id>/spec.mdconductor/tracks/<id>/plan.mdconductor/tracks.md |
/conductor:implement |
执行当前轨道计划中定义的任务。 | conductor/tracks.mdconductor/tracks/<id>/plan.md |
/conductor:status |
显示 tracks 文件及当前活动轨道的进度。 | 读取 conductor/tracks.md |
/conductor:revert |
通过分析 Git 历史记录回滚整个轨道、某个阶段或任务。 | 回滚 Git 历史 |
/conductor:review |
根据指南和计划审查已完成的工作。 | 读取 plan.md、product-guidelines.md |
资源
- Gemini CLI 扩展文档:关于在 Gemini CLI 中使用扩展的文档
- GitHub 问题列表:报告 Bug 或请求功能
法律声明
版本历史
conductor-v0.4.12026/03/11conductor-v0.4.02026/03/11conductor-v0.3.12026/02/19conductor-v0.3.02026/02/12conductor-v0.2.02026/01/14v0.1.12025/12/22v0.1.02025/12/18常见问题
相似工具推荐
opencode
OpenCode 是一款开源的 AI 编程助手(Coding Agent),旨在像一位智能搭档一样融入您的开发流程。它不仅仅是一个代码补全插件,而是一个能够理解项目上下文、自主规划任务并执行复杂编码操作的智能体。无论是生成全新功能、重构现有代码,还是排查难以定位的 Bug,OpenCode 都能通过自然语言交互高效完成,显著减少开发者在重复性劳动和上下文切换上的时间消耗。 这款工具专为软件开发者、工程师及技术研究人员设计,特别适合希望利用大模型能力来提升编码效率、加速原型开发或处理遗留代码维护的专业人群。其核心亮点在于完全开源的架构,这意味着用户可以审查代码逻辑、自定义行为策略,甚至私有化部署以保障数据安全,彻底打破了传统闭源 AI 助手的“黑盒”限制。 在技术体验上,OpenCode 提供了灵活的终端界面(Terminal UI)和正在测试中的桌面应用程序,支持 macOS、Windows 及 Linux 全平台。它兼容多种包管理工具,安装便捷,并能无缝集成到现有的开发环境中。无论您是追求极致控制权的资深极客,还是渴望提升产出的独立开发者,OpenCode 都提供了一个透明、可信
gemini-cli
gemini-cli 是一款由谷歌推出的开源 AI 命令行工具,它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言,它提供了一条从输入提示词到获取模型响应的最短路径,无需切换窗口即可享受智能辅助。 这款工具主要解决了开发过程中频繁上下文切换的痛点,让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用,还是执行复杂的 Git 操作,gemini-cli 都能通过自然语言指令高效处理。 它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口,具备出色的逻辑推理能力;内置 Google 搜索、文件操作及 Shell 命令执行等实用工具;更独特的是,它支持 MCP(模型上下文协议),允许用户灵活扩展自定义集成,连接如图像生成等外部能力。此外,个人谷歌账号即可享受免费的额度支持,且项目基于 Apache 2.0 协议完全开源,是提升终端工作效率的理想助手。
markitdown
MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具,专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片(含 OCR)、音频(含语音转录)、HTML 乃至 YouTube 链接等多种格式的解析,能够精准提取文档中的标题、列表、表格和链接等关键结构信息。 在人工智能应用日益普及的今天,大语言模型(LLM)虽擅长处理文本,却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点,它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式,成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外,它还提供了 MCP(模型上下文协议)服务器,可无缝集成到 Claude Desktop 等 LLM 应用中。 这款工具特别适合开发者、数据科学家及 AI 研究人员使用,尤其是那些需要构建文档检索增强生成(RAG)系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性,但其核心优势在于为机器
ML-For-Beginners
ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程,旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周,包含 26 节精炼课程和 52 道配套测验,内容涵盖从基础概念到实际应用的完整流程,有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。 无论是希望转型的开发者、需要补充算法背景的研究人员,还是对人工智能充满好奇的普通爱好者,都能从中受益。课程不仅提供了清晰的理论讲解,还强调动手实践,让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持,通过自动化机制提供了包括简体中文在内的 50 多种语言版本,极大地降低了全球不同背景用户的学习门槛。此外,项目采用开源协作模式,社区活跃且内容持续更新,确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路,ML-For-Beginners 将是理想的起点。
gstack
gstack 是 Y Combinator CEO Garry Tan 亲自开源的一套 AI 工程化配置,旨在将 Claude Code 升级为你的虚拟工程团队。面对单人开发难以兼顾产品战略、架构设计、代码审查及质量测试的挑战,gstack 提供了一套标准化解决方案,帮助开发者实现堪比二十人团队的高效产出。 这套配置特别适合希望提升交付效率的创始人、技术负责人,以及初次尝试 Claude Code 的开发者。gstack 的核心亮点在于内置了 15 个具有明确职责的 AI 角色工具,涵盖 CEO、设计师、工程经理、QA 等职能。用户只需通过简单的斜杠命令(如 `/review` 进行代码审查、`/qa` 执行测试、`/plan-ceo-review` 规划功能),即可自动化处理从需求分析到部署上线的全链路任务。 所有操作基于 Markdown 和斜杠命令,无需复杂配置,完全免费且遵循 MIT 协议。gstack 不仅是一套工具集,更是一种现代化的软件工厂实践,让单人开发者也能拥有严谨的工程流程。
codex
Codex 是 OpenAI 推出的一款轻量级编程智能体,专为在终端环境中高效运行而设计。它允许开发者直接在命令行界面与 AI 交互,完成代码生成、调试、重构及项目维护等任务,无需频繁切换至浏览器或集成开发环境,从而显著提升了编码流程的连贯性与专注度。 这款工具主要解决了传统 AI 辅助编程中上下文割裂的问题。通过将智能体本地化运行,Codex 能够更紧密地结合当前工作目录的文件结构,提供更具针对性的代码建议,同时支持以自然语言指令驱动复杂的开发操作,让“对话即编码”成为现实。 Codex 非常适合习惯使用命令行的软件工程师、全栈开发者以及技术研究人员。对于追求极致效率、偏好键盘操作胜过图形界面的极客用户而言,它更是理想的结对编程伙伴。 其独特亮点在于灵活的部署方式:既可作为全局命令行工具通过 npm 或 Homebrew 一键安装,也能无缝对接现有的 ChatGPT 订阅计划(如 Plus 或 Pro),直接复用账户权益。此外,它还提供了从纯文本终端到桌面应用的多形态体验,并支持基于 API 密钥的深度定制,充分满足不同场景下的开发需求。