takt
takt 是一款专为 AI 编程助手设计的开源协调框架,旨在通过 YAML 配置文件定义智能体的工作流、审查机制及人工干预节点。它解决了当前 AI 编码工具往往只追求“生成代码”而忽视“代码质量”的痛点,通过内置的架构审查、安全检测和反模式识别,确保输出成果符合高标准。
takt 特别适合需要频繁使用 Claude Code、Cursor、GitHub Copilot 等工具进行日常开发的专业开发者。其核心理念是将音乐指挥中的“节拍”概念引入软件工程,让多个具备不同角色(如实施者、审查者)的 AI 智能体像乐团一样协同工作。
该工具的独特亮点在于“声明式工作流”与“分面提示(Faceted Prompting)”技术。用户只需通过自然对话明确需求并排队任务,takt 即可自动在隔离的工作树中执行“规划 - 实现 - 多轮审查 - 修复”的完整闭环,并支持自动生成拉取请求。所有执行路径均记录在案,不仅保证了结果的可复现性,还让团队间共享高质量的开发流程变得简单高效,真正实现了从“能跑就行”到“生产级代码”的跨越。
使用场景
某电商初创团队的后端工程师正急需为订单系统集成复杂的 JWT 身份验证模块,同时必须确保代码符合严格的安全审计标准。
没有 takt 时
- 人工协调成本高:开发者需手动在多个 AI 会话间切换,分别让一个 Agent 写代码、另一个做安全审查,容易遗漏关键步骤或产生上下文断层。
- 代码质量不稳定:缺乏标准化的审查循环,AI 生成的代码常包含硬编码密钥或逻辑漏洞,往往要等到人工 Code Review 甚至上线后才被发现。
- 环境污染风险大:直接在主分支尝试不同方案,一旦 AI 生成错误代码,不仅污染工作区,回滚和清理现场还耗费大量时间。
- 流程不可复用:资深员工摸索出的“提示词 + 审查”最佳实践难以固化,新成员无法直接复用这套高质量的生产流程。
使用 takt 后
- 自动化编排协作:通过 YAML 定义工作流,takt 自动调度不同角色的 Agent(如“实现者”与“安全审计员”)按顺序执行编码、审查及修复循环,无需人工干预衔接。
- 内置质量护栏:利用内置的架构与安全反模式检查规则,takt 强制代码在生成阶段就通过多轮自我修正,确保交付即达标。
- 隔离执行环境:takt 为每个任务自动创建独立的 Git Worktree 运行全流程,失败不影响主分支,成功后再合并,彻底杜绝环境污染。
- 流程资产化:将验证过的协作拓扑保存为配置文件,团队成员只需一条命令即可复用相同的严谨开发流程,保证产出一致性。
takt 将原本依赖个人经验的松散 AI 协作,转化为可复制、带护栏且自动闭环的工业化代码生产流水线。
运行环境要求
- 未说明
不需要 GPU
未说明

快速开始
TAKT
🇯🇵 日文文档 | 💬 Discord 社区
TAKT Agent Koordination Topology — 为你的 AI 编码代理提供结构化的评审循环、管理型提示和安全约束——让它们交付高质量代码,而不仅仅是代码。
TAKT 通过 YAML 定义的工作流,并内置评审周期,来运行 AI 代理(Claude Code、Codex、OpenCode、Cursor、GitHub Copilot CLI)。你只需与 AI 沟通以定义需求、排队任务,然后让 TAKT 处理执行过程——包括规划、实现、多阶段评审以及修复循环——所有这些都由声明式的工作流文件来控制。
TAKT 是用 TAKT 自身构建的(自用)。
为什么选择 TAKT
开箱即用 — 架构、安全性和 AI 反模式评审标准已内建。从第一天起就能交付符合质量标准的代码。
实用 — 这是一款用于日常开发的工具,而非演示工具。你可以与 AI 沟通以细化需求、排队任务并执行它们。在任务执行时会隔离工作树,在失败时会创建 PR 并重试。
可复现 — 执行路径在 YAML 中声明,确保结果一致。工作流可以共享——一个团队成员构建的工作流可以被其他任何人使用,以运行相同的高质量流程。每一步都会以 NDJSON 格式记录,从而实现从任务到 PR 的完整可追溯性。
多代理 — 协调多个具有不同角色、权限和评审标准的代理。运行并行评审者,将失败的任务路由回实施者,并通过声明式规则聚合结果。提示被管理为独立的方面(角色、策略、知识、指令),可以在不同的工作流中自由组合(分面提示)。
要求
选择其中之一:
- 提供商 CLI:安装了 Claude Code(默认
claude提供商)、Codex、OpenCode、Cursor Agent 或 GitHub Copilot CLI - 直接 API:OpenAI / OpenCode API 密钥(无需 CLI)
可选:
- GitHub CLI (
gh) — 用于takt #N(GitHub Issue 任务) - GitLab CLI (
glab) — 用于 GitLab Issue/MR 集成(根据远程 URL 自动检测)
OAuth 和 API 密钥的使用:是否允许使用 OAuth 或 API 密钥访问因提供商和使用场景而异。在使用 TAKT 之前,请查看各提供商的服务条款。
快速开始
安装
npm install -g takt
与 AI 沟通并排队任务
$ takt
选择工作流:
❯ 🎼 default (当前)
📁 🚀 快速开始/
📁 🎨 前端/
📁 ⚙️ 后端/
> 使用 JWT 添加用户认证
[AI 清晰化需求并组织任务]
> /go
提议的任务:
...
您想做什么?
立即执行
创建 GitHub Issue
❯ 排队为任务 # ← 正常流程
继续对话
选择“排队为任务”会将任务保存到 .takt/tasks/。运行 takt run 来执行——TAKT 会创建一个隔离的工作树,运行工作流(计划 → 实现 → 评审 → 修复循环),并在完成后提供创建 PR 的选项。
# 执行排队的任务
takt run
# 也可以从 GitHub Issues 排队
takt add #6
takt add #12
# 执行所有待处理的任务
takt run
“立即执行” 会直接在当前目录中运行工作流,而不进行工作树隔离。这适用于快速实验,但请注意,更改会直接进入你的工作树。
管理结果
# 列出任务分支 — 合并、重试、强制失败或删除
takt list
工作原理
TAKT 使用音乐隐喻——其名称源自德语中的“节拍”或“指挥棒一挥”,用于指挥乐团保持节奏。TAKT 在面向用户和面向实现的术语中始终如一地使用“工作流”和“步骤”。
工作流由一系列步骤定义。使用 steps、initial_step 和 max_steps。每个步骤指定角色(谁)、权限(允许什么)和规则(接下来发生什么)。以下是一个最小示例:
name: plan-implement-review
initial_step: plan
max_steps: 10
steps:
- name: plan
persona: planner
edit: false
rules:
- condition: Planning complete
next: implement
- name: implement
persona: coder
edit: true
required_permission_mode: edit
rules:
- condition: Implementation complete
next: review
- name: review
persona: reviewer
edit: false
rules:
- condition: Approved
next: COMPLETE
- condition: Needs fix
next: implement # ← fix loop
规则决定下一步。COMPLETE 成功结束工作流,ABORT 则以失败结束。请参阅 工作流指南 以了解完整的模式、并行步骤和规则条件类型。
工作流文件位于 workflows/ 目录中,这是官方目录名称。
当同一工作流名称存在于多个位置时,TAKT 按照以下顺序解析:.takt/workflows/ → ~/.takt/workflows/ → 内置。
推荐的工作流
| 工作流 | 使用场景 |
|---|---|
default |
标准开发。测试优先,包含 AI 反模式评审和并行评审(架构 + 主管)。 |
frontend-mini |
面向前端的迷你配置。 |
backend-mini |
面向后端的迷你配置。 |
dual-mini |
面向前端和后端的迷你配置。 |
请参阅 内置目录 以获取所有工作流和角色。
关键命令
| 命令 | 描述 |
|---|---|
takt |
与 AI 沟通,细化需求,执行或排队任务 |
takt run |
执行所有待处理的任务 |
takt list |
管理任务分支(合并、重试、强制失败、指示、删除) |
takt #N |
将 GitHub Issue 作为任务执行 |
takt eject |
复制内置工作流/方面以进行定制 |
takt workflow init |
创建新的工作流框架 |
takt workflow doctor |
验证工作流定义 |
takt repertoire add |
从 GitHub 安装曲目包 |
请参阅 CLI 参考 以获取所有命令和选项。
配置
最小的 ~/.takt/config.yaml:
provider: claude # claude, claude-sdk, codex, opencode, cursor, or copilot
model: sonnet # 直接传递给提供商
language: en # en 或 ja
或者直接使用 API 密钥(无需安装 Claude、Codex、OpenCode 的 CLI):
export TAKT_ANTHROPIC_API_KEY=sk-ant-... # Anthropic (Claude)
export TAKT_OPENAI_API_KEY=sk-... # OpenAI (Codex)
export TAKT_OPENCODE_API_KEY=... # OpenCode
export TAKT_CURSOR_API_KEY=... # Cursor Agent (如果已登录则可选)
export TAKT_COPILOT_GITHUB_TOKEN=ghp_... # GitHub Copilot CLI
请参阅 配置指南 以了解所有选项、提供商配置文件和模型解析。
自定义
自定义工作流
takt workflow init my-flow # 创建一个新的工作流框架
takt workflow doctor my-flow # 验证工作流定义
takt eject default # 将内置工作流复制到 ~/.takt/workflows/ 并进行编辑
自定义角色
在 ~/.takt/personas/ 目录下创建一个 Markdown 文件:
# ~/.takt/personas/my-reviewer.md
你是一位专注于安全性的代码评审员。
在你的工作流中引用它:persona: my-reviewer
CI/CD
TAKT 提供了用于 GitHub Actions 的 takt-action:
- uses: nrslib/takt-action@main
with:
anthropic_api_key: ${{ secrets.TAKT_ANTHROPIC_API_KEY }}
github_token: ${{ secrets.GITHUB_TOKEN }}
对于其他 CI 系统,可以使用流水线模式:
takt --pipeline --task "修复 bug" --auto-pr
完整的设置说明请参阅 CI/CD 指南。
项目结构
~/.takt/ # 全局配置
├── config.yaml # 提供者、模型、语言等
├── workflows/ # 用户自定义的工作流定义
├── facets/ # 用户自定义的方面(角色、策略、知识等)
└── repertoire/ # 已安装的资源包
.takt/ # 项目级
├── config.yaml # 项目配置
├── workflows/ # 项目特定的工作流覆盖
├── facets/ # 项目特定的方面
├── tasks.yaml # 待处理的任务
├── tasks/ # 任务规范
└── runs/ # 执行报告、日志、上下文
工作流定义存储在 workflows/ 目录下。
API 使用
import { WorkflowEngine, loadWorkflow } from 'takt';
const config = loadWorkflow('default', process.cwd());
if (!config) throw new Error('未找到工作流');
const engine = new WorkflowEngine(config, process.cwd(), '我的任务');
await engine.run();
文档
| 文档 | 描述 |
|---|---|
| CLI 参考 | 所有命令和选项 |
| 配置 | 全局和项目设置 |
| 工作流指南 | 创建和自定义工作流 |
| 代理指南 | 自定义代理配置 |
| 内置目录 | 所有内置工作流和角色 |
| 面向方面的提示 | 提示设计方法论 |
| 资源包 | 安装和共享资源包 |
| 任务管理 | 任务队列、执行、隔离 |
| 数据流 | 内部数据流和架构图 |
| CI/CD 集成 | GitHub Actions 和流水线模式 |
| 提供商沙盒与权限 | Codex / OpenCode / Claude 的沙盒、权限模式和网络访问 |
| 变更日志 (日语) | 版本历史 |
| 安全策略 | 漏洞报告 |
社区
加入 TAKT Discord,获取问题解答、讨论和最新动态。
贡献
详情请参阅 CONTRIBUTING.md。
许可证
MIT — 详情请参阅 LICENSE。
常见问题
相似工具推荐
openclaw
OpenClaw 是一款专为个人打造的本地化 AI 助手,旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚,能够直接接入你日常使用的各类通讯渠道,包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息,OpenClaw 都能即时响应,甚至支持在 macOS、iOS 和 Android 设备上进行语音交互,并提供实时的画布渲染功能供你操控。 这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地,用户无需依赖云端服务即可享受快速、私密的智能辅助,真正实现了“你的数据,你做主”。其独特的技术亮点在于强大的网关架构,将控制平面与核心助手分离,确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者,以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力(支持 macOS、Linux 及 Windows WSL2),即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你
stable-diffusion-webui
stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。
everything-claude-code
everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上
opencode
OpenCode 是一款开源的 AI 编程助手(Coding Agent),旨在像一位智能搭档一样融入您的开发流程。它不仅仅是一个代码补全插件,而是一个能够理解项目上下文、自主规划任务并执行复杂编码操作的智能体。无论是生成全新功能、重构现有代码,还是排查难以定位的 Bug,OpenCode 都能通过自然语言交互高效完成,显著减少开发者在重复性劳动和上下文切换上的时间消耗。 这款工具专为软件开发者、工程师及技术研究人员设计,特别适合希望利用大模型能力来提升编码效率、加速原型开发或处理遗留代码维护的专业人群。其核心亮点在于完全开源的架构,这意味着用户可以审查代码逻辑、自定义行为策略,甚至私有化部署以保障数据安全,彻底打破了传统闭源 AI 助手的“黑盒”限制。 在技术体验上,OpenCode 提供了灵活的终端界面(Terminal UI)和正在测试中的桌面应用程序,支持 macOS、Windows 及 Linux 全平台。它兼容多种包管理工具,安装便捷,并能无缝集成到现有的开发环境中。无论您是追求极致控制权的资深极客,还是渴望提升产出的独立开发者,OpenCode 都提供了一个透明、可信
ComfyUI
ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。
gemini-cli
gemini-cli 是一款由谷歌推出的开源 AI 命令行工具,它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言,它提供了一条从输入提示词到获取模型响应的最短路径,无需切换窗口即可享受智能辅助。 这款工具主要解决了开发过程中频繁上下文切换的痛点,让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用,还是执行复杂的 Git 操作,gemini-cli 都能通过自然语言指令高效处理。 它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口,具备出色的逻辑推理能力;内置 Google 搜索、文件操作及 Shell 命令执行等实用工具;更独特的是,它支持 MCP(模型上下文协议),允许用户灵活扩展自定义集成,连接如图像生成等外部能力。此外,个人谷歌账号即可享受免费的额度支持,且项目基于 Apache 2.0 协议完全开源,是提升终端工作效率的理想助手。