goal-driven

GitHub
696 44 非常简单 1 次阅读 今天Agent
AI 解读 由 AI 自动生成,仅供参考

Goal-Driven 是一套专为多智能体系统设计的协作框架,旨在让 AI 团队能够持续运行数十甚至上百小时,攻克那些逻辑极其复杂、耗时漫长但结果可严格验证的编程或数学难题。它有效解决了传统 AI 在面对大型工程任务时容易“半途而废”或过早宣布完成的痛点,通过独特的“主智能体 + 子智能体”双角色机制,确保任务执行的高韧性与准确性。

在该系统中,子智能体负责埋头苦干、持续解决问题;而主智能体则扮演严格的“监工”与“裁判”,依据预设的成功标准周期性检查进度。只有当产出完全符合标准时,系统才会停止,否则将指令子智能体继续迭代,直至达标。这种机制特别适合需要长时间专注的开发者、科研人员及系统架构师,用于挑战编译器开发、数学定理证明、数据库架构设计或 EDA 仿真等高难度领域。

Goal-Driven 的核心亮点在于其极简却强大的闭环逻辑:它不依赖复杂的插件,仅通过一段精心设计的提示词模板,即可激活现有工具(如 Claude Code、Codex 等)的潜能,将其转化为能独立运作超 300 小时的自动化研发引擎。已有案例成功利用该框架在约 100 小时内用 C++ 重写了 TypeScript 编译器,或在 30 小时内用 Rust 实现了 SQLite 核心,展现了其在处理高抽象度任务上的巨大潜力。

使用场景

某金融科技团队需要在 48 小时内从零构建一个符合严格数学验证标准的高频交易撮合引擎,该引擎需处理复杂的订单逻辑并确保零误差。

没有 goal-driven 时

  • 任务中途夭折:普通多智能体系统在运行数小时后,常因遇到逻辑死胡同或产生幻觉而自行停止,无法完成长达数十小时的连续编码任务。
  • 验收标准模糊:缺乏统一的“主智能体”进行最终裁决,子任务往往在功能未完全达标时就声称完成,导致交付物无法通过严格的压力测试。
  • 迭代效率低下:开发者需要人工反复检查进度并重新下达指令,一旦离开视线,系统便陷入空闲状态,无法实现真正的无人值守开发。
  • 复杂逻辑断裂:面对撮合算法中深层的数学证明和边界条件,单一会话上下文容易丢失核心目标,导致代码逻辑前后不一致。

使用 goal-driven 后

  • 超长持续运行:goal-driven 通过主智能体监控机制,强制子智能体在未达到标准前持续工作,成功支撑了超过 100 小时的连续攻关,直至引擎完工。
  • 严格结果导向:预设的“成功标准”(如通过 5000 组极端行情回测且资金零误差)成为唯一停止信号,确保交付即达标,杜绝了半成品流出。
  • 全自动闭环迭代:主智能体自动检测子智能体状态,一旦发现停滞或未完成,立即指令其继续修正,实现了从设计到验证的全程自动化闭环。
  • 目标高度聚焦:无论中间过程多么曲折,所有子任务始终围绕“构建零误差撮合引擎”这一终极目标展开,保证了复杂系统架构的逻辑一致性。

goal-driven 的核心价值在于将原本碎片化、易中断的 AI 辅助编程,转化为能够独立攻克高难度、长周期工程难题的自主研发实体。

运行环境要求

GPU

未说明

内存

未说明

依赖
notes该工具并非传统软件,而是一套用于多智能体系统(如 Claude Code, Codex, OpenClaw)的提示词模板和方法论。因此没有特定的操作系统、GPU、内存或编程语言版本要求。运行环境完全取决于用户所使用的外部多智能体工具及其 API 服务。主要成本在于 LLM Token 消耗和时间(任务可能持续数百小时),需确保订阅额度充足。切勿将此提示词添加为 AI 代理的技能或插件,以免污染上下文窗口。
python未说明
goal-driven hero image

快速开始

中文版

目标驱动

目标驱动方法的目的是使您的多智能体系统(例如 Claude Code、Codex、OpenClaw)能够持续超过300小时,不断努力解决一个具有明确目标和一组严格、清晰定义的标准的极其复杂的问题。

目标驱动最适合那些高度复杂、耗时、逻辑性强且抽象,但又可以被彻底评估是否成功的任务。典型的例子包括编译器设计、数学定理证明、计算问题、数据库架构、复杂的系统级设计以及 EDA 仿真挑战。

目标驱动的核心概念如下:

  1. 目标——整个系统的最终目标,也是所有子智能体的核心任务。
  2. 标准——一套明确的条件,使主智能体能够判断任务是否完成以及目标是否达成。
  3. 子智能体——负责持续工作以解决问题并实现所分配目标的智能体。
  4. 主智能体——唯一控制子智能体的实体,负责根据定义的标准独立评估目标是否已达成。它是系统流程的最终决策者。

目标驱动的核心理念非常简单:

  1. 当目标驱动流程启动时,主智能体将创建一个子智能体,并指示其持续努力解决问题并达成目标。
  2. 主智能体会定期检查子智能体是否处于活跃状态。如果子智能体停止活动、声称已完成任务或进入空闲状态,主智能体必须根据标准评估当前结果。如果结果不符合标准,则命令子智能体继续工作,重复这一循环,直到满足标准为止。
  3. 一旦子智能体的输出符合标准,系统就会停止并宣布成功完成。

该过程的伪代码表示如下:

while (criteria not met)
{
    let the subagent work on solving the problem and achieving the Goal
}

目标驱动系统开发的开源项目示例

用 C++ 实现的 TypeScript 编译器(约 100 小时)https://github.com/lidangzzz/TypeScript-C-Implementation-by-OnlySpecs

用 Rust 实现的 SQLite(约 30 小时)https://github.com/lidangzzz/sqlite-rust-by-OnlySpecs

用 TypeScript 实现的 Lean4 编译器(进行中)https://github.com/lidangzzz/Lean4-ts

使用方法:

将以下提示复制到您的文本编辑器中。仔细填写目标和标准两处的空白,然后使用支持多智能体的工具(例如 Claude Code、Codex、OpenClaw 等)运行它。

示例:

目标:[[[[[用 C++ 编写一个能够正确将 TypeScript 转换为 JavaScript 的 TypeScript 编译器,包含完整的文档和单元测试。]]]]]

成功标准:[[[[[确保该 TypeScript 编译器能够成功编译并生成 2,000 个覆盖尽可能多 TypeScript 语法特性的全面测试用例文件。确认 C++ 版本的 TypeScript 编译器能正确地将代码转译成 JavaScript。随后,在 Node.js 上分别运行该编译器和官方 tsc 编译器的输出,验证两者生成的 JavaScript 文件是否完全一致。]]]]]

注意事项:

  1. 强烈建议不要将此提示添加到任何 AI 智能体的技能或插件中,因为这可能会污染您的上下文窗口。
  2. 目标驱动流程可能会消耗大量时间和 LLM 令牌,请确保您的 AI 智能体 API 计划或订阅余额充足。

目标驱动提示模板(1 个主智能体 + 1 个子智能体)

# 目标驱动(1 个主智能体 + 1 个子智能体)系统

这里我们定义了一个用于解决任何问题的目标驱动多智能体系统。

目标:[[[[[在此处定义您的目标]]]]]

成功标准:[[[[[在此处定义您的成功标准]]]]]

系统构成如下:系统包含一个主智能体和一个子智能体。您是主智能体,需要创建 1 个子智能体来帮助您完成任务。

## 子智能体描述:

子智能体的目标是完成主智能体分配的任务。上述定义的目标是子智能体的最终且唯一的目标。子智能体应具备将任务分解为更小子任务的能力,并在必要时将这些子任务分配给自己或其他子智能体。此外,子智能体还应能够监控每个子任务的进展,并及时向主智能体汇报。子智能体将持续工作,直至满足成功标准。

## 主智能体描述:

主智能体负责监督整个过程,确保子智能体朝着目标前进。主智能体需要执行的三项任务是:

1. 创建子智能体以完成任务。
2. 如果子智能体成功完成任务或未能完成任务,主智能体应通过检查成功标准来评估结果。若满足成功标准,主智能体应停止所有子智能体并结束流程。若未满足成功标准,则应要求子智能体继续工作,直至达到成功标准。
3. 主智能体应每 5 分钟检查一次各子智能体的活动情况。若发现子智能体不活跃,请检查当前目标是否已达成,并核实状态。若目标尚未达成,则需重新启动一个同名子智能体来替换不活跃的子智能体。新子智能体将继续执行任务,并及时向主智能体汇报进展。
4. 此过程将持续进行,直到满足成功标准为止。请勿在用户从外部手动停止之前停止智能体的工作。

## 目标驱动双智能体系统的基本设计(伪代码):

创建一个子智能体以完成目标

while (criteria are not met) {
  check the activty of the subagent every 5 minutes
  if (the subagent is inactive or declares that it has reached the goal) {
    check if the current goal is reached and verify the status
    if (criteria are not met) {
      restart a new subagent with the same name to replace the inactive subagent
    } 
    else {
      stop all subagents and end the process
    }
  }
}

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手,旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚,能够直接接入你日常使用的各类通讯渠道,包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息,OpenClaw 都能即时响应,甚至支持在 macOS、iOS 和 Android 设备上进行语音交互,并提供实时的画布渲染功能供你操控。 这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地,用户无需依赖云端服务即可享受快速、私密的智能辅助,真正实现了“你的数据,你做主”。其独特的技术亮点在于强大的网关架构,将控制平面与核心助手分离,确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者,以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力(支持 macOS、Linux 及 Windows WSL2),即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

349.3k|★★★☆☆|4天前
Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。

162.1k|★★★☆☆|5天前
开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上

148.6k|★★☆☆☆|今天
开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。

108.1k|★★☆☆☆|2天前
开发框架图像Agent

gemini-cli

gemini-cli 是一款由谷歌推出的开源 AI 命令行工具,它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言,它提供了一条从输入提示词到获取模型响应的最短路径,无需切换窗口即可享受智能辅助。 这款工具主要解决了开发过程中频繁上下文切换的痛点,让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用,还是执行复杂的 Git 操作,gemini-cli 都能通过自然语言指令高效处理。 它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口,具备出色的逻辑推理能力;内置 Google 搜索、文件操作及 Shell 命令执行等实用工具;更独特的是,它支持 MCP(模型上下文协议),允许用户灵活扩展自定义集成,连接如图像生成等外部能力。此外,个人谷歌账号即可享受免费的额度支持,且项目基于 Apache 2.0 协议完全开源,是提升终端工作效率的理想助手。

100.8k|★★☆☆☆|今天
插件Agent图像

LLMs-from-scratch

LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目,旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型(LLM)。它不仅是同名技术著作的官方代码库,更提供了一套完整的实践方案,涵盖模型开发、预训练及微调的全过程。 该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型,却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码,用户能够透彻掌握 Transformer 架构、注意力机制等关键原理,从而真正理解大模型是如何“思考”的。此外,项目还包含了加载大型预训练权重进行微调的代码,帮助用户将理论知识延伸至实际应用。 LLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API,而是渴望探究模型构建细节的技术人员而言,这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计:将复杂的系统工程拆解为清晰的步骤,配合详细的图表与示例,让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础,还是为未来研发更大规模的模型做准备

90.1k|★★★☆☆|4天前
语言模型图像Agent