DeepResearchAgent

3.3k 436 简单 1 次阅读今天MITAgent

AI 解读由 AI 自动生成，仅供参考

DeepResearchAgent 是一个基于分层多智能体架构的开源框架，不仅擅长处理深度研究任务，也能胜任各类通用复杂问题的解决。它通过顶层规划智能体协调多个专用下层智能体，实现任务的自动拆解与高效执行。

针对当前大模型智能体系统中普遍存在的生命周期管理混乱、版本追踪缺失以及演化更新接口不安全等痛点，DeepResearchAgent 引入了独特的“自演化协议”（Autogenesis）。该协议将提示词、智能体、工具及记忆等资源标准化，明确其状态与版本接口，并构建了包含“提出 - 评估 - 提交”的闭环优化机制，支持可审计的迭代升级与安全回滚。系统具备“行动 - 观察 - 优化 - 记忆”的完整自进化循环，能够利用反馈持续改进策略与提示词。

其核心亮点在于高度的模块化与可组合性，开发者可以灵活替换或新增智能体、工具、环境及优化算法，而无需重构整体架构。同时，结构化的轨迹追踪让系统运行过程透明可视，便于分析失败原因与优化路径。DeepResearchAgent 特别适合 AI 研究人员、大模型应用开发者以及需要构建长期运行、具备自我迭代能力的复杂智能体系统的技术团队使用，帮助摆脱一次性推理的局限，打造真正可持续进化的智能应用。

使用场景

某金融科技团队需要每周自动分析全球宏观政策、竞品动态及社交媒体情绪，以生成深度的行业风险评估报告。

没有 DeepResearchAgent 时

任务拆解依赖人工：分析师需手动将“评估风险”拆解为具体的搜索关键词和数据来源列表，耗时且容易遗漏关键维度。
上下文管理混乱：多轮搜索产生的大量中间数据、网页快照和推理过程分散在不同文档中，难以追溯结论来源或复现分析路径。
策略迭代困难：当分析逻辑需要优化（如增加对新兴市场数据的权重）时，往往需要重写整个脚本的“胶水代码”，无法单独更新提示词或工具模块。
缺乏自我进化能力：系统无法从上周的分析错误中学习，每次运行都是“一次性”推断，无法利用历史反馈自动调整搜索策略或优化输出质量。

使用 DeepResearchAgent 后

自动化层级规划：DeepResearchAgent 的顶层规划代理自动将复杂目标分解为子任务，协调多个专用代理并行执行数据采集与清洗，无需人工干预拆解。
全链路可追溯：基于 RSPL 协议，所有提示词、工具调用和环境状态均被版本化管理，团队可随时审计任意结论的生成轨迹并一键回滚到稳定版本。
模块化灵活组合：通过配置文件即可替换底层的搜索工具或记忆模块，无需重构核心代码，轻松适配不同市场的分析需求。
闭环自我进化：内置优化器利用历史反馈自动反思并更新提示词策略，使系统在长期运行中不断积累领域洞察，报告准确度随时间持续提升。

DeepResearchAgent 通过将复杂的科研任务转化为可演化、可审计的自动化闭环，彻底释放了深度研究的生产力。

运行环境要求

操作系统

未说明

GPU

未说明

内存

未说明

依赖

notesREADME 中未明确列出具体的操作系统、GPU、内存及 Python 版本要求。该项目是一个基于 LLM 的代理自进化协议和运行时，核心功能依赖外部模型 API（如示例中提到的 OpenRouter/GPT-4o），因此本地可能无需高性能 GPU 即可运行工具调用代理，但具体依赖需查看未提供的依赖安装文件（如 requirements.txt）。主要架构包含代理、工具、环境、记忆和优化器等模块，支持通过配置文件组合不同组件。

python未说明

MMEngine (配置系统)

快速开始

自生系统

英语 | 中文说明

自生系统是一种基于大语言模型的智能体系统的自我进化协议与运行时框架。

近年来，许多智能体协议在实体间的生命周期/上下文管理、版本跟踪以及安全的进化更新接口方面定义不够充分，这往往导致系统呈现单体式架构，并产生脆弱的胶水代码。自生系统通过将“什么会进化”与“如何进化”解耦来解决这一问题：

RSPL（资源基质协议层）：将提示词、智能体、工具、环境和记忆建模为经过协议注册的资源，这些资源具有明确的状态、生命周期以及版本化的接口。
SEPL（自我进化协议层）：定义了一个闭环的操作者接口，用于提出、评估并提交改进方案，同时提供可审计的 lineage 和回滚机制。

基于自生系统构建的体系中包含一种自生智能体风格的工具调用型智能体，它能够在运行过程中动态实例化/检索/优化资源，并持续自我改进。

架构

自生系统架构

自我进化的概览

从高层次来看，自生系统支持一个迭代循环：

行动：智能体利用大语言模型及可用的工具和环境生成动作或输出。
观察：捕获结果、追踪日志、中间推理过程以及环境反馈。
优化：使用优化器（例如反思或强化学习类方法）更新提示词、解决方案或变量。
记忆：将总结、洞见和记录持久化存储到记忆系统中，以供后续步骤和会话使用。

核心组件

智能体（src/agent/）：负责决策“下一步做什么”的运行时逻辑，包括规划、工具调用、领域专用智能体等。
工具（src/tool/）：向智能体开放的可调用能力，涵盖工作流工具和默认工具。
环境（src/environment/）：工具和智能体可以交互的状态化接口，如文件系统、交易回测环境、浏览器/移动端环境等。
记忆（src/memory/）：用于摘要、洞察和长期状态的会话级/事件级记忆系统。
优化器（src/optimizer/）：将反馈转化为更新后的提示词、解决方案或变量的自我改进算法，例如反思、GRPO、Reinforce++ 等。
追踪与版本管理（src/tracer/、src/version/）：记录执行轨迹，并管理跨次运行中的迭代产物。
配置系统（configs/、src/config/）：采用 MMEngine 风格的配置，实现智能体、工具、环境、记忆和模型的一致性组合。

设计目标

可组合性：无需重写整个系统即可添加或替换智能体、工具、环境、记忆系统和优化器。
可检查性：结构化的追踪日志和记忆事件使得分析失败原因和改进步骤更加便捷。
可进化性：明确的优化器结合持久化记忆，支持迭代式的优化而非一次性推理。

仓库布局

Autogenesis/
  configs/                 # 配置组合（智能体/工具/环境/记忆/模型）
  src/
    agent/                 # 智能体
    environment/           # 环境
    tool/                  # 工具
    memory/                # 记忆系统
    optimizer/             # 自我进化优化器
    model/                 # 模型管理器 + 提供商后端
    prompt/                # 提示词模板 / 提示词管理器
    tracer/                # 追踪
    version/               # 版本管理
  libs/                    # 第三方库
  workdir/                 # 运行时产物（日志、追踪、结果等）

实证研究

有关实证结果和基准测试协议，请参阅 docs/empirical_studies.md。

可选：运行一个工具调用型智能体

先决条件：

在您的环境中安装依赖项
将 .env.template 复制为 .env，并设置模型 API 密钥（例如 OPENROUTER_API_KEY=...）

示例：

python examples/run_tool_calling_agent.py --config configs/tool_calling_agent.py

覆盖模型和工作目录：

python examples/run_tool_calling_agent.py \
  --config configs/tool_calling_agent.py \
  --cfg-options model_name=openrouter/gpt-4o workdir=workdir/demo tag=demo

DeepResearchAgent (Autogenesis) 快速上手指南

DeepResearchAgent（基于 Autogenesis 架构）是一个面向大语言模型（LLM）智能体系统的自进化协议与运行时框架。它通过解耦“进化内容”与“进化方式”，支持智能体在执行过程中动态实例化、检索和优化资源。

环境准备

在开始之前，请确保您的开发环境满足以下要求：

操作系统：Linux, macOS 或 Windows (WSL 推荐)
Python 版本：建议 Python 3.9 或更高版本
依赖管理：pip 或 conda
API 密钥：需要一个大模型服务商的 API Key（如 OpenRouter, OpenAI 等）

安装步骤

克隆仓库
```
git clone <repository-url>
cd Autogenesis
```
(注：如有国内镜像源，可在此处使用 git clone https://gitee.com/... 加速)
安装依赖
```
pip install -r requirements.txt
```
(若国内下载缓慢，推荐使用清华或阿里镜像源：pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple)
配置环境变量 复制模板文件并填入您的模型 API Key：
```
cp .env.template .env
```
编辑 .env 文件，设置对应的密钥，例如：
```
OPENROUTER_API_KEY=your_api_key_here
```

基本使用

完成配置后，您可以运行内置的“工具调用智能体”示例来体验系统的基础功能。

1. 运行默认示例

使用默认配置文件启动智能体：

python examples/run_tool_calling_agent.py --config configs/tool_calling_agent.py

2. 自定义模型与工作目录

您可以通过命令行参数覆盖默认模型和工作目录配置：

python examples/run_tool_calling_agent.py \
  --config configs/tool_calling_agent.py \
  --cfg-options model_name=openrouter/gpt-4o workdir=workdir/demo tag=demo

运行说明：

Act (行动)：智能体将利用 LLM 和可用工具执行任务。
Observe (观察)：系统会自动捕获执行结果、轨迹及环境反馈。
Optimize (优化)：基于反馈自动更新提示词或解决方案。
Remember (记忆)：关键洞察将被持久化存储以供后续会话使用。

运行产生的日志、轨迹和结果将保存在指定的 workdir 目录中。

版本历史

v2.0.02026/02/24

v1.0.02026/02/24

常见问题

如何配置并使用本地部署的 Qwen 模型服务？

运行示例时报错 'object has no attribute parse_tool_calls' 如何解决？

安装依赖时遇到 pyproject.toml 解析错误或版本找不到怎么办？

必须配置本地代理 (local_proxy) 才能使用 OpenAI、Azure 或 Google API 吗？

配置环境变量时出现 'Invalid type for url ... got NoneType' 错误是什么原因？

使用本地部署的 Qwen 模型调用工具时报错 'Unknown image model type' 或 function calling 失败怎么办？

Browser-use Agent 在执行 pdf_viewer 操作时卡住或超时如何处理？

项目是否支持 DeepSeek 或其他非主流大模型？

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

★ 349.3k|★★★☆☆|2周前

Agent开发框架图像

n8n

n8n 是一款面向技术团队的公平代码（fair-code）工作流自动化平台，旨在让用户在享受低代码快速构建便利的同时，保留编写自定义代码的灵活性。它主要解决了传统自动化工具要么过于封闭难以扩展、要么完全依赖手写代码效率低下的痛点，帮助用户轻松连接 400 多种应用与服务，实现复杂业务流程的自动化。 n8n 特别适合开发者、工程师以及具备一定技术背景的业务人员使用。其核心亮点在于“按需编码”：既可以通过直观的可视化界面拖拽节点搭建流程，也能随时插入 JavaScript 或 Python 代码、调用 npm 包来处理复杂逻辑。此外，n8n 原生集成了基于 LangChain 的 AI 能力，支持用户利用自有数据和模型构建智能体工作流。在部署方面，n8n 提供极高的自由度，支持完全自托管以保障数据隐私和控制权，也提供云端服务选项。凭借活跃的社区生态和数百个现成模板，n8n 让构建强大且可控的自动化系统变得简单高效。

★ 184.7k|★★☆☆☆|昨天

数据工具开发框架Agent

AutoGPT

AutoGPT 是一个旨在让每个人都能轻松使用和构建 AI 的强大平台，核心功能是帮助用户创建、部署和管理能够自动执行复杂任务的连续型 AI 智能体。它解决了传统 AI 应用中需要频繁人工干预、难以自动化长流程工作的痛点，让用户只需设定目标，AI 即可自主规划步骤、调用工具并持续运行直至完成任务。无论是开发者、研究人员，还是希望提升工作效率的普通用户，都能从 AutoGPT 中受益。开发者可利用其低代码界面快速定制专属智能体；研究人员能基于开源架构探索多智能体协作机制；而非技术背景用户也可直接选用预置的智能体模板，立即投入实际工作场景。 AutoGPT 的技术亮点在于其模块化“积木式”工作流设计——用户通过连接功能块即可构建复杂逻辑，每个块负责单一动作，灵活且易于调试。同时，平台支持本地自托管与云端部署两种模式，兼顾数据隐私与使用便捷性。配合完善的文档和一键安装脚本，即使是初次接触的用户也能在几分钟内启动自己的第一个 AI 智能体。AutoGPT 正致力于降低 AI 应用门槛，让人人都能成为 AI 的创造者与受益者。

★ 183.6k|★★★☆☆|今天

Agent语言模型插件

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|2周前

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 161.7k|★★☆☆☆|今天

开发框架Agent语言模型

opencode

OpenCode 是一款开源的 AI 编程助手（Coding Agent），旨在像一位智能搭档一样融入您的开发流程。它不仅仅是一个代码补全插件，而是一个能够理解项目上下文、自主规划任务并执行复杂编码操作的智能体。无论是生成全新功能、重构现有代码，还是排查难以定位的 Bug，OpenCode 都能通过自然语言交互高效完成，显著减少开发者在重复性劳动和上下文切换上的时间消耗。这款工具专为软件开发者、工程师及技术研究人员设计，特别适合希望利用大模型能力来提升编码效率、加速原型开发或处理遗留代码维护的专业人群。其核心亮点在于完全开源的架构，这意味着用户可以审查代码逻辑、自定义行为策略，甚至私有化部署以保障数据安全，彻底打破了传统闭源 AI 助手的“黑盒”限制。在技术体验上，OpenCode 提供了灵活的终端界面（Terminal UI）和正在测试中的桌面应用程序，支持 macOS、Windows 及 Linux 全平台。它兼容多种包管理工具，安装便捷，并能无缝集成到现有的开发环境中。无论您是追求极致控制权的资深极客，还是渴望提升产出的独立开发者，OpenCode 都提供了一个透明、可信

★ 144.3k|★☆☆☆☆|4天前

Agent插件