mnehmos.multi-agent.framework

540 67 较难 1 次阅读昨天MITAgent开发框架

AI 解读由 AI 自动生成，仅供参考

mnehmos.multi-agent.framework 是一个旨在将大型语言模型从单纯的“聊天机器人”升级为具备完整行为能力的“数字有机体”的开源框架。它借鉴生物神经系统架构，为 AI 大脑构建了包含感知、反射、记忆和行动的闭环系统，解决了传统 AI 缺乏长期记忆、无法自主协调复杂任务以及难以像生物一样对环境做出即时反应的问题。

该框架特别适合 AI 开发者、研究人员以及希望构建高度自主智能体的工程师使用。其核心亮点在于独特的分层架构设计：中央层（Central）负责认知与规划，躯体层（Somatic）执行文件操作等自愿行动，自主层（Autonomic）处理后台记忆与多智能体协作，而反射层（Reflex）则能在信息进入大脑前快速拦截无效输入。此外，项目深度集成 MCP（模型上下文协议）生态，提供了一套模块化工具库，涵盖电脑自动化、语义搜索、学术调研甚至游戏引擎功能。通过这套系统，用户可以轻松搭建出不仅能对话，更能像生物一样感知环境、保留记忆并自主执行复杂工作流的智能代理。

使用场景

一位全栈开发者正试图让 AI 助手独立修复一个涉及前端界面错乱、后端逻辑错误及数据库不一致的复杂生产事故。

没有 mnehmos.multi-agent.framework 时

感知缺失：AI 仅能基于文本对话猜测问题，无法像“躯体神经系统”一样直接操控鼠标点击复现 bug 或读取屏幕实时状态。
记忆断层：在多轮调试中，AI 经常遗忘之前的尝试路径和文件锁状态，导致重复执行无效操作甚至引发冲突。
反应迟钝：缺乏“反射弧”机制，错误的代码格式或违规的参数输入需经过漫长的中央思考后才被驳回，浪费大量算力与时间。
协作混乱：多个任务（如搜索文档、编写代码、运行测试）串行处理，缺乏自主神经系统的后台同步能力，整体效率极低。

使用 mnehmos.multi-agent.framework 后

具身感知：通过 OODA MCP（躯体层），AI 能直接控制键鼠操作浏览器复现故障，并截取屏幕画面进行视觉分析，精准定位 UI 异常。
持久记忆：Synch MCP（自主层）自动维护会话状态与文件锁，确保多步操作中的数据一致性，让 AI 像拥有长期记忆般连贯工作。
即时反射：Trace MCP（反射层）在指令进入核心大脑前即刻拦截非法输入与类型错误，将无效尝试阻断在毫秒级之内。
并行协同：中央大脑统筹规划，自主神经系统后台并行执行文献检索（arXiv MCP）与索引构建，实现“思考”与“背景处理”的高效解耦。

mnehmos.multi-agent.framework 将原本孤立的聊天机器人升级为具备感知、记忆与反射能力的有机智能体，使复杂工程问题的解决从“纸上谈兵”变为“实地作战”。

运行环境要求

操作系统

未说明

GPU

未说明

内存

未说明

依赖

notes该工具并非传统的 Python 库或模型，而是一套用于 AI 辅助 IDE（如 Roo Code, Claude Code, Cursor, Copilot）的配置模板和多智能体架构框架。其核心运行依赖于外部 MCP（Model Context Protocol）服务器（如 OODA MCP, Synch MCP 等），这些服务器需单独安装和配置。用户主要需要按照文档将 YAML 和 Markdown 模板文件复制到项目目录，并在 IDE 中配置全局指令。具体的系统资源需求取决于所连接的大语言模型后端及所选用的 MCP 工具（例如涉及屏幕自动化或本地 RAG 时会有额外需求），框架本身无特定的 GPU、内存或 Python 版本硬性要求。

python未说明

未说明

mnehmos.multi-agent.framework hero image

快速开始

代理神经系统

你的大语言模型就像一个装在罐子里的大脑。为它赋予神经系统吧。

一种用于人工心智的生物架构。感知、反射、记忆和行动——被组织成连贯的循环，将聊天机器人转变为有机体。

🌐 网站: 正在建设中！mnehmos.github.io/mnehmos.multi-agent.framework

📖 博客文章: 从聊天机器人到有机体

MCP 生态系统

服务器	层级	描述
	躯体层	62种用于计算机自动化的工具：文件、屏幕、键盘、鼠标、批处理操作
	自律层	内存持久化、代理交接、文件锁、缺陷跟踪
	自律层	RAG 流水线、文档问答、语义搜索
	反射层	模式验证、合约执行、类型脚手架
	中枢层	面向深度研究模式的学术论文搜索
	游戏引擎	D&D 5e 战斗、角色、遭遇

架构图

┌─────────────────────────────────────────────────────────────────────┐
│                    CENTRAL (BRAIN) - 认知                      │
│    协调者 • 架构师 • 计划员 • 提问 • 深度研究        │
│         ↑ 接收感官输入   ↓ 发送运动指令          │
├─────────────────────────────────────────────────────────────────────┤
│                   SOMATIC (BODY) - 自愿行动                 │
│         红色阶段 • 绿色阶段 • 蓝色阶段 • 编码 • 调试        │
│              ↑ 工具结果   ↓ 工具调用                   │
├─────────────────────────────────────────────────────────────────────┤
│                AUTONOMIC (SUBCONSCIOUS) - 后台                │
│              内存 • Synch MCP • Index Foundry MCP                 │
│           状态持久化、检索、代理协调         │
├─────────────────────────────────────────────────────────────────────┤
│              REFLEX (SPINAL CORD) - 立即响应。                     │
│                     （建设中）                            │
│                Trace MCP • 模式验证 • 合约            │
│              在认知之前拒绝不良输入                    │
└─────────────────────────────────────────────────────────────────────┘

快速入门

1. 复制基础模板

# 在项目中创建 .roo 目录
mkdir -p .roo

# 复制模板
cp templates/custom_modes.yaml .roo/
cp templates/universal/AGENTS.md .

需要复制的文件:

templates/custom_modes.yaml → .roo/custom_modes.yaml
templates/universal/AGENTS.md → AGENTS.md（项目根目录）

2. 添加全局指令

将 templates/custom-instructions-for-all-modes.md 的内容复制到你的 IDE 的全局指令字段中。

3. （可选）添加 MCP 工具

安装工具以扩展功能。请参阅 templates/tools/ 中的集成文档：

等级	工具	层级	集成指南
2	OODA MCP	躯体层	`ooda-mcp.md`
3	Synch MCP	自律层	`synch-mcp.md`
3	Index Foundry	自律层	`index-foundry-mcp.md`
4	Trace MCP	反射层	`trace-mcp.md`

模板等级

渐进增强——从简单开始，根据需要逐步添加功能：

等级	组件	你将获得什么
0	基础模板	无工具协作，支持 13 种模式
1	+ 原生工具	文件 I/O、命令执行
2	+ OODA MCP	完整的计算机自动化（62 种工具）
3	+ Synch + Index Foundry	内存持久化 + RAG
4	+ Trace MCP	模式验证层

每个等级都保留了前一等级的所有契约。

13 种模式

中枢（大脑）

模式	目的
🔄 协调者	任务分解、委派、整合
🏛️ 架构师	系统设计、ADR、合同
📋 计划员	任务地图、待办事项、依赖关系
❓ 提问	澄清问题、研究综述
🔎 深度研究	多源调查
🔬 深度范围	问题界定

躯体（身体）

模式	目的
🔴 红色阶段	编写失败的测试
🟢 绿色阶段	最小化实现
🔵 蓝色阶段	在绿色测试下重构
💻 编码	复杂实现
🐛 调试	根因分析

自律（潜意识）

模式	目的
📁 内存	文档记录、知识管理
🗄️ Index Foundry	RAG 流水线专家

核心契约

OODA 循环

所有工作遵循观察 → 定位 → 决策 → 行动：

观察 👁️ — 阅读任务、扫描文件、检查测试
定位 🧭 — 对比现有与所需
决策 🎯 — 选择风险最低的方法
行动 ⚡ — 执行一步，验证，重复

TDD 循环

🔴 RED    →  编写失败的测试
🟢 GREEN  →  最小化实现
🔵 BLUE   →  在绿色测试下重构

回旋镖协议

每个完成的任务都会返回结构化数据：

{
  "type": "task-completed",
  "task_id": "auth-impl-001",
  "from": "green-phase",
  "status": "success",
  "files_changed": ["src/auth/jwt.ts"],
  "tests_run": ["npm test -- auth"],
  "summary": "实现了 JWT 验证"
}

IDE 支持

适用于各大 AI 辅助 IDE 的模板：

IDE	模板位置
Roo Code	`templates/custom_modes.yaml`
Claude Code	`templates/claude-code/CLAUDE.md`
Cursor	`templates/cursor/rules/_global.mdc`
Copilot	`templates/copilot/copilot-instructions.md`

文件结构

路径	描述
`templates/custom_modes.yaml`	模式定义（13种模式，包含层映射）
`templates/custom-instructions-for-all-modes.md`	全局契约（粘贴到 IDE 中）
`templates/universal/AGENTS.md`	通用智能体契约（OODA + TDD + 范围）
工具集成
`templates/tools/ooda-mcp.md`	OODA MCP 集成（躯体层）
`templates/tools/synch-mcp.md`	Synch MCP 集成（自主层）
`templates/tools/index-foundry-mcp.md`	Index Foundry 集成（自主层）
`templates/tools/trace-mcp.md`	Trace MCP 集成（反射层）

哲学

为什么需要神经系统？

大语言模型是无状态的文本预测器。它们具备：

✅ 高度智能
❌ 缺乏自主性
❌ 缺乏持久记忆
❌ 缺乏感觉-运动整合能力

而神经系统则能提供：

闭环的动作与感知反馈
反射机制，可立即拒绝不良输入
自主过程，用于维持系统状态
中央协调，以整合各专业能力

从聊天机器人到有机体

聊天机器人：    用户 → LLM → 回应
                   ↑
                   └── （无反馈）

有机体：   环境 → 感官 → 大脑 → 运动 → 环境
                 ↑                              ↓
                 └──────── 反馈 ────────────┘

支持

许可证

MIT

mnehmos.multi-agent.framework 快速上手指南

本指南旨在帮助开发者快速将大语言模型（LLM）从简单的聊天机器人升级为具备“感知、反射、记忆和行动”能力的智能体有机体。该框架基于生物神经系统架构，适用于 Roo Code、Claude Code、Cursor 等主流 AI 辅助 IDE。

环境准备

在开始之前，请确保满足以下前置条件：

操作系统：Linux, macOS 或 Windows (WSL2 推荐)
核心依赖：
- Git (用于克隆模板)
- Node.js (v18+, 用于运行 MCP 服务器)
- 支持的 AI IDE：Roo Code, Claude Code, Cursor, GitHub Copilot 等
项目基础：一个已初始化的代码项目目录

注意：目前官方未提供中国镜像源，建议配置全局网络代理以确保 git clone 和 npm install 顺利执行。

安装步骤

1. 获取基础模板

你可以通过克隆仓库或直接下载所需文件来获取框架的核心配置文件。以下是基于命令行的高效操作方式：

# 假设你已在项目根目录
# 创建 .roo 配置目录
mkdir -p .roo

# 如果你已经克隆了框架仓库 (例如在 ../mnehmos.multi-agent.framework)
# 复制模式定义文件
cp ../mnehmos.multi-agent.framework/templates/custom_modes.yaml .roo/

# 复制通用智能体契约文件到项目根目录
cp ../mnehmos.multi-agent.framework/templates/universal/AGENTS.md .

如果没有克隆仓库，请直接前往 GitHub 仓库下载以下两个文件并放置到对应位置：

templates/custom_modes.yaml → 放入项目的 .roo/ 目录
templates/universal/AGENTS.md → 放入项目根目录

2. 配置全局指令

为了让 IDE 识别所有模式的契约，需要配置全局指令：

打开文件 templates/custom-instructions-for-all-modes.md (位于框架源码中)。
复制其全部内容。
在你的 IDE 设置中找到 "Global Instructions" (全局指令) 或 "System Prompt" 字段。
将内容粘贴进去并保存。

3. (可选) 集成 MCP 工具扩展能力

根据需求分层级安装 MCP (Model Context Protocol) 服务器，以赋予智能体更多能力：

层级	功能描述	安装参考文档
Tier 2	躯体层 (Somatic): 电脑自动化 (文件/屏幕/键盘/鼠标)	`templates/tools/ooda-mcp.md`
Tier 3	自主层 (Autonomic): 记忆持久化 & RAG 检索	`templates/tools/synch-mcp.md` `templates/tools/index-foundry-mcp.md`
Tier 4	反射层 (Reflex): 输入验证与契约强制执行	`templates/tools/trace-mcp.md`

具体安装命令请参考上述对应的 .md 文档，通常涉及在 IDE 的 MCP 配置中添加 server 路径。

基本使用

安装完成后，框架会自动激活 13 种专用模式。你无需手动切换复杂的参数，只需在对话中指定模式名称或让 AI 根据任务自动调度。

核心工作流示例

场景：开发一个新的用户认证功能

1. 规划阶段 (Central - Brain) 在对话框中输入：

@Planner 请为 JWT 认证功能制定任务地图，分析现有依赖并列出待办事项。

系统将调用 Planner 模式，输出任务分解和依赖关系。

2. 架构设计 (Central - Brain)

@Architect 基于上述计划，设计认证模块的系统架构，并生成 ADR (架构决策记录)。

系统将调用 Architect 模式，定义接口契约和数据结构。

3. 测试驱动开发 (Somatic - Body) 利用内置的 TDD 循环（红 - 绿 - 蓝）：

@Red-Phase 为登录接口编写失败的测试用例。

(等待测试失败)

@Green-Phase 实现最小化的登录逻辑以通过测试。

(等待测试通过)

@Blue-Phase 重构代码，保持测试绿色并优化结构。

4. 深度研究 (Central - Brain) 如果需要查阅最新的安全最佳实践：

@Deep-Research 调研 2024 年最新的 JWT 安全漏洞及防御策略，并更新我们的实现方案。

核心协议说明

在使用过程中的所有交互都遵循以下核心协议，确保输出的结构化：

OODA 循环: 所有任务自动遵循观察 (Observe) → 调整 (Orient) → 决策 (Decide) → 行动 (Act) 的闭环。
回旋镖协议 (Boomerang Protocol): 每个任务完成后，智能体会返回标准的 JSON 状态报告，包含变更文件、运行测试及摘要，便于后续环节衔接。

// 任务完成后的典型返回结构
{
  "type": "task-completed",
  "task_id": "auth-impl-001",
  "from": "green-phase",
  "status": "success",
  "files_changed": ["src/auth/jwt.ts"],
  "tests_run": ["npm test -- auth"],
  "summary": "Implemented JWT validation"
}

通过以上步骤，你的 LLM 已从单一的文本生成器转变为具备完整神经系统的智能开发伙伴。

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

★ 349.3k|★★★☆☆|昨天

Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|2天前

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 142.7k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 107.9k|★★☆☆☆|昨天

开发框架图像Agent

markitdown

MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器

★ 93.4k|★★☆☆☆|今天

插件开发框架

LLMs-from-scratch

LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目，旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型（LLM）。它不仅是同名技术著作的官方代码库，更提供了一套完整的实践方案，涵盖模型开发、预训练及微调的全过程。该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型，却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码，用户能够透彻掌握 Transformer 架构、注意力机制等关键原理，从而真正理解大模型是如何“思考”的。此外，项目还包含了加载大型预训练权重进行微调的代码，帮助用户将理论知识延伸至实际应用。 LLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API，而是渴望探究模型构建细节的技术人员而言，这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计：将复杂的系统工程拆解为清晰的步骤，配合详细的图表与示例，让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础，还是为未来研发更大规模的模型做准备

★ 90.1k|★★★☆☆|昨天

语言模型图像Agent