agentUniverse

GitHub
2.2k 375 简单 1 次阅读 2天前Apache-2.0Agent开发框架图像语言模型
AI 解读 由 AI 自动生成,仅供参考

agentUniverse 是一个基于大语言模型的多智能体协作框架,旨在帮助开发者轻松构建能够协同工作的智能应用。它主要解决了单一智能体在处理复杂任务时能力有限、难以融合特定领域专业经验的痛点。通过提供灵活的“协作模式工厂”,agentUniverse 让多个具备不同职责的智能体各司其职,从而高效解决跨领域的复杂问题。

该工具特别适合希望构建企业级或领域专家级智能应用的开发者与技术团队。其核心亮点在于深度集成了蚂蚁集团真实的金融业务实践经验,内置了多种经过实战验证的协作模式。例如,"PEER 模式”通过规划、执行、表达和审查四个角色的配合,擅长处理事件解读与行业分析等推理任务;而"DOE 模式”则专注于数据密集型场景,能有效结合专家意见生成高质量的财务报告。此外,agentUniverse 支持通过简单配置快速接入 Qwen、Deepseek、OpenAI 及 Claude 等主流大模型,让开发者能专注于业务逻辑而非底层适配,是打造高智商协作智能体的得力助手。

使用场景

某金融科技公司投研团队需每日从海量市场数据中快速生成深度行业分析报告,以辅助投资决策。

没有 agentUniverse 时

  • 流程割裂且低效:分析师需手动收集数据、撰写初稿并反复校对,单人耗时数小时,难以应对突发市场波动。
  • 专业度难以保证:通用大模型缺乏金融领域知识,生成的报告常出现数据解读偏差或逻辑漏洞,需专家大量返工。
  • 协作成本高昂:不同角色(数据员、撰稿人、审核员)之间依靠人工传递信息,沟通误差导致最终产出质量不稳定。
  • 扩展性差:每当新增分析维度(如加入宏观政策因子),需重新编写整套代码逻辑,开发周期长。

使用 agentUniverse 后

  • 自动化流水线作业:利用内置的 PEER 模式,自动调度“计划、执行、表达、审查”四个智能体串联工作,将报告生成时间从小时级缩短至分钟级。
  • 领域专家能力内嵌:通过 DOE 模式注入金融专家经验,让“数据提炼”与“观点注入”智能体精准处理复杂财报,确保数据计算零误差且观点深刻。
  • 多智能体协同闭环:各智能体各司其职并基于反馈迭代优化,自动发现并修正逻辑矛盾,输出质量稳定达到资深分析师水平。
  • 灵活配置快速落地:仅需简单配置文件即可切换 Qwen 或 Deepseek 等底层模型,新增分析场景时无需重构代码,直接复用现有协作模式组件。

agentUniverse 将蚂蚁集团真实的金融业务实践转化为可复用的多智能体协作模式,让企业能以极低门槛构建出具备领域专家水平的智能代理团队。

运行环境要求

GPU

未说明

内存

未说明

依赖
notes该工具主要作为多智能体框架,通过配置 API Key 调用云端大模型(如 Qwen, DeepSeek, OpenAI 等),README 中未提及本地部署大模型所需的 GPU 或内存需求。若需使用可视化工作流平台,需额外安装 magent-ui 和 ruamel.yaml。
python3.10+
agentUniverse
magent-ui
ruamel.yaml
agentUniverse hero image

快速开始

agentUniverse


语言版本:英文 | 中文 | 日文

Static Badge


agentUniverse 是什么?

agentUniverse 是一个基于大语言模型的多智能体框架。 它提供了灵活且易于扩展的能力,用于构建独立的智能体。agentUniverse 的核心是一套丰富的多智能体协作模式组件(作为协作模式工厂),这些组件使智能体能够在不同领域解决问题时各司其职、最大化自身能力;同时,agentUniverse 还注重领域经验的集成,帮助您将领域经验无缝融入到智能体的工作中。🎉🎉🎉

🌈🌈🌈agentUniverse 起源于蚂蚁集团的真实金融业务实践(https://github.com/antgroup),致力于协助开发者和企业轻松构建能够协同完成任务的领域专家级智能体。

我们期待您的实践,并通过社区分享和交流不同领域的协作模式。该框架已经内置了许多在实际业务场景中经过验证的多智能体协作实用组件,并将在未来持续丰富。目前开放使用的模式组件包括:

  • PEER 模式组件:该模式利用具有不同职责的 Plan、Execute、Express 和 Review 四个智能体,将复杂问题分解为可管理的步骤,按顺序执行,并根据反馈迭代改进,从而提升推理和分析类任务的表现。典型应用场景:事件解读、行业分析。
  • DOE 模式组件:该模式采用 Data-fining、Opinion-inject 和 Express 三个智能体,以提升数据密集型、计算精度要求高且需要结合专家意见的任务效果。典型应用场景:财务报告生成。

更多模式即将推出……

LLM 模型的集成只需简单配置即可完成,目前 agentUniverse 支持的模型包括:

- 供应商 模型
通义千问 qwen3 系列(qwen3-235b-a22b、qwen3-32b、qwen3-30b-a3b等)、qwen2.5-72b-instruct、qwq-32b-preview、qwen-max、…
DeepSeek deepseek-r1、deepseek-v3、deepseek-r1-distill-qwen-32b、…
OpenAI GPT-4o、GPT-4o mini、OpenAI o1、OpenAI o3-mini、…
Claude claude 3.7 sonnet 、Claude 3.5 Sonnet、Claude 3 Opus、…
Gemini Gemini 2.5 Pro、Gemini 2.0 Flash、Gemini 2.0 Flash Thinking、Gemini 1.5 Pro、…
Llama llama3.3-70b-instruct、llama3.2-3b-instruct、llama3.2-1b-instruct、…
KIMI moonshot-v1-128k、moonshot-v1-32k、moonshot-v1-8k、…
文心一言 ERNIE 4.5 Turbo、ERNIE 4.5、ERNIE 4.0 Turbo、ERNIE 4.0、ERNIE 3.5、…
ChatGLM chatglm3-6b、chatglm-6b-v2、…
百川智能 baichuan2-turbo、baichuan2-13b-chat-v1、…
豆包 Doubao-pro-128k、Doubao-pro-32k、Doubao-lite-128k、…

例如,要使用 DeepSeek 模型,您只需在 custom_key.toml 文件中设置 DEEPSEEK_API_KEY 值,并在智能体配置文件中将 llm_model 名称设置为 'default_deepseek_llm' 即可。有关 LLM 配置的更多信息,请参阅 switch-the-llm


目录


快速开始

安装

使用 pip:

pip install agentUniverse

运行第一个示例

运行您的第一个示例,您可以通过教程快速体验 agentUniverse 构建的智能体(或智能体组)的性能。

详细步骤请参阅文档:运行第一个示例


如何构建代理应用

标准项目脚手架

设置标准项目:agentUniverse 标准项目

单代理快速搭建指南

您可以通过阅读单代理快速搭建指南来学习如何快速构建一个单代理。这将帮助您了解如何使用工具、知识库、RAG 技术等来增强代理的能力。此外,您还将掌握代理的基本应用开发流程,包括配置、测试、优化、部署和性能评估。

典型多代理应用的构建

您可以通过参考典型多代理应用的构建章节,进一步了解如何在复杂任务场景中将智能能力分解为多个代理,并通过协作提升任务性能。

创建和使用代理模板

您可以通过创建和使用代理模板章节,学习如何将有效的代理模式创建为模板。这将大大提高后续代理构建的效率,并促进其传播。

使用和发布 MCP 服务器

您可以通过参考如何使用 MCP 服务器如何发布 MCP 服务器,学习如何在 agentUniverse 框架中快速使用或发布 MCP 服务器。

代理应用可观测性

agentUniverse 为代理应用提供了一个标准化的可观测性框架。基于 OpenTelemetry 协议,它可以对代理、LLM 和工具等关键组件进行全面的数据收集和监控,从而实现对代理全生命周期的跟踪。您可以在代理应用可观测性部分学习如何利用这些可观测性功能。

常用技巧与高级技术

您还可以通过Get_Start中的其他文档,了解更多关于代理应用构建过程中的高级技术,例如如何在智能代理流程中添加记忆模块,以及如何在项目中有效管理提示词。


搭建可视化代理工作流平台

agentUniverse 提供了一个用于创建代理工作流的可视化画布平台。请按照以下步骤进行快速启动:

使用 pip

pip install magent-ui ruamel.yaml

一键运行

运行 product_application.py 文件,位于 sample_apps/workflow_agent_app/bootstrap/platform 目录下,即可快速启动。

更多详细信息,请参阅[产品平台快速入门](docs/guidebook/en/How-to/Guide to Visual Agentic Workflow Platform/Product_Platform_Quick_Start.md)和[进阶指南](docs/guidebook/en/How-to/Guide to Visual Agentic Workflow Platform/Product_Platform_Advancement_Guide.md)。

该功能由 difizen 和 agentUniverse 联合开发。


为什么使用 agentUniverse

概念

agentUniverse 的核心提供了构建单个智能代理所需的所有基本组件、多代理之间的协作机制,并支持专家知识的注入。这使得开发者能够轻松创建具备专业知识的智能应用。

多代理协作

agentUniverse 提供了多种在实际行业中经过验证的多代理协作模型。其中,“PEER”模型是最具特色的之一。

PEER 模型采用四种不同职责的代理:规划(Planning)、执行(Executing)、表达(Expressing)和评审(Reviewing)。这种结构可以将复杂问题分解并逐步执行,同时根据评估反馈进行自主迭代,从而最终提升推理和分析任务的性能。该模型尤其适用于需要多步分解和深入分析的场景,如事件解读、宏观经济分析以及商业提案的可行性分析。

PEER 模型已经取得了令人瞩目的成果,最新的研究成果和实验数据可在以下文献中找到。

主要特性

基于上述介绍,我们总结 agentUniverse 的主要特性如下:

灵活且可扩展的代理构建能力:它提供了构建代理所需的所有基本组件,所有组件均支持自定义,以满足用户的个性化需求。

丰富且高效的多代理协作模型:它提供了 PEER(计划/执行/表达/评审)和 DOE(数据查找/意见注入/表达)等已在行业中得到验证的协作模型。用户还可以自定义和编排新的模型,以促进多代理之间的有机协作。

易于集成领域专业知识:它提供了领域提示、知识构建和管理等功能,能够编排和注入领域级 SOP,使代理与专家级别的领域知识保持一致。

💡 更多特性: 请参阅agentUniverse 的核心特性部分,以获取更多详细信息。


示例应用

🚩 法律咨询代理 v2

🚩 Python 代码生成与执行代理

🚩 基于多轮多代理模式的讨论组

🚩 基于 PEER 多代理模式的金融事件分析

🚩 复制吴恩达的反思式工作流翻译代理


基于agentUniverse的商业产品

🔗 智小助-金融专业人士AI助手

智小助 AI助手:专为严苛行业的大模型开发而设计,旨在提升投研专家的工作效率

智小助AI助手是大模型在严苛行业落地应用的高效解决方案。它基于Finix模型构建,强调精准应用场景,并借助以专业定制能力著称的agentUniverse智能体框架。该方案面向投研、ESG(环境、社会和治理)、金融、财报等专业领域的一系列AI业务助理,在蚂蚁集团的大规模场景中得到了充分验证,显著提升了专家的工作效率。

https://private-user-images.githubusercontent.com/39180831/355437700-192f712d-1b03-46a6-8422-1ca10aa94331.mp4?jwt=eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJpc3MiOiJnaXRodWIuY29tIiwiYXVkIjoicmF3LmdpdGh1YnVzZXJjb250ZW50LmNvbSIsImtleSI6ImtleTUiLCJleHAiOjE3MjI5NDk4NTAsIm5iZiI6MTcyMjk0OTU1MCwicGF0aCI6Ii8zOTE4MDgzMS8zNTU0Mzc3MDAtMTkyZjcxMmQtMWIwMy00NmE2LTg0MjItMWNhMTBhYTk0MzMxLm1wND9YLUFtei1BbGdvcml0aG09QVdTNC1ITUFDLVNIQTI1NiZYLUFtei1DcmVkZW50aWFsPUFLSUFWQ09EWUxTQTUzUFFLNFpBJTJGMjAyNDA4MDYlMkZ1cy1lYXN0LTElMkZzMyUyRmF3czRfcmVxdWVzdCZYLAFtei1EYXRlPTIwMjQwODA2VDEzMDU1MFomWC1BbXotRXhwaXJlcz0zMDAmWC1BbXotU2lnbmF0dXJlPTU4NWMzNzVjOGZjZDNjMDMzMTE4YjQzOTk0ZWQwZGZkNWNmNWQxNWMzYWIzMTk4MzY1MjA5NWRhMjU2NGNiNzUmWC1BbXotU2lnbmVkSGVhZGVycz1ob3N0JmFjdG9yX2lkPTAma2V5X2lkPTAmcmVwb19pZD0wIn0.q1vdSg_Ghxr-DHLXfmQ_fVVRVSFn7H8VMHMi-_2QrjA


文档

用户指南

💡 如需更详细的信息,请参阅用户指南

API参考

💡 技术细节请参阅API参考


支持

通过GitHub Issues提交问题

😊 建议您使用Github Issues提交问题,我们通常会在2个工作日内回复。

通过Discord联系我们

😊 欢迎加入我们的Discord频道,与我们互动。

通过管理员邮箱联系我们

😊 邮箱:

Twitter

ID:@agentuniverse_


引用

agentUniverse项目中构建的PEER多智能体框架得到了以下研究成果的支持。

BibTeX格式

@misc{wang2024peerexpertizingdomainspecifictasks,
      title={PEER: 用多智能体框架及微调方法实现领域特定任务的专业化}, 
      author={王怡颖、李晓静、王彬竹、周岳阳、韩汉、陈宏、张金石、余飞、赵泽伟、金松、龚仁吉、徐万青},
      year={2024},
      eprint={2407.06985},
      archivePrefix={arXiv},
      primaryClass={cs.AI},
      url={https://arxiv.org/abs/2407.06985}, 
}

概述:本文详细介绍了PEER多智能体框架的机制和原理。实验部分从完整性、相关性、简洁性、事实性、逻辑性、结构性和全面性七个维度进行评分,每个维度满分5分。平均而言,PEER模型在各项评估指标上均优于BabyAGI,尤其在完整性、相关性、逻辑性、结构性和全面性方面表现突出。此外,使用GPT-3.5 Turbo(16k)模型测试时,PEER模型的准确率高达83%,而使用GPT-4模型时,准确率达到81%。更多详情请参阅原文。 🔗https://arxiv.org/pdf/2407.06985


致谢

本项目部分基于Langchain、Pydantic、Gunicorn、Flask、SQLAlchemy、chromadb等优秀的开源项目构建而成(详细的依赖列表可在pyproject.toml中找到)。在此向相关项目及其贡献者表示衷心的感谢。🙏🙏🙏

版本历史

v0.0.92024/06/14
v0.0.192025/11/17
v0.0.182025/07/10
v0.0.172025/05/22
v0.0.162025/04/17
v0.0.152025/03/03
v0.0.142025/01/26
v0.0.132024/09/12
v0.0.122024/08/14
v0.0.112024/07/11
v0.0.102024/06/28
v0.0.82024/06/06
v0.0.72024/05/29
v0.0.62024/05/15
v0.0.52024/05/08
v0.0.42024/04/26
v0.0.32024/04/24

常见问题

相似工具推荐

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。

162.1k|★★★☆☆|今天
开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上

139k|★★☆☆☆|今天
开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。

107.7k|★★☆☆☆|2天前
开发框架图像Agent

NextChat

NextChat 是一款轻量且极速的 AI 助手,旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性,以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发,NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。 这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言,它也提供了便捷的自托管方案,支持一键部署到 Vercel 或 Zeabur 等平台。 NextChat 的核心亮点在于其广泛的模型兼容性,原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型,让用户在一个界面即可自由切换不同 AI 能力。此外,它还率先支持 MCP(Model Context Protocol)协议,增强了上下文处理能力。针对企业用户,NextChat 提供专业版解决方案,具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能,满足公司对数据隐私和个性化管理的高标准要求。

87.6k|★★☆☆☆|今天
开发框架语言模型

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程,旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周,包含 26 节精炼课程和 52 道配套测验,内容涵盖从基础概念到实际应用的完整流程,有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。 无论是希望转型的开发者、需要补充算法背景的研究人员,还是对人工智能充满好奇的普通爱好者,都能从中受益。课程不仅提供了清晰的理论讲解,还强调动手实践,让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持,通过自动化机制提供了包括简体中文在内的 50 多种语言版本,极大地降低了全球不同背景用户的学习门槛。此外,项目采用开源协作模式,社区活跃且内容持续更新,确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路,ML-For-Beginners 将是理想的起点。

85k|★★☆☆☆|今天
图像数据工具视频

ragflow

RAGFlow 是一款领先的开源检索增强生成(RAG)引擎,旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体(Agent)能力相结合,不仅支持从各类文档中高效提取知识,还能让模型基于这些知识进行逻辑推理和任务执行。 在大模型应用中,幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构(如表格、图表及混合排版),显著提升了信息检索的准确度,从而有效减少模型“胡编乱造”的现象,确保回答既有据可依又具备时效性。其内置的智能体机制更进一步,使系统不仅能回答问题,还能自主规划步骤解决复杂问题。 这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统,还是致力于探索大模型在垂直领域落地的创新者,都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口,既降低了非算法背景用户的上手门槛,也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目,它正成为连接通用大模型与行业专有知识之间的重要桥梁。

77.1k|★★★☆☆|昨天
Agent图像开发框架