AgentVerse

GitHub
5k 502 较难 1 次阅读 3天前Apache-2.0Agent语言模型开发框架图像
AI 解读 由 AI 自动生成,仅供参考

AgentVerse 是一个专为部署多个大语言模型(LLM)智能体而设计的开源框架,旨在让 AI 智能体从“单兵作战”走向“团队协作”。它主要解决了复杂任务中单个模型能力有限、难以模拟真实多角色互动环境的痛点。

该工具核心提供两大功能框架:一是“任务求解”,能将多个智能体组装成自动化系统,通过分工协作完成软件开发、专业咨询等复杂工作;二是“环境仿真”,允许用户自定义场景,观察或与多个智能体进行互动,适用于游戏开发及社会行为研究。

AgentVerse 非常适合 AI 开发者、研究人员以及希望探索多智能体协同应用的技术团队使用。其独特亮点在于灵活的双架构设计,既支持构建高效的任务解决系统,又能搭建高自由度的仿真沙盒。此外,项目代码规范严谨,拥有活跃的社区支持,并已被顶级学术会议 ICLR 2024 收录,甚至获得了 NVIDIA 官方博客的推荐,是进入多智能体应用开发领域的可靠选择。

使用场景

某初创游戏工作室希望快速构建一个包含多名 NPC 的开放世界社交模拟环境,以测试玩家与 AI 角色的互动逻辑。

没有 AgentVerse 时

  • 开发者需手动编写大量样板代码来管理多个 LLM 实例间的消息路由与状态同步,开发周期长达数周。
  • 难以模拟复杂的群体动态,如“囚徒困境”或课堂讨论,每次调整角色性格或环境规则都需要重构底层通信逻辑。
  • 缺乏标准化的仿真框架,导致不同场景(如游戏 vs 社会行为研究)的代码无法复用,维护成本极高。
  • 调试多智能体协作过程如同“黑盒”,无法直观观察个体决策链条及相互影响的演化过程。

使用 AgentVerse 后

  • 利用其内置的仿真(Simulation)框架,开发者仅需配置少量参数即可部署多智能体环境,将原型验证时间缩短至几天。
  • 直接调用预置的社会行为模板(如 NLP 课堂或博弈论场景),灵活定制角色人设与环境规则,无需重复造轮子。
  • 通过统一的任务解决(Task-solving)与仿真双架构,同一套代码库可轻松迁移于游戏开发与社会科学研究之间。
  • 提供可视化的交互日志与行为追踪,让研究人员能清晰复盘每个智能体的决策依据及群体涌现现象。

AgentVerse 通过标准化的多智能体协作框架,将复杂的群体仿真从“手工定制”转变为“模块化部署”,极大降低了多 LLM 应用的研究与落地门槛。

运行环境要求

操作系统
  • 未说明
GPU

未说明(支持本地大模型如 LLaMA、Vicuna,暗示可能需要 GPU,但未明确具体型号或显存要求)

内存

未说明

依赖
notes1. 项目包含模拟(Simulation)和任务解决(Task-solving)两种框架,目前代码正在重构中,若需稳定的纯模拟框架版本请使用 release-0.1 分支。 2. 部分演示(如 Pokemon 游戏)需要安装 Node.js (推荐 v20.0.0) 和 npm (测试版本@9.6.4) 来构建前端界面。 3. 支持接入本地大模型(如 LLaMA, Vicuna),可通过 FastChat 或 vLLM 部署本地服务后在配置文件中修改接入。 4. 运行某些示例需要配置 OpenAI API Key 和组织 ID。
python3.9+
openai
uvicorn
npm (用于前端构建)
node.js (推荐 v20.0.0)
FastChat (可选,用于本地模型服务)
vLLM (可选,用于加速推理)
AgentVerse hero image

快速开始

🤖 AgentVerse 🪐

许可证:Apache2 Python版本 构建 代码风格:Black HuggingFace Discord

论文

【英文 | 中文

AgentVerse 旨在促进多种基于大模型的智能体在不同应用场景中的部署。AgentVerse 主要提供两种框架:任务解决仿真

  • 任务解决:该框架将多个智能体组合成一个自动化的多智能体系统(AgentVerse-Tasksolving, 多智能体系统),协同完成相应任务。
    应用:软件开发系统、咨询系统等。

屏幕截图 2023-09-01 下午12:08:57

  • 仿真:该框架允许用户设置自定义环境,以观察或与多个智能体进行交互。⚠️⚠️⚠️ 我们正在重构代码。如果您需要仅支持仿真框架的稳定版本,可以使用 release-0.1 分支。应用:游戏、基于大模型的智能体社会行为研究等。

屏幕截图 2023-10-16 下午10:53:49


📰 最新动态

  • [2024年3月17日] AgentVerse 被 NVIDIA 博客介绍——构建您的第一个大模型智能体应用

  • [2024年1月17日] 我们非常激动地宣布,我们的论文已被 ICLR 2024 接受。更多更新即将发布!

  • [2023年10月17日] 我们很高兴地分享我们的开源 AI 社区 Hugging Face 页面:AgentVerse。您可以通过自己的 OpenAI API 密钥和组织信息,试用两个仿真应用:NLP 教室和囚徒困境。尽情体验吧!

  • [2023年10月5日] 我们重新架构了代码库,以支持仿真和任务解决两大框架!我们已将论文中提到的 Minecraft 示例代码放置在 minecraft 分支中。我们的工具使用示例也将很快更新到 main 分支。敬请期待!

  • [2023年8月22日] 我们很高兴地分享论文 AgentVerse:促进多智能体协作并探索智能体的涌现行为,详细阐述了 AgentVerse 的任务解决框架。

  • [2023年6月5日] 我们非常高兴地展示了多组【演示视频】,包括【NLP 教室】、【囚徒困境】、【软件设计】、【数据库管理员】以及一个简单的【H5 宝可梦游戏】,让您能够与宝可梦角色互动!快来试试这些演示,享受乐趣吧!

  • [2023年5月1日] 🚀 【AgentVerse】(https://github.com/OpenBMB/AgentVerse)正式上线!

🗓 即将到来

目录

🚀 入门指南

安装

手动安装(推荐!)

请确保您已安装 Python >= 3.9

git clone https://github.com/OpenBMB/AgentVerse.git --depth 1
cd AgentVerse
pip install -e .

如果您希望使用 AgentVerse 运行本地模型,例如 LLaMA,还需要额外安装一些依赖:

pip install -r requirements_local.txt

通过 pip 安装

或者您也可以通过 pip 安装:

pip install -U agentverse

环境变量

您需要按照以下方式导出您的 OpenAI API 密钥:

# 导出您的 OpenAI API 密钥
export OPENAI_API_KEY="your_api_key_here"

如果您想使用 Azure OpenAI 服务,请按照如下方式导出您的 Azure OpenAI 密钥和 OpenAI API 基础地址:

export AZURE_OPENAI_API_KEY="your_api_key_here"
export AZURE_OPENAI_API_BASE="your_api_base_here"

仿真

脚本所需模块

- agentverse 
  - agents
    - simulation_agent
  - environments
    - simulation_env

CLI 示例

您可以创建我们提供的多智能体环境。以课堂场景为例,在这个场景中,有九个智能体,其中一位扮演教授,另外八位扮演学生。

agentverse-simulation --task simulation/nlp_classroom_9players

GUI 示例

我们还为该环境提供了一个本地网站演示。您可以通过以下命令启动它:

agentverse-simulation-gui --task simulation/nlp_classroom_9players

成功启动本地服务器后,您可以访问 http://127.0.0.1:7860/ 查看课堂环境。

如果您想运行带有工具的仿真案例(例如 simulation/nlp_classroom_3players_withtool),则需要按照如下步骤安装 BMTools:

git clone git+https://github.com/OpenBMB/BMTools.git
cd BMTools
pip install -r requirements.txt
python setup.py develop

这是可选的。如果您不安装 BMTools,没有工具的仿真案例仍然可以正常运行。

任务求解

框架所需模块

- agentverse 
  - agents
    - simulation_env
  - environments
    - tasksolving_env

CLI 示例

要运行我们在 论文 中提出的任务求解环境中的实验,您可以使用以下命令:

要在基准数据集上运行 AgentVerse,您可以尝试:

# 使用 gpt-3.5-turbo 运行 Humaneval 基准测试(配置文件 `agentverse/tasks/tasksolving/humaneval/gpt-3.5/config.yaml`)
agentverse-benchmark --task tasksolving/humaneval/gpt-3.5 --dataset_path data/humaneval/test.jsonl --overwrite

要针对特定问题运行 AgentVerse,您可以尝试:

# 运行单个查询(配置文件 `agentverse/tasks/tasksolving/brainstorming/gpt-3.5/config.yaml`)。任务在配置文件中指定。
agentverse-tasksolving --task tasksolving/brainstorming

要运行我们论文中提到的使用工具的案例,即多智能体使用网络浏览器、Jupyter Notebook、必应搜索等工具解决问题时,您可以先构建由 XAgent 提供的 ToolsServer。您可以按照他们的说明来构建并运行 ToolServer。

构建并启动 ToolServer 后,您可以使用以下命令运行带工具的任务求解案例:

agentverse-tasksolving --task tasksolving/tool_using/24point

我们在 agentverse/tasks/tasksolving/tool_using/ 中提供了更多任务,展示了多智能体如何利用工具解决问题。

此外,您还可以查看 agentverse/tasks/tasksolving,了解我们在论文中进行的更多实验。

本地模型支持

vLLM 支持

如果您想使用 vLLM,请按照此处的指南安装并设置 vLLM 服务器,用于处理更大的推理工作负载。创建以下环境变量以连接到 vLLM 服务器:

export VLLM_API_KEY="your_api_key_here"
export VLLM_API_BASE="http://your_vllm_url_here"

然后修改任务配置文件中的 model 字段,使其与 vLLM 服务器中的模型名称一致。例如:

model_type: vllm
model: llama-2-7b-chat-hf

FSChat 支持

本节提供将 FSChat 集成到 AgentVerse 的分步指南。FSChat 是一个支持本地模型(如 LLaMA、Vicunna 等)在本地机器上运行的框架。

1. 安装额外依赖

如果您想使用 LLaMA 等本地模型,还需要额外安装一些依赖:

pip install -r requirements_local.txt

2. 启动本地服务器

然后根据您的需求修改 MODEL_PATHMODEL_NAME,使用以下命令启动本地服务器:

bash scripts/run_local_model_server.sh

该脚本将启动一个服务于 Llama 7B 对话模型的服务。 目前,AgentVerse 中的 MODEL_NAME 支持多种模型,包括 llama-2-7b-chat-hfllama-2-13b-chat-hfllama-2-70b-chat-hfvicuna-7b-v1.5vicuna-13b-v1.5。如果您希望集成其他与 FastChat 兼容的模型(详见 FastChat 的模型支持文档),则需要:

  1. 将新的 MODEL_NAME 添加到 agentverse/llms/__init__.py 文件中的 LOCAL_LLMS 列表中。此外,还需建立
  2. agentverse/llms/__init__.py 文件中的 LOCAL_LLMS_MAPPING 中添加新 MODEL_NAME 与其对应的 HuggingFace 标识符之间的映射关系。

3. 修改配置文件

在你的配置文件中,将 llm_type 设置为 local,并将 model 设置为 MODEL_NAME。例如:

llm:
  llm_type: local
  model: llama-2-7b-chat-hf
  ...

你可以参考 agentverse/tasks/tasksolving/commongen/llama-2-7b-chat-hf/config.yaml 获取更详细的示例。

AgentVerse 展示案例

模拟展示案例

请参阅 模拟展示案例

任务解决展示案例

请参阅 任务解决展示案例

🌟 加入我们!

AgentVerse 的使命是彻底革新大型语言模型的多智能体环境,我们热切期待充满热情的合作者加入我们,共同开启这段激动人心的旅程。

领导团队

Leader Leader

贡献者

Contributor Contributor Contributor Contributor Contributor Contributor Contributor Contributor Contributor Contributor Contributor Contributor

你能如何贡献?

  • 提交问题与拉取请求:如果您在使用 AgentVerse 时遇到任何问题,欢迎用英文提交问题。此外,您也可以主动联系我们,将问题分配给您,并在解决问题后提交拉取请求(请遵循 PULL_REQUEST_TEMPLATE)。

  • 代码开发:如果您是一名工程师,请帮助我们完善、优化和扩展当前的框架。我们始终欢迎有才华的开发者加入,共同增强现有功能并开发新模块。

  • 文档与教程:如果您擅长写作,欢迎您协助改进我们的文档、编写教程或撰写博客文章,使 AgentVerse 对更广泛的社区更加友好易用。

  • 应用探索:如果您对多智能体应用充满兴趣,并渴望使用 AgentVerse 进行实验,我们将非常乐意支持您的探索之旅,期待看到您的成果!

  • 反馈与建议:请积极使用 AgentVerse,并向我们提供反馈。您的宝贵意见将有助于我们不断改进,确保框架始终保持行业领先水平。

此外,如果您热衷于推动多智能体应用领域的前沿发展,希望成为 AgentVerse 核心团队成员,或渴望深入研究智能体相关技术,请随时联系 AgentVerse 团队,并抄送 陈伟泽苏宇生。我们诚挚地欢迎像您这样充满热情的伙伴加入我们的团队!

社交媒体与社区

星标历史

星标历史图表

引用

如果您觉得本仓库对您有所帮助,欢迎引用我们:

@article{chen2023agentverse,
  title={Agentverse: Facilitating multi-agent collaboration and exploring emergent behaviors in agents},
  author={Chen, Weize and Su, Yusheng and Zuo, Jingwei and Yang, Cheng and Yuan, Chenfei and Qian, Chen and Chan, Chi-Min and Qin, Yujia and Lu, Yaxi and Xie, Ruobing and others},
  journal={arXiv preprint arXiv:2308.10848},
  year={2023}
}

联系方式

AgentVerse 团队:agentverse2@gmail.com

项目负责人:

版本历史

v0.1.8.12023/10/27
v0.1.82023/10/12
v0.1.52023/10/10

常见问题

相似工具推荐

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。

162.1k|★★★☆☆|今天
开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上

139k|★★☆☆☆|今天
开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。

107.7k|★★☆☆☆|2天前
开发框架图像Agent

NextChat

NextChat 是一款轻量且极速的 AI 助手,旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性,以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发,NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。 这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言,它也提供了便捷的自托管方案,支持一键部署到 Vercel 或 Zeabur 等平台。 NextChat 的核心亮点在于其广泛的模型兼容性,原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型,让用户在一个界面即可自由切换不同 AI 能力。此外,它还率先支持 MCP(Model Context Protocol)协议,增强了上下文处理能力。针对企业用户,NextChat 提供专业版解决方案,具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能,满足公司对数据隐私和个性化管理的高标准要求。

87.6k|★★☆☆☆|今天
开发框架语言模型

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程,旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周,包含 26 节精炼课程和 52 道配套测验,内容涵盖从基础概念到实际应用的完整流程,有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。 无论是希望转型的开发者、需要补充算法背景的研究人员,还是对人工智能充满好奇的普通爱好者,都能从中受益。课程不仅提供了清晰的理论讲解,还强调动手实践,让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持,通过自动化机制提供了包括简体中文在内的 50 多种语言版本,极大地降低了全球不同背景用户的学习门槛。此外,项目采用开源协作模式,社区活跃且内容持续更新,确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路,ML-For-Beginners 将是理想的起点。

85k|★★☆☆☆|今天
图像数据工具视频

ragflow

RAGFlow 是一款领先的开源检索增强生成(RAG)引擎,旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体(Agent)能力相结合,不仅支持从各类文档中高效提取知识,还能让模型基于这些知识进行逻辑推理和任务执行。 在大模型应用中,幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构(如表格、图表及混合排版),显著提升了信息检索的准确度,从而有效减少模型“胡编乱造”的现象,确保回答既有据可依又具备时效性。其内置的智能体机制更进一步,使系统不仅能回答问题,还能自主规划步骤解决复杂问题。 这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统,还是致力于探索大模型在垂直领域落地的创新者,都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口,既降低了非算法背景用户的上手门槛,也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目,它正成为连接通用大模型与行业专有知识之间的重要桥梁。

77.1k|★★★☆☆|2天前
Agent图像开发框架