agentstack
Agent Stack 是一个开源基础设施,旨在帮助开发者在几分钟内将 AI 智能体(Agents)转化为可实际运行的服务。它解决了传统开发中部署流程繁琐、需从零搭建后端架构以及容易被特定厂商锁定的痛点,让用户能够轻松地将本地开发的智能体通过 HTTP 接口集成到应用中,或直接作为独立服务发布。
这款工具特别适合希望快速落地 AI 功能的软件工程师、全栈开发者以及技术团队。无论是构建原型还是生产环境部署,Agent Stack 都能提供从代码到服务的“快车道”。其核心技术亮点包括:支持 LangGraph、CrewAI 等多种主流框架且无需重写代码;内置对 15+ 大模型提供商的路由支持、向量存储及文档处理能力;基于 Linux 基金会托管的 Agent2Agent (A2A) 协议,确保跨平台互操作性与数据主权。此外,它还提供了完善的 CLI 工具、Kubernetes 部署方案及安全认证机制,让智能体的管理、扩展和协作变得简单高效,真正实现开放、自由且可控的 AI 应用构建。
使用场景
某电商初创团队急需将内部开发的“智能客服代理”从本地原型转化为可对外服务的生产级 API,以集成到现有的订单管理系统中。
没有 agentstack 时
- 部署架构从零搭建:团队需自行编写 Docker 配置、K8s 脚本及负载均衡策略,耗时数周才能构建出稳定的运行环境。
- 厂商锁定风险高:硬编码了特定云厂商的向量数据库和密钥管理服务,导致后续迁移成本极高,无法灵活切换 LLM 提供商。
- 多框架集成困难:由于客服代理分别基于 LangGraph 和 CrewAI 开发,缺乏统一协议,难以让不同代理之间进行标准化通信。
- 安全与存储缺失:缺乏现成的 OAuth 认证机制和 S3 兼容的文件存储服务,处理用户上传的订单截图时需额外开发大量胶水代码。
使用 agentstack 后
- 分钟级服务发布:利用内置的 Agent Runtime 和 Helm Chart,直接将现有代理包装为 HTTP 服务,半天内即可完成从本地到生产环境的部署。
- 基础设施完全解耦:基于 A2A 协议和开源架构,团队可自由在 Ollama、Anthropic 等 15+ 模型提供商间切换,彻底摆脱供应商绑定。
- 无缝框架互通:agentstack 自动将不同框架编写的代理暴露为统一的 A2A 接口,实现了跨代理的标准化调用与协作。
- 开箱即用的企业级能力:直接启用内置的 OAuth 认证、密钥管理及 Docling 文档提取功能,无需重复造轮子即可安全处理用户文件。
agentstack 通过提供标准化的开放基础设施,让开发者能专注于代理逻辑本身,而非繁琐的运维架构,真正实现了 AI 代理从代码到生产服务的极速落地。
运行环境要求
- Linux
- macOS
- Windows (实验性支持)
未说明
未说明

快速开始
Agent Stack
开放的基础设施,可在几分钟内将AI智能体转化为可运行的服务。
构建智能体 → 将其作为服务运行 → 在您的应用中调用它们。
Agent Stack 是一个开放的基础设施,可在几分钟内将 AI 智能体转化为可运行的服务。您可以在本地或自己的环境中运行智能体,通过 HTTP 将它们集成到您的应用程序中,并在无需从头构建部署基础设施的情况下推出由智能体驱动的功能。Agent Stack 基于 Agent2Agent (A2A) 协议 构建,并由 Linux 基金会 托管,确保您不会被锁定在某个专有供应商的生态系统中。
如果您正在构建由智能体驱动的功能,或者希望让您的智能体脱离原型阶段投入实际使用,Agent Stack 可以通过提供 LLM 路由、向量存储、身份验证、文件处理、部署工具等开箱即用的功能,为您从代码到部署就绪的服务提供一条快速通道。
| 🎯 将智能体作为服务运行 | 通过 HTTP 公开智能体,供实际应用调用,并像其他后端服务一样进行访问 |
| 🔄 快速的本地开发循环 | 在本地启动智能体并快速迭代 |
| 🔧 无需重写智能体 | 包装现有智能体并按原样运行 |
| 🚀 部署就绪的架构 | 同样的智能体可以从本地环境迁移到部署环境 |
核心能力
| 组件 | 包含内容 |
|---|---|
| 智能体运行时 | - 自托管服务器,用于在生产环境中运行智能体 |
| LLM 和 AI 服务 | - 支持 15+ 提供商(Anthropic、OpenAI、watsonx.ai、Ollama 等)的 LLM 服务 - 用于 RAG 和语义搜索的嵌入和向量检索 |
| 智能体部署与管理 | - 用于部署、更新和管理智能体的 CLI |
| 存储与文档 | - 兼容 S3 的文件存储,用于上传和下载 - 通过 Docling 进行文档文本提取 |
| 接口与工具 | - 开箱即用的 Web UI,用于测试和分享智能体 - 客户端 SDK,用于构建自定义 UI 和应用程序 |
| 集成 | - 通过 MCP 协议实现外部集成(API、Slack、Google Drive 等),支持 OAuth |
| 安全 | - 用于 API 密钥和凭据的秘密管理 - 支持 OAuth,确保外部集成的安全性 |
| Agent Stack 部署 | - 适用于 Kubernetes 的 Helm Chart,支持自定义存储、数据库和身份验证 |
| 框架互操作性 | - 可使用 LangGraph、CrewAI 或您自己的框架构建智能体 - 所有智能体都会自动暴露为 A2A 兼容的智能体,以实现互操作性 - SDK 处理运行时服务请求和智能体之间的通信 |
注意: Agent Stack 提供了功能齐全的默认配置,以便您快速上手。每个组件都是模块化的,可以替换以集成到您组织现有的服务、提供商和基础设施中。
快速入门
安装
sh -c "$(curl -LsSf https://agentstack.beeai.dev/install.sh)"
[!TIP] 这条单行脚本适用于 Linux 和 macOS。如需手动设置或体验 Windows 支持,请参阅 快速入门指南。
使用
agentstack ui # 启动 Web 界面
agentstack list # 查看可用的智能体
agentstack run chat "Hi, who are you" # 向聊天智能体发送消息
agentstack run chat # 尝试交互模式
agentstack info chat # 查看智能体详情
agentstack --help # 查看所有选项
构建您的第一个智能体
git clone https://github.com/i-am-bee/agentstack-starter my-agent
cd my-agent
uv run server # 启动您的智能体
然后在另一个终端:
agentstack run example_agent "Alice" # 测试您的智能体
您应该会看到:“Ciao Alice!” 🎉
[!TIP] 请查看 构建智能体 ,获取创建您的第一个智能体的完整分步指南。
参考代理
展示 Agent Stack 核心功能的参考实现。
- Agent Stack 展示 - 全功能聊天助手,演示了 RequirementAgent 的条件化工具使用、网络搜索(DuckDuckGo)、高级推理(ThinkTool)、文件处理(PDF/CSV/JSON)、流式传输、UI 功能切换、轨迹日志记录以及引用提取。
- Serper 搜索代理 - 网络搜索代理,展示了运行时密钥管理(Secrets Extension)、自定义工具创建(SerperSearchTool)、查询词自动提取以及带引用的结构化结果。
- GitHub 问题编写器 - 单轮工作流,利用 Form Extension 进行多字段输入,结合 ThinkTool 实现 AI 增强的问题草拟,并进行 Markdown 格式化。
- 漏洞代理 - 单轮工作流,扫描 GitHub 仓库中的 Python 依赖项以查找已知漏洞,撰写修复问题并代表用户在 GitHub 仓库中提交。使用表单扩展、UI 功能、密钥管理、MCP 工具、轨迹日志记录和引用格式化。
- 聊天代理 - 多轮对话代理,采用 RequirementAgent、ActTool 进行推理序列处理,以及 ClarificationTool 处理模糊查询。集成 DuckDuckGo、Wikipedia、OpenMeteo 和文件工具,支持无约束内存、流式传输、引用提取及 OpenTelemetry 监控。
- 表单代理 - 单轮表单交互,使用 Form Extension 支持多种字段类型、可定制布局、文件上传、验证及结构化输出。
- RAG 代理 - 检索增强型生成代理,支持 12 种以上文件格式、动态向量存储、语义搜索(VectorSearchTool)、文档摘要(FileReaderTool)、智能工具选择以及包含文档 URL 的引用跟踪。
- 画布代理 - 多轮工件编辑,可选择并编辑特定部分。
- OAuth 代理 - OAuth Extension 示例,集成 MCP、基于浏览器的授权、安全令牌管理,并可访问 Stripe 的 MCP 服务器。
- 动态表单请求代理 - 多步骤表单工作流,同时展示静态与动态表单生成,代理会在对话过程中根据条件请求额外输入。
- 航班搜索与可视化代理 - 该代理通过 Kiwi.com 的 MCP API 查询航班结果,借助 Form Extension 请求缺失参数,并可选地使用地理空间辅助工具生成 PNG 或 HTML 路线可视化图。它使用 RequirementAgent 协调工具调用(数据验证和可视化),并以流式方式返回最终答案,附带生成的文件和引用。
- 医疗健康代理 - 专注于医疗健康的代理,能够发现并调用由 Agent Stack 管理的其他代理,具备多轮工作流、上下文管理、轨迹追踪和 UI 组件。
文档
访问 agentstack.beeai.dev 获取完整文档。
社区
Agent Stack 社区活跃于 GitHub Discussions,您可以在那里提问、提出想法并分享您的项目。
如需与其他社区成员交流,欢迎加入 Agent Stack 的 Discord 服务器。
请注意,我们的 行为准则 适用于所有 Agent Stack 社区渠道。我们强烈建议您阅读并遵守该准则。
维护者
有关维护者的信息,请参阅 MAINTAINERS.md。
贡献
我们始终欢迎并非常感谢对 Agent Stack 的贡献。在参与贡献之前,请先查阅我们的 贡献指南,以确保顺利体验。
特别感谢各位贡献者帮助我们不断改进 Agent Stack。
致谢
Agent Stack 建立在多个代理与协议生态系统中开创性项目所奠定的基础之上:
- Agent2Agent (A2A) 协议 - 开放标准,实现了跨框架的代理间通信
- 模型上下文协议 - 推动了 AI 模型与上下文交互的方式进步
我们感谢这些社区为推动代理基础设施与互操作性的进步所做出的贡献。
本项目由 BeeAI 项目的贡献者开发,是 Linux 基金会人工智能与数据计划 的一部分。其开发遵循开放、协作和社区驱动的原则。
版本历史
v0.7.12026/03/30v0.7.1-rc22026/03/30v0.6.22026/03/10v0.6.12026/02/10v0.5.22026/01/20v0.5.02026/01/07v0.4.32025/12/05v0.4.22025/12/01v0.4.12025/11/11v0.4.02025/11/04v0.3.72025/10/15v0.3.52025/10/03v0.3.42025/09/19v0.3.32025/09/09v0.3.22025/09/02v0.3.02025/08/25v0.2.202025/07/23v0.2.172025/07/18v0.2.152025/07/18beeai-cli-v0.2.142025/07/01常见问题
相似工具推荐
openclaw
OpenClaw 是一款专为个人打造的本地化 AI 助手,旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚,能够直接接入你日常使用的各类通讯渠道,包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息,OpenClaw 都能即时响应,甚至支持在 macOS、iOS 和 Android 设备上进行语音交互,并提供实时的画布渲染功能供你操控。 这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地,用户无需依赖云端服务即可享受快速、私密的智能辅助,真正实现了“你的数据,你做主”。其独特的技术亮点在于强大的网关架构,将控制平面与核心助手分离,确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者,以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力(支持 macOS、Linux 及 Windows WSL2),即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你
stable-diffusion-webui
stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。
everything-claude-code
everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上
ComfyUI
ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。
markitdown
MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具,专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片(含 OCR)、音频(含语音转录)、HTML 乃至 YouTube 链接等多种格式的解析,能够精准提取文档中的标题、列表、表格和链接等关键结构信息。 在人工智能应用日益普及的今天,大语言模型(LLM)虽擅长处理文本,却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点,它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式,成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外,它还提供了 MCP(模型上下文协议)服务器,可无缝集成到 Claude Desktop 等 LLM 应用中。 这款工具特别适合开发者、数据科学家及 AI 研究人员使用,尤其是那些需要构建文档检索增强生成(RAG)系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性,但其核心优势在于为机器
LLMs-from-scratch
LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目,旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型(LLM)。它不仅是同名技术著作的官方代码库,更提供了一套完整的实践方案,涵盖模型开发、预训练及微调的全过程。 该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型,却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码,用户能够透彻掌握 Transformer 架构、注意力机制等关键原理,从而真正理解大模型是如何“思考”的。此外,项目还包含了加载大型预训练权重进行微调的代码,帮助用户将理论知识延伸至实际应用。 LLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API,而是渴望探究模型构建细节的技术人员而言,这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计:将复杂的系统工程拆解为清晰的步骤,配合详细的图表与示例,让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础,还是为未来研发更大规模的模型做准备