NeMo-Agent-Toolkit

2.2k 608 简单 1 次阅读今天Apache-2.0开发框架Agent

AI 解读由 AI 自动生成，仅供参考

NeMo-Agent-Toolkit 是英伟达推出的一款开源库，旨在高效连接并优化由多个 AI 智能体组成的协作团队。它主要解决了智能体在从开发走向生产环境时面临的性能瓶颈、可观测性不足以及跨框架集成困难等问题，帮助开发者提升智能体团队的响应速度、决策准确性和整体运行效率。

这款工具特别适合正在构建复杂多智能体系统的 AI 工程师、研究人员及企业开发者使用。无论您使用的是 LangChain、CrewAI 还是其他主流框架，NeMo-Agent-Toolkit 都能无缝集成，提供企业级的监控与优化能力。

其技术亮点包括“动态运行时智能”，能自动推断请求的延迟敏感度并优化资源调度；以及“智能体性能原语（APP）”，支持并行执行和推测性分支，显著加速基于图结构的智能体工作流。此外，它还原生集成了 LangSmith 用于全链路追踪与评估，并支持通过 FastMCP 快速发布工作流。通过提供持续的自我学习与优化机制，NeMo-Agent-Toolkit 让构建高可靠、高性能的 AI 智能体团队变得更加简单直观。

使用场景

某电商平台的智能客服团队正在构建一个由多个 AI 代理组成的复杂系统，分别负责意图识别、订单查询、退换货策略制定及最终回复生成，以应对大促期间的高并发咨询。

没有 NeMo-Agent-Toolkit 时

协作效率低下：不同框架（如 LangChain 和 CrewAI）开发的代理之间缺乏统一调度，串行执行导致用户平均等待时间超过 8 秒。
故障定位困难：当回答出现错误时，开发者无法追踪具体是哪个代理节点或哪次工具调用出了问题，排查需耗费数小时。
资源浪费严重：系统无法区分紧急与非紧急请求，所有任务同等排队，导致高优先级 VIP 客户体验受损。
优化缺乏依据：缺少细粒度的性能画像，团队只能凭经验盲目调整参数，难以实现针对性的加速。

使用 NeMo-Agent-Toolkit 后

并行加速执行：利用 Agent Performance Primitives (APP) 实现跨框架的并行执行与推测性分支，将响应延迟从 8 秒降至 1.5 秒以内。
全链路可观测：通过原生集成的 LangSmith 追踪，开发者能清晰看到每个代理的思考路径与工具调用详情，故障定位缩短至分钟级。
智能动态路由：Dynamo 运行时智能体自动识别请求的延迟敏感度，优先处理 VIP 客户的紧急诉求，显著提升服务满意度。
数据驱动迭代：基于详细的性能基线数据，团队可精准优化瓶颈节点，并持续评估不同提示词版本的生产效果。

NeMo-Agent-Toolkit 通过企业级的可观测性与智能调度能力，将松散的 AI 代理团队转化为高效、透明且可进化的生产级智能系统。

运行环境要求

操作系统

未说明

GPU

未说明 (工具主要作为编排层，具体 GPU 需求取决于后端调用的 NVIDIA NIM 模型或本地部署的 LLM)

内存

未说明

依赖

notes1. 必须设置 NVIDIA_API_KEY 环境变量以使用 NVIDIA NIMs 服务。2. 运行示例代码需从源码克隆仓库。3. 支持通过 pip 安装可选依赖（如 nvidia-nat[langchain]）来集成不同框架。4. 该工具主要用于代理编排、观测和优化，计算负载通常卸载到云端 NIM 或本地独立模型服务。

python3.11, 3.12, 3.13

nvidia-nat (核心包)

LangChain (可选插件)

LlamaIndex (可选插件)

CrewAI (可选插件)

Microsoft Semantic Kernel (可选插件)

Google ADK (可选插件)

NVIDIA Dynamo (可选集成)

FastMCP (可选集成)

快速开始

NVIDIA NeMo Agent Toolkit

NVIDIA NeMo Agent Toolkit 为跨任何框架的 AI 代理注入智能——通过企业级监控、可观测性和持续学习，提升速度、准确性和决策能力。

🔥 新特性

Dynamo 运行时智能： 自动从代理配置文件中推断每条请求的延迟敏感度，并应用运行时提示来控制缓存、进行负载感知路由以及优先级感知服务。
代理性能原语 (APP)： 引入与框架无关的性能原语，通过并行执行、推测性分支和节点级优先级路由，加速基于图的代理框架，如 LangChain、CrewAI 和 Agno。
LangSmith 原生集成： 使用原生 LangSmith 跟踪功能观察端到端代理执行过程，运行评估实验、比较结果，并在开发和生产工作流中管理提示版本。
FastMCP 工作流发布： 使用 FastMCP 服务器运行时将 NeMo Agent Toolkit 工作流发布为 MCP 服务器，从而简化基于 MCP 的部署和集成。
迁移通知： 1.5.0 版本简化了软件包安装和依赖管理。请参阅迁移指南。

✨ 核心功能

🛠️ 构建智能体：通过工具加速智能体开发，让您的智能体更快投入生产。
- 🧩 框架无关性： 可与各类智能体框架无缝协作，添加必要的观测、性能分析和优化工具。该工具包支持主流框架，如 LangChain、LlamaIndex、CrewAI、Microsoft Semantic Kernel 和 Google ADK 等，同时也兼容企业自定义的智能体框架及简单的 Python 智能体。
- 🔁 可复用性： 组件只需构建一次，即可多次使用，从而最大化开发投入的价值。
- ⚡ 可定制性： 您可以从预构建的智能体、工具或工作流入手，根据需求进行个性化调整。
- 💬 内置用户界面： 使用 NeMo Agent Toolkit 的 UI 聊天界面与您的智能体交互，可视化输出结果，并调试工作流。
📈 智能体洞察：借助 NeMo Agent Toolkit 的监控工具，深入理解智能体在运行时的行为。
- 📊 性能分析： 从智能体层面到单个 token 层面，全面剖析整个工作流，识别瓶颈、分析 token 效率，并指导开发者优化智能体。
- 🔎 可观测性： 跟踪性能、追踪执行流程，深入了解智能体在生产环境中的行为。
🚀 智能体优化：提供贯穿智能体生命周期各阶段的工具集，帮助您提升智能体的质量、准确性和性能。
- 🧪 评估系统： 通过一系列离线评估工具，验证并持续保持智能体工作流的准确性。
- 🎯 超参数与提示词优化器： 自动识别最佳配置和提示词，确保您充分利用智能体的能力。
- 🧠 基于强化学习的微调： 针对您的智能体专门微调大语言模型，并将关于工作流的内在信息直接融入模型中。
- ⚡ NVIDIA Dynamo 集成： 结合 Dynamo 和 NeMo Agent Toolkit，在大规模场景下提升智能体性能。
- ⚙️ 智能体性能原语 (APP)： 通过并行执行、推测性分支和节点级优先路由，加速基于图结构的智能体框架，如 LangChain、CrewAI 和 Agno。
🔌 协议支持：集成用于构建智能体的常用协议。
- 🔗 模型上下文协议 (MCP)： 将 MCP 工具集成到您的智能体中，或将您的工具和智能体作为 MCP 服务器提供给他人使用。
- 🤝 智能体间通信协议 (A2A)： 构建分布式智能体团队，并提供完整的身份验证支持。

借助 NeMo Agent Toolkit，您可以快速推进项目、自由实验，并确保所有智能体驱动型项目的可靠性。

🚀 安装

在开始使用 NeMo Agent Toolkit 之前，请确保您的系统已安装 Python 3.11、3.12 或 3.13。

[!注意] 如果您想运行示例代码，需要克隆仓库并从源码安装，以获取运行示例所需的文件。更多信息请参阅示例文档。

要从 PyPI 安装最新稳定版的 NeMo Agent Toolkit，请运行以下命令：

pip install nvidia-nat

NeMo Agent Toolkit 还有许多可选依赖项，可随核心包一起安装。这些可选依赖项按框架分组。例如，要安装 LangChain/LangGraph 插件，请运行：

pip install "nvidia-nat[langchain]"

详细的安装说明，包括所有可选依赖项及其冲突信息，可在安装指南中找到。

🌟 Hello World 示例

在开始之前，您无需任何设置即可在 Google Colab 中运行此简单工作流及其他多个示例。点击此处打开入门笔记本：。

确保已设置 NVIDIA_API_KEY 环境变量，以便示例能够使用 NVIDIA NIM 模型。您可以通过访问 build.nvidia.com 并创建账户来获取 API 密钥。
```
export NVIDIA_API_KEY=<your_api_key>
```

创建 NeMo Agent Toolkit 工作流配置文件。该文件将定义示例中使用的智能体、工具和工作流。将以下内容保存为 workflow.yml：

functions:
   # 添加一个用于搜索维基百科的工具
   wikipedia_search:
      _type: wiki_search
      max_results: 2

llms:
   # 指定 NeMo Agent Toolkit 使用哪个 LLM 作为智能体的基础模型
   nim_llm:
      _type: nim
      model_name: nvidia/nemotron-3-nano-30b-a3b
      temperature: 0.0
      chat_template_kwargs:
         enable_thinking: false

workflow:
   # 使用一个“推理”并“行动”的智能体
   _type: react_agent
   # 授予其访问维基百科搜索工具的权限
   tool_names: [wikipedia_search]
   # 指定使用的 LLM
   llm_name: nim_llm
   # 设置为详细模式
   verbose: true
   # 允许最多重试 3 次
   parse_agent_response_max_retries: 3

使用 nat CLI 和 workflow.yml 文件运行 Hello World 示例。

nat run --config_file workflow.yml --input "列出土豚的五个亚种"

这将运行工作流，并将结果输出到控制台。

工作流结果：
['以下是土豚的五个亚种：\n\n1. Orycteropus afer afer（南方土豚）\n2. O. a. adametzi Grote, 1921（西方土豚）\n3. O. a. aethiopicus Sundevall, 1843\n4. O. a. angolensis Zukowsky & Haltenorth, 1957\n5. O. a. erikssoni Lönnberg, 1906']

📚 其他资源

📖 文档：浏览 NeMo Agent Toolkit 的完整文档。
🧭 入门指南：设置您的环境并开始使用 NeMo Agent Toolkit 进行开发。
🤝 贡献指南：了解如何为 NeMo Agent Toolkit 做出贡献，并配置您的开发环境。
🧪 示例：探索位于源代码仓库 examples 目录中的 NeMo Agent Toolkit 工作流示例。
🛠️ 创建和自定义 NeMo Agent Toolkit 工作流：学习如何创建和自定义 NeMo Agent Toolkit 工作流。
🎯 使用 NeMo Agent Toolkit 进行评估：了解如何评估您的 NeMo Agent Toolkit 工作流。
🆘 故障排除：获取常见问题的解决方法。

🛣️ 路线图

自动强化学习 (RL)，用于针对特定智能体微调大语言模型。
与 NVIDIA Dynamo 集成，以在大规模场景下降低大语言模型的延迟。
通过 KV 缓存优化提升智能体吞吐量。
改进独立的评估框架，并将轨迹格式迁移到 ATIF。
支持更多编程语言（TypeScript、Rust、Go、WASM），并提供编译后的库。
逐步淘汰封装架构，以简化更多智能体的接入流程。
支持向现有智能体添加技能和沙盒环境。
改进 MCP 认证机制。
完善内存接口，以支持自我改进型智能体。

💬 反馈

我们非常期待您的反馈！如果您有任何意见或功能请求，请在 GitHub 上提交 issue。

🤝 致谢

我们感谢以下组织对本工具包的贡献：

Synopsys
- 提供 Google ADK 框架支持。
- 提供 Microsoft AutoGen 框架支持。
W&B Weave 团队
- 为评估和遥测系统做出贡献。

此外，我们还要感谢以下开源项目，正是它们的支持才使得 NeMo Agent Toolkit 成为可能：

NVIDIA NeMo Agent Toolkit 快速上手指南

NVIDIA NeMo Agent Toolkit 是一个企业级 AI 智能体开发工具包，旨在为任何框架下的 AI 智能体增强速度、准确性和决策能力。它提供了框架无关的集成、性能分析、可观测性以及自动优化功能。

环境准备

在开始之前，请确保您的系统满足以下要求：

操作系统：Linux, macOS 或 Windows (WSL 推荐)
Python 版本：3.11, 3.12 或 3.13
API Key：需要 NVIDIA API Key 以使用 NVIDIA NIMs 模型。请访问 build.nvidia.com 注册账号并获取密钥。

注意：如果您希望运行官方提供的完整示例代码，建议克隆仓库并从源码安装，以获取必要的配置文件和资源。

安装步骤

1. 安装核心包

使用 pip 安装最新稳定版本：

pip install nvidia-nat

2. 安装可选依赖（按需）

NeMo Agent Toolkit 支持多种主流智能体框架（如 LangChain, CrewAI 等）。您可以根据需要安装特定插件。例如，安装 LangChain/LangGraph 插件：

pip install "nvidia-nat[langchain]"

其他支持的框架依赖可通过 [crewai], [llamaindex] 等后缀进行安装。

基本使用

以下是一个最简单的"Hello World"示例，展示如何配置并运行一个基于 ReAct 模式的智能体，使其能够搜索维基百科。

第一步：设置环境变量

在终端中导出您的 NVIDIA API Key：

export NVIDIA_API_KEY=<your_api_key>

第二步：创建工作流配置文件

创建一个名为 workflow.yml 的文件，定义智能体使用的工具、大模型及工作流逻辑：

functions:
   # 添加一个搜索维基百科的工具
   wikipedia_search:
      _type: wiki_search
      max_results: 2

llms:
   # 指定智能体使用的大模型
   nim_llm:
      _type: nim
      model_name: nvidia/nemotron-3-nano-30b-a3b
      temperature: 0.0
      chat_template_kwargs:
         enable_thinking: false

workflow:
   # 使用具备“推理”和“行动”能力的 ReAct 智能体
   _type: react_agent
   # 赋予其访问维基百科搜索工具的权限
   tool_names: [wikipedia_search]
   # 指定使用的大模型
   llm_name: nim_llm
   # 开启详细输出模式
   verbose: true
   # 解析智能体响应时最多重试 3 次
   parse_agent_response_max_retries: 3

第三步：运行智能体

使用 nat 命令行工具加载配置文件并输入指令：

nat run --config_file workflow.yml --input "List five subspecies of Aardvarks"

预期输出： 智能体将调用工具进行搜索，并在控制台返回结果：

Workflow Result:
['Here are five subspecies of Aardvarks:\n\n1. Orycteropus afer afer (Southern aardvark)\n2. O. a. adametzi  Grote, 1921 (Western aardvark)\n3. O. a. aethiopicus  Sundevall, 1843\n4. O. a. angolensis  Zukowsky & Haltenorth, 1957\n5. O. a. erikssoni  Lönnberg, 1906']

更多高级功能（如性能分析、评估优化、MCP 协议集成等）请参考官方文档。

版本历史

v1.6.02026/04/10

v1.4.32026/03/14

v1.4.22026/03/13

v1.5.02026/03/12

v1.4.12026/02/09

v1.4.02026/02/03

v1.3.12025/11/07

v1.3.02025/10/24

v1.2.12025/08/20

v1.2.02025/08/19

v1.1.02025/05/16

v1.0.02025/03/18

v1.0.0-rc82025/03/16

常见问题

在 Python 3.11 版本下运行 `nat serve` 时遇到 "Runner.run() cannot be called from a running event loop" 错误，如何解决？

使用 Weave 进行评估（`nat eval`）时，为什么评估结果无法记录到 Weave 的 Evaluations 仪表板，且日志中出现 `SecretStr` 序列化错误？

如何在 `aiq run` 或 UI 中传递自定义输入变量供工具使用？

运行 `nat serve` 时出现 "'FastApiFrontEndPlugin' object has no attribute '_dask_client'" 错误是什么原因？

如何优化 CodeRabbit 配置以减少 PR 审查中的噪音并提高对 Agent 逻辑的检查质量？

NAT (NeMo Agent Toolkit) 支持哪些 Python 版本？

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

★ 349.3k|★★★☆☆|1周前

Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|1周前

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 160k|★★☆☆☆|今天

开发框架Agent语言模型

opencode

OpenCode 是一款开源的 AI 编程助手（Coding Agent），旨在像一位智能搭档一样融入您的开发流程。它不仅仅是一个代码补全插件，而是一个能够理解项目上下文、自主规划任务并执行复杂编码操作的智能体。无论是生成全新功能、重构现有代码，还是排查难以定位的 Bug，OpenCode 都能通过自然语言交互高效完成，显著减少开发者在重复性劳动和上下文切换上的时间消耗。这款工具专为软件开发者、工程师及技术研究人员设计，特别适合希望利用大模型能力来提升编码效率、加速原型开发或处理遗留代码维护的专业人群。其核心亮点在于完全开源的架构，这意味着用户可以审查代码逻辑、自定义行为策略，甚至私有化部署以保障数据安全，彻底打破了传统闭源 AI 助手的“黑盒”限制。在技术体验上，OpenCode 提供了灵活的终端界面（Terminal UI）和正在测试中的桌面应用程序，支持 macOS、Windows 及 Linux 全平台。它兼容多种包管理工具，安装便捷，并能无缝集成到现有的开发环境中。无论您是追求极致控制权的资深极客，还是渴望提升产出的独立开发者，OpenCode 都提供了一个透明、可信

★ 144.3k|★☆☆☆☆|2天前

Agent插件

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 109.2k|★★☆☆☆|今天

开发框架图像Agent

gemini-cli

gemini-cli 是一款由谷歌推出的开源 AI 命令行工具，它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言，它提供了一条从输入提示词到获取模型响应的最短路径，无需切换窗口即可享受智能辅助。这款工具主要解决了开发过程中频繁上下文切换的痛点，让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用，还是执行复杂的 Git 操作，gemini-cli 都能通过自然语言指令高效处理。它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口，具备出色的逻辑推理能力；内置 Google 搜索、文件操作及 Shell 命令执行等实用工具；更独特的是，它支持 MCP（模型上下文协议），允许用户灵活扩展自定义集成，连接如图像生成等外部能力。此外，个人谷歌账号即可享受免费的额度支持，且项目基于 Apache 2.0 协议完全开源，是提升终端工作效率的理想助手。

★ 100.8k|★★☆☆☆|1周前

插件Agent图像