agent-protocol

546 45 中等 2 次阅读今天MITAgent开发框架

AI 解读由 AI 自动生成，仅供参考

agent-protocol 致力于为大语言模型（LLM）代理的生产级服务建立一套通用的标准化接口。简单来说，它就像是为智能体应用制定的一套“交通规则”，定义了如何执行任务、管理多轮对话线程以及处理长期记忆。

在当前的开发环境中，不同框架间的交互标准往往不一致，导致集成复杂且难以维护。agent-protocol 通过明确“运行（Runs）”、“线程（Threads）”和“存储（Store）”三大核心模块，有效解决了多轮交互中的状态同步、历史记录追踪及并发控制难题。无论是短暂的一次性请求，还是复杂的持续对话场景，都能找到对应的 API 支持。

这套协议特别适合正在构建或部署 LLM 应用的开发者、系统架构师以及相关领域的研究人员。它提供了详尽的 OpenAPI 文档，并拥有 Python 和 JavaScript 的参考实现，帮助团队快速落地标准化的 Agent 服务，无需重复造轮子。

使用场景

某金融科技团队正在构建一款支持长期记忆的智能理财助手，需处理用户跨会话的投资偏好与复杂账户查询。

没有 agent-protocol 时

每个模型调用都需手写独立的接口逻辑，导致后端代码冗余且难以维护更新。
对话历史与用户状态分散在数据库各处，难以实现多轮上下文的精准关联与检索。
切换底层大模型时需重构整个后端架构，迁移成本高且容易引入新的系统 Bug。
缺乏统一的并发控制机制，高并发下容易出现同一会话的数据冲突或状态丢失。

使用 agent-protocol 后

agent-protocol 提供标准化的 Runs 和 Threads 接口，统一了所有 Agent 的执行入口与文档规范。
内置 Thread 管理功能，自动处理多轮对话的状态持久化、增量存储与历史版本回溯。
基于框架无关的规范，无缝替换不同厂商的大模型而不改动核心业务代码逻辑。
原生支持并发控制与状态锁，确保同一用户会话的操作安全有序且能应对高负载流量。

通过标准化接口大幅降低了 Agent 应用的开发与运维复杂度，让团队更专注于业务逻辑本身。

运行环境要求

操作系统

未说明

GPU

未说明

内存

未说明

依赖

notes本工具为 API 协议规范文档，定义了 LLM Agent 的生产环境接口标准，并非独立的模型推理引擎。提供的 Python Server Stubs 仅作为示例实现，实际硬件资源需求取决于具体部署的 Agent 应用框架（如 LangGraph）。

python未说明

pydantic>=2.0

fastapi

快速开始

Agent 协议

Agent Protocol 是我们尝试将用于在生产环境中服务 LLM 智能体的框架无关 API 进行规范化的努力。本文档解释了该协议的目的，并阐述了规范中每个端点的理由。最后，我们列出了一些未来的路线图项目。

查看完整的 OpenAPI 文档此处，查看 JSON 规范此处。

LangGraph 平台实现了该协议的超集，但我们非常欢迎社区的其他实现。

资源

Agent 协议 OpenAPI 文档
Agent 协议 JSON 规范
Agent 协议 Python 服务器存根 - 一个使用 Pydantic V2 和 FastAPI 的 Python 服务器，由 OpenAPI 规范自动生成
LangGraph.js API - 此协议的一个开源实现，用于 LangGraph.js 智能体，使用内存存储
LangGraph 平台 - 一个商业平台，实现了该协议的超集，用于在生产环境中部署任何 LLM 智能体

为什么需要 Agent 协议

什么是适合在生产环境中服务 LLM 应用程序的正确 API？我们相信它围绕 3 个重要概念构建：

Runs（运行）：执行智能体的 API
Threads（线程）：组织智能体多轮执行的 API
Store（存储）：处理长期记忆的 API

让我们深入探讨每一个，首先从需求开始，然后展示满足这些需求的协议端点。

无状态运行：一次性交互

在某些情况下，您可能希望在单个请求中创建线程并运行，并在运行结束后删除该线程。这对于短暂或无状态的交互很有用，在这些交互中您不需要跟踪线程的状态。

POST /runs/wait - 创建一个临时运行，并等待其最终输出，输出将在响应中返回。
POST /runs/stream - 创建一个临时运行，并按生产情况流式传输输出。

线程：多轮交互

您需要哪些 API 来启用多轮交互？

持久化状态
- 获取和更新状态
- 跟踪线程过去状态的历史，建模为状态的追加日志
- 通过仅存储状态之间的差异来优化存储
并发控制
- 确保同一时间每个线程只有一个运行处于活动状态
- 可自定义处理并发运行（中断、入队、中断或回滚）
线程的 CRUD 端点
- 按用户或其他元数据列出线程
- 按状态列出线程（空闲、已中断、出错、完成）
- 复制或删除线程

端点：

POST /threads - 创建线程。
POST /threads/search - 搜索线程。
GET /threads/{thread_id} - 获取线程。
GET /threads/{thread_id}/history - 浏览线程状态的历史修订版。修订版由运行创建，或通过下面的 PATCH 端点创建。
POST /threads/{thread_id}/copy - 创建线程的独立副本。
DELETE /threads/{thread_id} - 删除线程。
PATCH /threads/{thread_id} - 更新线程的值或元数据。更新值会在线程历史中创建新的修订版。

智能体：内省

在使用智能体之前，了解它能做什么、接受什么输入、返回什么等有时很有用。这就是内省端点发挥作用的地方。

端点：

POST /agents/search - 列出所有智能体，可选择性地按元数据或名称过滤。
GET /agents/{agent_id} - 获取智能体的基本信息，包括其名称、描述、元数据。
GET /agents/{agent_id}/schemas - 获取智能体的输入、输出、状态和配置模式。所有模式均以 JSON Schema 格式表示。

后台运行：原子化智能体执行

要执行一个智能体，我们需要 API 提供什么功能？

支持两种启动运行的范式
- “发射即忘”（Fire and Forget），即在后台启动运行，但不等待其完成
- 等待回复（阻塞或轮询），即启动运行并等待/流式传输其输出
支持智能体执行的 CRUD (增删改查) 操作
- 列出和获取运行
- 取消和删除运行
灵活的消费输出方式
- 获取最终状态
- 多种类型的流式输出，例如逐 token、中间步骤等
- 如果断开连接，能够重新连接到输出流
处理边界情况
- 故障应被优雅地处理，如果需要可以重试
- 突发流量应该被排队

基础端点：

GET /threads/{thread_id}/runs - 列出线程的运行。
POST /runs - 创建一个后台运行。
GET /runs/{run_id} - 获取运行及其状态。
POST /runs/{run_id}/cancel - 取消运行。如果运行尚未开始，立即取消；如果正在运行，则尽快取消。
DELETE /runs/{run_id} - 删除已完成的运行。待处理的运行需要先取消，参见上一个端点。
GET /runs/{run_id}/wait - 等待运行完成，返回最终输出。如果运行已完成，立即返回其最终输出。
GET /runs/{run_id}/stream - 加入现有运行的输出流。仅调用此端点后产生的输出才会被流式传输。

存储：长期记忆

对于智能体的记忆 API，你需要什么功能？

可自定义的记忆范围
- 针对用户、线程、助手、公司等存储记忆
- 在同一运行中访问不同范围的记忆
灵活的存储
- 支持简单的文本记忆以及结构化数据
- 记忆的 CRUD (增删改查) 操作（创建、读取、更新、删除）
搜索和检索
- 通过命名空间和键获取单个记忆
- 按命名空间、内容过滤，按时间排序等列出记忆

端点：

PUT /store/items - 在指定的命名空间和键处创建或更新记忆项。
DELETE /store/items - 在指定的命名空间和键处删除记忆项。
GET /store/items - 在指定的命名空间和键处获取记忆项。
POST /store/items/search - 搜索记忆项。
POST /store/namespaces - 列出命名空间。

消息

消息已成为处理大语言模型 (LLMs) 的核心原语，因此我们在 Agent Protocol 中对消息提供了第一类支持。此外，我们还完全支持为智能体定制输入/输出模式 (schemas)。我们定义了一个消息规范 (Message spec)，它是主要 LLM 提供商（如 OpenAI 和 Anthropic）支持的格式的子集。在所有暴露线程值的端点中，还有一个单独的 messages 字段，智能体可以选择实现。

Agent Protocol 实战

以下是几个使用 Hurl 格式的示例“用户旅程”，每个都展示了针对您的 Agent Protocol 服务（监听在 localhost:8000，无需认证）的常见 API 调用序列。

它们经过组织，以便您可以将每个旅程粘贴到独立的 .hurl 文件中（或合并它们），然后使用"hurl"命令运行。这应该能让您很好地了解该协议在实际中如何使用。

旅程 1：创建线程 → 获取线程 → 创建运行 → 等待输出

此旅程演示了创建线程、启动运行并等待最终输出的典型序列。然后您可以重复最后两步以在同一线程中启动更多运行。这是多轮交互（如聊天机器人对话）最常见的模式。

# 1. Create a brand new thread
POST http://localhost:8000/threads
Content-Type: application/json

{
  "thread_id": "229c1834-bc04-4d90-8fd6-77f6b9ef1462",
  "metadata": {
    "purpose": "support-chat"
  }
}

HTTP/1.1 200
[Asserts]
jsonpath "$.thread_id" == "229c1834-bc04-4d90-8fd6-77f6b9ef1462"


# 2. Retrieve the thread we just created
GET http://localhost:8000/threads/229c1834-bc04-4d90-8fd6-77f6b9ef1462

HTTP/1.1 200
[Asserts]
jsonpath "$.status" == "idle"


# 3. Create a run in the existing thread (background run).
# Capture the run_id for the next step.
POST http://localhost:8000/threads/229c1834-bc04-4d90-8fd6-77f6b9ef1462/runs
Content-Type: application/json

{
  "input": {
    "message": "Hi there, what's the weather?"
  },
  "metadata": {
    "requestType": "weatherQuery"
  }
}

HTTP/1.1 200
[Captures]
run_id: jsonpath "$.run_id"
[Asserts]
jsonpath "$.status" == "pending"


# 4. Wait for final run output
GET http://localhost:8000/threads/229c1834-bc04-4d90-8fd6-77f6b9ef1462/runs/{{run_id}}/wait

HTTP/1.1 200
[Asserts]
# For example, check that the run status is success or error,
# depending on your actual system's response:
jsonpath "$.status" == "success"

您可以将最后一步替换为 GET /threads/{thread_id}/runs/{run_id}/stream 以流式传输产生的输出，或者使用 GET /threads/{thread_id} 进行轮询状态/输出而无需等待。

旅程 2：临时“无状态”运行（创建 + 等待）

此旅程演示了一次性运行，其中您在一次请求中创建线程并运行，并等待最终输出。这对于无状态交互很有用，您希望每次从头开始。良好的用例包括提取或研究智能体。

# Launch a one-shot run with a brand new ephemeral thread,
# and wait for the final output right away.
POST http://localhost:8000/runs/wait
Content-Type: application/json

{
  "input": {
    "prompt": "What's the fastest route to the airport?"
  },
  "metadata": {
    "useCase": "travelPlan"
  },
  "config": {
    "tags": ["ephemeral", "demo"]
  }
}

HTTP/1.1 200

旅程 3：使用存储（添加、检索和删除项）

本旅程演示了如何使用 Store API（存储 API）来添加、检索和删除一项内容。这对于存储长期记忆非常有用，例如用户档案、偏好设置或其他结构化数据，这些数据既可以在智能体内部访问，也可以在智能体外部访问。

# 1. Put (store or update) an item in the store
PUT http://localhost:8000/store/items
Content-Type: application/json

{
  "namespace": ["user_profiles"],
  "key": "profile_jane_doe",
  "value": {
    "displayName": "Jane Doe",
    "role": "customer"
  }
}

HTTP/1.1 204


# 2. Retrieve it by namespace/key
GET http://localhost:8000/store/items?key=profile_jane_doe&namespace=user_profiles

HTTP/1.1 200
[Asserts]
jsonpath "$.value.displayName" == "Jane Doe"
jsonpath "$.value.role" == "customer"


# 3. Delete the item
DELETE http://localhost:8000/store/items
Content-Type: application/json

{
  "namespace": ["user_profiles"],
  "key": "profile_jane_doe"
}

HTTP/1.1 204

路线图

为每种流模式添加详细规范（目前这部分留给实现者决定）
添加 Store 端点以在内存条目上执行向量搜索
为 POST /threads/{thread_id}/runs/{run_id}/stream 添加参数，以便在流式传输新事件之前重放自 event-id 以来的事件
向 `POST /threads/{thread_id}/runs `` 添加参数，以选择性地允许在同一线程上进行并发运行（当前规范禁止此操作）
（提交一个 Issue（问题）并告诉我们这里还应该包含什么！）

Agent Protocol 快速上手指南

Agent Protocol 是一套旨在为生产环境中的 LLM 代理（Agents）提供框架无关 API 的规范。它定义了用于执行代理、管理多轮对话线程以及长期记忆存储的核心接口。本指南将指导您如何部署参考服务器并测试基础 API。

环境准备

在开始之前，请确保您的开发环境满足以下要求：

操作系统: Linux / macOS / Windows
Python 版本: 3.10 或更高版本
依赖工具: Git, Pip
网络建议: 由于涉及 GitHub 仓库克隆及 PyPI 包下载，建议使用国内镜像源加速（如清华源）。

安装步骤

1. 克隆项目仓库

从 GitHub 获取官方代码库。如果连接缓慢，可使用国内镜像地址。

git clone https://github.com/langchain-ai/agent-protocol.git
cd agent-protocol

2. 安装服务端依赖

进入 server/ 目录，该目录包含基于 Pydantic V2 和 FastAPI 自动生成的 Python 服务器存根。

cd server
# 推荐使用国内 PyPI 镜像源安装依赖
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple fastapi uvicorn pydantic

(注：如果目录下存在 requirements.txt，请优先使用 pip install -r requirements.txt)

3. 启动服务

使用 Uvicorn 启动 FastAPI 应用，默认监听端口为 8000。

uvicorn main:app --host 0.0.0.0 --port 8000

(注：具体入口文件名为 main.py，若不同请根据实际目录结构调整)

基本使用

启动服务后，您可以使用支持 HTTP 请求的工具（如 Hurl 或 cURL）来调用协议接口。以下示例展示了创建线程、启动运行并等待输出的标准流程。

示例场景：创建线程 → 获取线程 → 创建运行 → 等待输出

将以下代码保存为 journey1.hurl 文件，并在终端运行 hurl journey1.hurl 进行测试。

# 1. Create a brand new thread
POST http://localhost:8000/threads
Content-Type: application/json

{
  "thread_id": "229c1834-bc04-4d90-8fd6-77f6b9ef1462",
  "metadata": {
    "purpose": "support-chat"
  }
}

HTTP/1.1 200
[Asserts]
jsonpath "$.thread_id" == "229c1834-bc04-4d90-8fd6-77f6b9ef1462"


# 2. Retrieve the thread we just created
GET http://localhost:8000/threads/229c1834-bc04-4d90-8fd6-77f6b9ef1462

HTTP/1.1 200
[Asserts]
jsonpath "$.status" == "idle"


# 3. Create a run in the existing thread (background run).
# Capture the run_id for the next step.
POST http://localhost:8000/threads/229c1834-bc04-4d90-8fd6-77f6b9ef1462/runs
Content-Type: application/json

{
  "input": {
    "message": "Hi there, what's the weather?"
  },
  "metadata": {
    "requestType": "weatherQuery"
  }
}

HTTP/1.1 200
[Captures]
run_id: jsonpath "$.run_id"
[Asserts]
jsonpath "$.status" == "pending"


# 4. Wait for final run output
GET http://localhost:8000/threads/229c1834-bc04-4d90-8fd6-77f6b9ef1462/runs/{{run_id}}/wait

HTTP/1.1 200
[Asserts]
# For example, check that the run status is success or error,
# depending on your actual system's response:
jsonpath "$.status" == "success"

其他常用模式

无状态运行 (Stateless): 使用 POST /runs/wait 直接创建临时线程并获取结果。
流式输出 (Streaming): 将最后一步替换为 GET /threads/{thread_id}/runs/{run_id}/stream 以实时接收输出。

更多完整的 API 文档与规范，请访问 Agent Protocol OpenAPI Docs。

版本历史

0.1.32025/02/21

0.1.22025/02/05

0.1.12025/01/24

0.2.12025/04/14

0.2.02025/04/14

0.1.62025/03/26

0.1.52025/02/26

0.1.42025/02/26

常见问题

本项目与现有的 `Agent Protocol` 项目有何关系？

能否在创建线程的同时直接启动运行（无需单独创建线程）？

如何获取代理的元数据和运行时配置信息？

运行时的助手 ID 类型不匹配导致验证异常如何解决？

哪里可以进行项目相关的讨论和交流？

如何通过 PATCH 接口更新线程的状态？

相似工具推荐

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|今天

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 139k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 107.7k|★★☆☆☆|2天前

开发框架图像Agent

NextChat

NextChat 是一款轻量且极速的 AI 助手，旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性，以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发，NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言，它也提供了便捷的自托管方案，支持一键部署到 Vercel 或 Zeabur 等平台。 NextChat 的核心亮点在于其广泛的模型兼容性，原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型，让用户在一个界面即可自由切换不同 AI 能力。此外，它还率先支持 MCP（Model Context Protocol）协议，增强了上下文处理能力。针对企业用户，NextChat 提供专业版解决方案，具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能，满足公司对数据隐私和个性化管理的高标准要求。

★ 87.6k|★★☆☆☆|今天

开发框架语言模型

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。

★ 85k|★★☆☆☆|今天

图像数据工具视频

ragflow

RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。

★ 77.1k|★★★☆☆|昨天

Agent图像开发框架