langroid

4k 366 非常简单 1 次阅读 3天前MITAgent开发框架语言模型图像其他插件

AI 解读由 AI 自动生成，仅供参考

Langroid 是一个由卡内基梅隆大学和威斯康星大学麦迪逊分校研究人员打造的 Python 框架，旨在帮助开发者轻松构建基于大语言模型（LLM）的多智能体应用。它通过模拟“演员模型”，让用户定义多个具备不同能力的智能体（如配备 LLM、向量数据库或工具函数），这些智能体通过相互发送消息协作，共同解决复杂任务。

传统的大模型应用开发往往依赖复杂的编排逻辑或重型框架，而 Langroid 提供了一种更直观、轻量且原则清晰的替代方案。它不依赖 LangChain 等其他中间层，直接支持市面上绝大多数大模型，显著降低了开发门槛，让开发者能专注于业务逻辑而非底层架构。此外，Langroid 还率先支持 MCP 协议，允许智能体灵活调用外部服务器工具，并提供了可选的 Claude Code 插件以加速开发流程。

这款工具特别适合希望深入探索多智能体协作模式的 AI 开发者、研究人员以及需要构建生产级安全应用的企业团队。已有如 Nullify 等公司在评估了多种主流框架后，选择将 Langroid 应用于实际生产中，用于自动化漏洞修复等关键场景。如果你正在寻找一个既简洁又强大的框架来释放多智能体系统的潜力，Langroid 值得尝试。

使用场景

某金融科技团队需要构建一个自动化系统，从每日海量的非结构化新闻和财报中提炼关键数据，并生成合规的投资风险报告。

没有 langroid 时

单点故障频发：试图用单个大模型提示词（Prompt）完成“提取 - 分析 - 写作”全流程，常因上下文过长导致逻辑混乱或关键数据遗漏。
调试黑盒化：当输出结果出错时，无法定位是信息提取不准还是推理逻辑偏差，只能盲目调整庞大的提示词，效率极低。
协作机制缺失：难以让“数据员”和“风控专家”两个角色真正互动，往往需要编写复杂的胶水代码来串联多个独立的 API 调用。
扩展性差：若要增加“情感分析”环节，需重构整个单体脚本，代码耦合度高，维护成本随功能增加呈指数级上升。

使用 langroid 后

角色分工明确：轻松定义“信息提取代理”和“风险分析代理”，前者专攻数据清洗，后者负责逻辑研判，通过消息传递协同工作，准确率显著提升。
过程透明可控：利用内置的对话日志，开发者可清晰看到两个代理如何交换信息、修正错误，快速定位并优化特定环节的指令。
原生多智能体协作：无需编写繁琐的状态机或回调函数，langroid 基于 Actor 模型天然支持代理间自动协商，复杂任务流变得简洁优雅。
灵活热插拔：新增“情感分析代理”只需几行代码即可加入现有网络，各模块独立运行互不干扰，系统迭代速度大幅加快。

langroid 通过将复杂的单体 AI 任务拆解为可协作的多智能体网络，让开发者能以极低的代码成本构建出高可靠、易维护的生产级应用。

运行环境要求

操作系统

Linux
macOS
Windows

GPU

非必需（取决于所选 LLM，支持本地模型如 Ollama/Mistral 或云端 API）

内存

未说明

依赖

notesLangroid 是一个轻量级框架，不依赖 LangChain。它支持多种 LLM（包括 OpenAI、本地 Ollama、Gemini 等）。若使用本地大模型（如 Mistral-7b），需根据具体模型要求配置 GPU 和内存。项目已迁移至 uv 进行依赖管理，并完全兼容 Pydantic V2。支持 Docker 多架构部署。

python3.8+

pydantic>=2.0

openai

litellm

tiktoken

numpy

requests

快速开始

文档 · 示例仓库 · Discord · 贡献指南

Langroid 是一个直观、轻量级、可扩展且基于原则的 Python 框架，由卡内基梅隆大学和威斯康星大学麦迪逊分校的研究人员开发，旨在轻松构建由大语言模型驱动的应用程序。用户只需设置智能体，为其配备可选组件（如大语言模型、向量存储以及工具或函数），分配任务，然后让这些智能体通过消息交互协作解决问题。这种多智能体范式受到 Actor 模型的启发（不过你无需了解该模型！）。

Langroid 是一种全新的大语言模型应用开发方式，在简化开发者体验方面投入了大量思考；它不依赖 Langchain 或其他任何大语言模型框架，并且几乎可以与所有大语言模型配合使用（详见：https://langroid.github.io/langroid/tutorials/supported-models/）。

🔥 ✨ 现已推出 Claude Code 插件，内置模式与最佳实践，可显著加速 Langroid 开发。

🔥 阅读正在编写中的 Langroid 架构概述以及 Langroid 快速入门教程。

🔥 MCP 支持：通过 Langroid 简单的 MCP 工具适配器，任何 LLM 智能体都可以利用 MCP 服务器，将服务器提供的工具转换为 Langroid 的 ToolMessage 实例。

📢 目前已有公司正在生产环境中使用或定制 Langroid。以下是其中一家公司的评价：

Nullify 使用 AI 智能体进行安全软件开发，能够发现、优先排序并修复漏洞。在评估了 CrewAI、Autogen、LangChain、Langflow 等框架后，我们内部采用了 Langroid 的多智能体编排框架，并将其部署到生产环境。相比这些框架，Langroid 在配置简便性和灵活性方面表现更为出色。Langroid 的智能体和任务抽象设计直观、逻辑清晰，提供了极佳的开发体验。我们希望尽快将方案投入生产，而使用其他框架可能需要数周时间，但借助 Langroid，我们仅用几分钟就取得了良好效果。强烈推荐！
—— Jacky Wong, Nullify 公司 AI 负责人

🔥 LanceDB 团队发表了一篇关于 Langroid 的介绍性博客文章：Langoid 多智能体编程框架

🔥 最新发表于《医疗人工智能》期刊（2024 年）的一篇论文，介绍了一个基于 Langroid 的多智能体 RAG 系统，用于药物警戒工作，详情请参阅博客文章：面向药物警戒的 Malade 多智能体架构

我们欢迎社区贡献：有关如何参与贡献的想法，请参阅贡献指南。

如果您正在构建大语言模型应用，或者希望为贵公司获得 Langroid 方面的帮助，亦或是希望优先开发针对贵公司特定场景的 Langroid 功能，请联系 Prasad Chalasani 进行咨询或开发合作：pchalasani@gmail.com。

我们也接受来自 GitHub Sponsors 的赞助：GitHub Sponsors

有任何问题、反馈或想法吗？欢迎加入我们的 Discord 讨论组！

使用 Langroid 编程的快速预览

以下仅为示例，实际功能远不止于此，例如函数调用与工具集成、多智能体协作、结构化信息抽取、DocChatAgent（RAG）、SQLChatAgent、非 OpenAI 的本地或远程大语言模型等。更多内容请向下滚动或查阅文档。您还可以参考 Langroid 快速入门 Colab 笔记本，其中逐步构建了一个使用 OpenAI ChatCompletion API 的双智能体信息抽取示例。此外，还有一个使用 OpenAI Assistants API 的版本：链接。

🔥 刚刚发布！示例脚本展示了如何利用 Langroid 的多智能体和工具，仅使用 本地大语言模型（Mistral-7b-instruct-v0.2），从文档中提取结构化信息。

import langroid as lr
import langroid.language_models as lm

# 设置大语言模型
llm_cfg = lm.OpenAIGPTConfig( # 或者使用 OpenAI Assistant API
  # 任何可通过 OpenAI 兼容 API 调用的模型
  chat_model=lm.OpenAIChatModel.GPT4o, # 或者例如 "ollama/mistral"
)
# 直接使用大语言模型
mdl = lm.OpenAIGPT(llm_cfg)
response = mdl.chat("安大略省的首都是哪里？", max_tokens=10)

# 在智能体中使用大语言模型
agent_cfg = lr.ChatAgentConfig(llm=llm_cfg)
agent = lr.ChatAgent(agent_cfg)
agent.llm_response("中国的首都是哪里？") 
response = agent.llm_response("那印度呢？") # 维持对话状态 

# 将智能体封装到任务中，以与用户（或其他智能体）进行交互式循环
task = lr.Task(agent, name="Bot", system_message="你是一个有用的助手")
task.run("你好") # 从用户说“你好”开始

# 两智能体聊天循环：教师智能体向学生智能体提问
teacher_agent = lr.ChatAgent(agent_cfg)
teacher_task = lr.Task(
  teacher_agent, name="Teacher",
  system_message="""
    向你的学生提出简洁的数字问题，并给予反馈。 
    先从一个问题开始。
    """
)
student_agent = lr.ChatAgent(agent_cfg)
student_task = lr.Task(
  student_agent, name="Student",
  system_message="简明扼要地回答老师的提问。",
  single_round=True,
)

teacher_task.add_sub_task(student_task)
teacher_task.run()

🔥 更新/发布

点击展开

🚀 演示

假设你想从一份商业租赁合同文档中提取关键术语的结构化信息。使用 Langroid 的双代理系统，你可以轻松实现这一点，正如我们在 langroid-examples 仓库中所展示的那样。（请参阅此脚本，它使用本地的 Mistral-7b 模型实现了相同的功能。）该演示展示了 Langroid 的众多功能中的一部分，例如：

多代理协作：LeaseExtractor 负责整个任务，其 LLM（GPT4）会生成问题，由 DocAgent 来回答。
增强检索问答，并附有来源引用：DocAgent 的 LLM（GPT4）通过从向量存储中检索相关信息来回答 LeaseExtractor 提出的问题，并引用支持答案的具体段落。
函数调用（也称为工具/插件）：当 LeaseExtractor 收集到所需的所有信息后，它会通过函数调用来以结构化格式呈现这些信息。

以下是实际运行效果（可暂停的 mp4 视频可在这里观看）。

⚡ 亮点

（如需更更新的列表，请参阅上方的更新/发布部分）

代理作为一等公民： Agent 类封装了 LLM 对话状态，并可选择性地包含向量存储和工具。代理是 Langroid 中的核心抽象；代理充当“消息转换器”，默认提供 3 种“响应者”方法，分别对应于 LLM、代理和用户三个实体。
任务： Task 类包装了一个代理，并为其提供指令（或角色、目标），管理代理响应者方法的迭代过程，以及通过层次化、递归式的任务委派来协调多代理交互。Task.run() 方法与代理响应者方法具有相同的类型签名，这正是任务能够将子任务委派给其他代理的关键所在：从任务的角度来看，子任务只是额外的响应者，将在代理自身的响应者之后以轮转方式被调用。
模块化、可重用性、松耦合： Agent 和 Task 抽象允许用户设计具有特定技能的代理，将其封装在任务中，并以灵活的方式组合任务。
LLM 支持： Langroid 支持 OpenAI 的 LLM，也支持来自数百家提供商的 LLM（无论是本地/开源还是远程/商用），通过代理库和本地模型服务器实现，例如 ollama、oobabooga、 LiteLLM，它们实际上模拟了 OpenAI API。更多信息请参见支持的 LLM 列表。
LLM 响应缓存： Langroid 支持使用 Redis 缓存 LLM 响应。
向量存储： 目前支持 Qdrant、Chroma、LanceDB、Pinecone、PostgresDB (PGVector) 和 Weaviate。向量存储可用于增强检索生成（RAG）。
语境化与来源引用： 通过向量存储访问外部文档，可实现语境化和来源引用。
可观测性、日志记录、溯源： Langroid 会生成详细的多代理交互日志，并维护消息的出处/溯源信息，以便您可以追溯消息的来源。
工具/插件/函数调用： Langroid 支持 OpenAI 的函数调用，同时也支持一种等效的 ToolMessage 机制，该机制适用于任何 LLM，而不仅限于 OpenAI 的模型。函数调用和工具拥有相同的开发者接口，基于 Pydantic 实现，这使得定义工具/函数并让代理使用它们变得非常容易。使用 Pydantic 的好处在于，您无需编写复杂的 JSON 规范来进行函数调用；而且当 LLM 生成格式错误的 JSON 时，Pydantic 会返回错误信息，促使 LLM 自行修正。

⚙️ 安装与设置

安装 `langroid`

Langroid 需要 Python 3.11 或更高版本。我们建议使用虚拟环境。使用 pip 将一个精简版的 langroid（来自 PyPI）安装到您的虚拟环境中：

pip install langroid

核心 Langroid 包允许您通过 OpenAI 的 API 使用嵌入模型。如果您希望使用 HuggingFace 的 sentence-transformers 嵌入模型，则可以这样安装 Langroid：

pip install "langroid[hf-embeddings]"

在许多实际场景中，您可能还需要一些可选依赖项：

若要使用各种文档解析器，请安装带有 doc-chat 附加组件的 Langroid：
```
pip install "langroid[doc-chat]"
```
对于“数据库聊天”，请使用 db 附加组件：
```
pip install "langroid[db]"
```
您可以通过逗号分隔指定多个附加组件，例如：
```
pip install "langroid[doc-chat,db]"
```
若要一次性安装所有可选依赖项，可以使用 all 附加组件（但请注意，这会导致加载/启动时间更长且安装体积更大）：
```
pip install "langroid[all]"
```

使用 PostgreSQL 数据库进行 SQL 聊天的可选安装

如果您正在使用 SQLChatAgent（例如脚本 examples/data-qa/sql-chat/sql_chat.py），并且连接的是 PostgreSQL 数据库，您需要：

为您的平台安装 PostgreSQL 开发库，例如：
- 在 Ubuntu 上运行 sudo apt-get install libpq-dev，
- 在 Mac 上运行 brew install postgresql 等。
安装带有 postgres 附加组件的 Langroid，例如 pip install langroid[postgres] 或 poetry add "langroid[postgres]" 或 poetry install -E postgres，（或者使用相应的 uv 版本，例如 uv add "langroid[postgres]" 或 uv pip install langroid[postgres]）。如果出现错误，请尝试在您的虚拟环境中运行 pip install psycopg2-binary。

📝 如果遇到与 mysqlclient 相关的奇怪错误，请先运行 pip uninstall mysqlclient，然后再重新安装 mysqlclient。

Claude Code 插件（可选）

此插件提供两种技能：

langroid:patterns - 您的 Claude Code 代理可以利用此技能，使用适当的设计模式生成 Langroid 多智能体代码。
langroid:add-pattern - 代理可以使用此技能记录它学到的新模式，供将来参考，无论是自主完成还是在用户提示下完成。

步骤 1：添加 Langroid 市场

在终端中：

claude plugin marketplace add langroid/langroid

或在 Claude Code 中：

/plugin marketplace add langroid/langroid

步骤 2：安装 Langroid 插件

在终端中：

claude plugin install langroid@langroid

或在 Claude Code 中：

/plugin install langroid@langroid

安装完成后，只需用自然语言要求您的 Claude Code 代理实现 Langroid 模式，例如：

设置一个 Langroid 代理，使其使用 EditTool，并将其封装在一个任务中，该任务在工具生成后立即结束

它将自动使用 langroid:patterns 技能来遵循正确的设计模式。

您还可以在发现新模式时，要求 Claude Code 记录下来，例如：

将此记录为设置 MCP 工具的新 Langroid 模式

设置环境变量（API 密钥等）

要开始使用，您只需要一个 OpenAI API 密钥。如果您还没有，请参阅 OpenAI 官网。（请注意，虽然这是最简单的入门方式，但 Langroid 几乎可以与任何 LLM 配合使用，而不仅仅是 OpenAI 的模型。请参阅关于使用开放/本地 LLM 以及其他非 OpenAI 专有 LLM 的指南。）

在仓库根目录下，将 .env-template 文件复制为新的 .env 文件：

cp .env-template .env

然后插入您的 OpenAI API 密钥。您的 .env 文件应如下所示（组织 ID 是可选的，但在某些情况下可能需要）：

OPENAI_API_KEY=your-key-here-without-quotes
OPENAI_ORGANIZATION=optionally-your-organization-id

或者，您也可以在 shell 中设置此环境变量（每次打开新 shell 时都需要执行此操作）：

export OPENAI_API_KEY=your-key-here-without-quotes

可选设置说明（点击展开）

以下所有环境变量设置均为可选，其中一些仅在使用特定功能时才需要（如下所述）。

Qdrant 向量存储 API 密钥、URL。这仅在您想使用 Qdrant 云服务时才需要。或者，目前也支持 Chroma 和 LanceDB。我们使用 Chroma 的本地存储版本，因此无需 API 密钥。
Redis 密码、主机、端口：这是可选的，仅在使用 Redis Cloud 缓存 LLM API 响应时才需要。 Redis 提供一个免费的 30MB Redis 账户，这足以试用 Langroid，甚至超出其需求。如果您不进行这些设置，Langroid 将使用纯 Python 的 Redis 内存缓存，通过 Fakeredis 库实现。
Momento 用于缓存 LLM API 响应的无服务器服务（作为 Redis 的替代方案）。若要使用 Momento 而不是 Redis：
- 在 .env 文件中输入您的 Momento 令牌，作为 MOMENTO_AUTH_TOKEN 的值（见下方示例文件），
- 在 .env 文件中将 CACHE_TYPE=momento（而不是默认的 CACHE_TYPE=redis）。
GitHub 个人访问令牌（对于需要分析 git 仓库的应用程序是必需的；基于令牌的 API 调用速率限制较少）。请参阅此 GitHub 页面。
Google 自定义搜索 API 凭证： 仅在启用代理使用 GoogleSearchTool 时才需要。要将 Google 搜索作为 LLM 工具/插件/函数调用使用，您需要先设置 Google API 密钥，然后设置 Google 自定义搜索引擎 (CSE) 并获取 CSE ID。（这些文档可能比较复杂，建议向 GPT4 请求逐步指南。）获取这些凭证后，将其作为 GOOGLE_API_KEY 和 GOOGLE_CSE_ID 的值存储在您的 .env 文件中。关于如何使用此类“无状态”工具的完整文档即将发布，但在此期间，您可以查看此聊天示例，其中展示了如何轻松地为代理配备 GoogleSearchtool。

如果您添加了所有这些可选变量，您的 .env 文件应如下所示：

OPENAI_API_KEY=your-key-here-without-quotes
GITHUB_ACCESS_TOKEN=your-personal-access-token-no-quotes
CACHE_TYPE=redis # 或 momento
REDIS_PASSWORD=your-redis-password-no-quotes
REDIS_HOST=your-redis-hostname-no-quotes
REDIS_PORT=your-redis-port-no-quotes
MOMENTO_AUTH_TOKEN=your-momento-token-no-quotes # 替代 REDIS* 变量
QDRANT_API_KEY=your-key
QDRANT_API_URL=https://your.url.here:6333 # 注意必须包含端口号
GOOGLE_API_KEY=your-key
GOOGLE_CSE_ID=your-cse-id

Microsoft Azure OpenAI 的可选设置说明（点击展开）

在使用 Azure OpenAI 时，.env 文件中需要额外的环境变量。此页面 Microsoft Azure OpenAI 提供了更多信息，您可以按如下方式设置每个环境变量：

AZURE_OPENAI_API_KEY，来自 API_KEY 的值
AZURE_OPENAI_API_BASE 来自 ENDPOINT 的值，通常看起来像 https://your.domain.azure.com。
对于 AZURE_OPENAI_API_VERSION，您可以使用 .env-template 中的默认值，最新版本可在这里找到。
AZURE_OPENAI_DEPLOYMENT_NAME 是已部署模型的名称，由用户在模型设置过程中定义。
AZURE_OPENAI_MODEL_NAME Azure OpenAI 允许在部署模型时指定特定的模型名称。您需要准确填写所选的模型名称。例如，GPT-4（应为 gpt-4-32k 或 gpt-4）。
AZURE_OPENAI_MODEL_VERSION 是必需的，如果 AZURE_OPENAI_MODEL_NAME = gpt-4，这将帮助 Langroid 确定模型的成本。

🐳 Docker 使用说明

我们通过这个 Docker 镜像提供了 langroid-examples 仓库的容器化版本。你只需要在 .env 文件中设置环境变量即可。请按照以下步骤来启动容器：

# 从 `langroid` 仓库获取 .env 文件模板
wget -O .env https://raw.githubusercontent.com/langroid/langroid/main/.env-template

# 使用你喜欢的编辑器（这里以 nano 为例）编辑 .env 文件，并移除任何未使用的配置项。例如，文件中包含一些“占位符”值，如 “your-redis-port” 等——如果你不使用它们，请务必将其删除。
nano .env

# 启动容器（系统会自动拉取适合你架构的镜像）
docker run -it --rm  -v ./.env:/langroid/.env langroid/langroid:latest

# 使用以下命令运行 `examples` 目录中的任意脚本
python examples/<Path/To/Example.py>

🎉 使用示例

这些是快速预览，旨在让你了解使用 Langroid 可以做什么，以及你的代码会是什么样子。

⚠️ 下面的代码片段仅用于展示代码风格， 并非完整的可运行示例！为此，我们鼓励你参考 langroid-examples 仓库。

ℹ️ Langroid 中的各种 LLM 提示和指令已经过测试，与 GPT-4（并在一定程度上与 GPT-4o）配合良好。切换到其他 LLM（本地/开源或专有模型）非常容易（参见上述指南），对于某些应用场景可能已经足够，但通常情况下，除非调整提示或多智能体设置，否则结果可能会较差。

📖 更多详细教程请参阅 入门指南。

点击展开下面的任一代码示例。所有这些示例都可以在 Colab 笔记本中运行：

直接与 LLM 交互

import langroid.language_models as lm

mdl = lm.OpenAIGPT(
    lm.OpenAIGPTConfig(
        chat_model=lm.OpenAIChatModel.GPT4o, # 或者，例如  "ollama/qwen2.5"
    ),
)

messages = [
  lm.LLMMessage(content="You are a helpful assistant",  role=lm.Role.SYSTEM), 
  lm.LLMMessage(content="What is the capital of Ontario?",  role=lm.Role.USER),
]

response = mdl.chat(messages, max_tokens=200)
print(response.message)

请参阅相关指南以了解如何使用 (本地/开源 LLM 或远程/商用 LLM)。

与非 OpenAI LLM（本地或远程）交互

本地模型：如果模型在 `http://localhost:8000` 上提供服务：

cfg = lm.OpenAIGPTConfig(
  chat_model="local/localhost:8000", 
  chat_context_length=4096
)
mdl = lm.OpenAIGPT(cfg)
# 现在可以像上面一样与其交互，或者按照下方所示创建 Agent + Task。

定义一个智能体，设置任务并运行

import langroid as lr

agent = lr.ChatAgent()

# 获取智能体 LLM 的响应，并将其放入交互式循环中...
# answer = agent.llm_response("What is the capital of Ontario?")
  # ... 或者，改为设置一个任务（内置循环），并运行它
task = lr.Task(agent, name="Bot") 
task.run() # ... 每轮都会向 LLM 或用户寻求响应的循环

三个相互通信的智能体

一个简单的数字游戏，当给定一个数字 n 时：

repeater_task 的 LLM 只需返回 n，
even_task 的 LLM 如果 n 是偶数则返回 n/2，否则返回 “DO-NOT-KNOW”；
odd_task 的 LLM 如果 n 是奇数则返回 3*n+1，否则返回 “DO-NOT-KNOW”。

每个 Task 都会自动配置一个默认的 ChatAgent。

import langroid as lr
from langroid.utils.constants import NO_ANSWER

repeater_task = lr.Task(
    name = "Repeater",
    system_message="""
    Your job is to repeat whatever number you receive.
    """,
    llm_delegate=True, # LLM 负责处理任务
    single_round=False, 
)

even_task = lr.Task(
    name = "EvenHandler",
    system_message=f"""
    You will be given a number. 
    If it is even, divide by 2 and say the result, nothing else.
    If it is odd, say {NO_ANSWER}
    """,
    single_round=True,  # 任务在收到有效响应后完成
)

odd_task = lr.Task(
    name = "OddHandler",
    system_message=f"""
    You will be given a number n. 
    If it is odd, return (n*3+1), say nothing else. 
    If it is even, say {NO_ANSWER}
    """,
    single_round=True,  # 任务在收到有效响应后完成
)

然后将 even_task 和 odd_task 添加为 repeater_task 的子任务，并运行 repeater_task，以一个数字作为输入：

repeater_task.add_sub_task([even_task, odd_task])
repeater_task.run("3")

简单的工具/函数调用示例

Langroid 利用 Pydantic 支持 OpenAI 的函数调用 API 以及其自身的原生工具。这样做的好处是，你无需编写任何 JSON 来指定模式；此外，如果 LLM 生成了格式错误的工具调用语法，Langroid 会将经过适当清理的 Pydantic 验证错误发送回 LLM，以便其进行修正！

简单示例：假设智能体有一个秘密数字列表，我们希望 LLM 找到该列表中的最小数字。我们想为 LLM 提供一个名为 probe 的工具/函数，该工具接受一个数字 n 作为参数。智能体中的工具处理方法会返回其列表中小于等于 n 的数字数量。

首先使用 Langroid 的 ToolMessage 类定义该工具：

import langroid as lr

class ProbeTool(lr.agent.ToolMessage):
  request: str = "probe" # 指定由哪个智能体方法处理此工具
  purpose: str = """
        To find how many numbers in my list are less than or equal to  
        the <number> you specify.
        """ # 描述用于指导 LLM 何时以及如何使用该工具
  number: int  # 工具所需的参数

然后定义一个 SpyGameAgent 类，作为 ChatAgent 的子类，并添加一个名为 probe 的方法来处理该工具：

class SpyGameAgent(lr.ChatAgent):
  def __init__(self, config: lr.ChatAgentConfig):
    super().__init__(config)
    self.numbers = [3, 4, 8, 11, 15, 25, 40, 80, 90]

  def probe(self, msg: ProbeTool) -> str:
    # 返回 self.numbers 中小于或等于 msg.number 的数字数量
    return str(len([n for n in self.numbers if n <= msg.number]))

接下来实例化该智能体，并启用其使用和响应工具的功能：

spy_game_agent = SpyGameAgent(
    lr.ChatAgentConfig(
        name="间谍",
        vecdb=None,
        use_tools=False, # 不使用 Langroid 原生工具
        use_functions_api=True, # 使用 OpenAI 函数调用 API
    )
)
spy_game_agent.enable_message(ProbeTool)

完整的工作示例请参阅 langroid-examples 仓库中的脚本 chat-agent-tool.py。

通过工具/函数调用从文本中提取结构化信息

假设您希望代理从租赁文件中提取租赁的关键条款，并将其表示为嵌套的 JSON 结构。首先，通过 Pydantic 模型定义所需的结构：

from pydantic import BaseModel
class LeasePeriod(BaseModel):
    start_date: str
    end_date: str


class LeaseFinancials(BaseModel):
    monthly_rent: str
    deposit: str

class Lease(BaseModel):
    period: LeasePeriod
    financials: LeaseFinancials
    address: str

然后，将 LeaseMessage 工具定义为 Langroid 的 ToolMessage 子类。请注意，该工具有一个名为 terms 的必填参数，类型为 Lease：

import langroid as lr

class LeaseMessage(lr.agent.ToolMessage):
    request: str = "lease_info"
    purpose: str = """
        收集商业租赁的相关信息。
        """
    terms: Lease

接下来，定义一个 LeaseExtractorAgent 类，其中包含处理此工具的方法 lease_info，实例化该代理，并启用其使用和响应此工具的功能：

class LeaseExtractorAgent(lr.ChatAgent):
    def lease_info(self, message: LeaseMessage) -> str:
        print(
            f"""
        完成！成功提取了租赁信息：
        {message.terms}
        """
        )
        return json.dumps(message.terms.dict())
    
lease_extractor_agent = LeaseExtractorAgent()
lease_extractor_agent.enable_message(LeaseMessage)

完整的工作示例请参阅 langroid-examples 仓库中的脚本 chat_multi_extract.py。

与文档（文件路径、URL 等）进行聊天

Langroid 提供了一个专门的代理类 DocChatAgent 用于此目的。它集成了文档分片、嵌入、向量数据库存储以及检索增强的问答生成功能。使用此类与一组文档进行对话非常简单。首先创建一个 DocChatAgentConfig 实例，并设置 doc_paths 字段来指定要与之对话的文档。

import langroid as lr
from langroid.agent.special import DocChatAgentConfig, DocChatAgent

config = DocChatAgentConfig(
  doc_paths = [
    "https://en.wikipedia.org/wiki/Language_model",
    "https://en.wikipedia.org/wiki/N-gram_language_model",
    "/path/to/my/notes-on-language-models.txt",
  ],
  vecdb=lr.vector_store.QdrantDBConfig(),
)

然后实例化 DocChatAgent（这会将文档摄入向量数据库）：

agent = DocChatAgent(config)

之后，我们可以向代理提出一次性问题：

agent.llm_response("什么是语言模型？")

或者将其包装在一个 Task 中，并与用户进行交互式循环：

task = lr.Task(agent)
task.run()

完整的可运行脚本请参阅 langroid-examples 仓库中 docqa 文件夹下的相关脚本。

🔥 与表格数据（文件路径、URL、数据框等）进行聊天

使用 Langroid，您可以设置一个 TableChatAgent 并为其提供数据集（文件路径、URL 或数据框），然后对其进行查询。代理的 LLM 会通过函数调用（或工具/插件）生成 Pandas 代码来回答查询，而代理的函数处理方法则会执行这些代码并返回答案。

以下是具体操作步骤：

import langroid as lr
from langroid.agent.special import TableChatAgent, TableChatAgentConfig

为数据文件、URL 或数据框设置一个 TableChatAgent（确保数据表有标题行；分隔符会自动检测）：

dataset =  "https://archive.ics.uci.edu/ml/machine-learning-databases/wine-quality/winequality-red.csv"


# 或者 dataset = "/path/to/my/data.csv"
# 或者 dataset = pd.read_csv("/path/to/my/data.csv")
agent = TableChatAgent(
    config=TableChatAgentConfig(
        data=dataset,
    )
)

设置一个任务，并像这样提出一次性问题：

task = lr.Task(
  agent, 
  name = "DataAssistant",
  default_human_response="", # 避免等待用户输入
)
result = task.run(
  "质量评分高于 7 的葡萄酒的平均酒精含量是多少？",
  turns=2 # 在用户提问、LLM 函数调用/工具响应、代理代码执行结果后返回
) 
print(result.content)

或者，您也可以设置一个任务，并与用户进行交互式循环：

task = lr.Task(agent, name="DataAssistant")
task.run()

完整的工作示例请参阅 langroid-examples 仓库中的脚本 table_chat.py。

❤️ 感谢我们的支持者

如果您喜欢这个项目，请给它点个赞 ⭐，同时在您的网络或社交媒体上分享它：

您的支持将有助于推动 Langroid 的发展并壮大其社区。

Langroid 联合创始人

普拉萨德·查拉萨尼（印度理工学院本科/计算机科学，卡内基梅隆大学博士/机器学习；独立机器学习顾问）
索梅什·贾（印度理工学院本科/计算机科学，卡内基梅隆大学博士/计算机科学；威斯康星大学麦迪逊分校计算机科学教授）

Langroid 快速上手指南

Langroid 是一个直观、轻量且可扩展的 Python 框架，专为构建基于大语言模型（LLM）的应用而设计。它采用多智能体（Multi-Agent）协作范式，灵感源自 Actor 模型，让开发者能够轻松设置智能体、分配任务并使其通过消息交换协同解决问题。Langroid 不依赖 LangChain 等其他框架，支持几乎所有主流 LLM。

环境准备

在开始之前，请确保您的开发环境满足以下要求：

操作系统：Linux, macOS 或 Windows
Python 版本：Python 3.9 或更高版本（推荐 3.10+）
前置依赖：
- pip 包管理工具
- （可选）API Key：如使用 OpenAI、Anthropic 等云端模型，需提前准备好对应的 API Key 并配置环境变量。

国内开发者提示：如果访问 PyPI 源较慢，建议使用国内镜像源进行安装（见下文安装步骤）。

安装步骤

1. 基础安装

使用 pip 安装最新稳定版：

pip install langroid

推荐使用国内镜像源加速安装：

pip install langroid -i https://pypi.tuna.tsinghua.edu.cn/simple

2. 可选依赖

根据您的需求，可能需要安装额外的组件（如向量数据库支持、特定解析器等）：

# 例如安装用于文档处理的额外依赖
pip install langroid[doc] -i https://pypi.tuna.tsinghua.edu.cn/simple

基本使用

以下示例展示了 Langroid 的核心用法：配置 LLM、创建智能体（Agent）、封装任务（Task）以及实现多智能体协作。

1. 直接调用 LLM

最基础的用法是直接初始化模型并进行对话。

import langroid as lr
import langroid.language_models as lm

# 配置 LLM (支持 OpenAI 兼容接口，也可替换为 "ollama/mistral" 等本地模型)
llm_cfg = lm.OpenAIGPTConfig(
  chat_model=lm.OpenAIChatModel.GPT4o, 
)

# 直接使用 LLM
mdl = lm.OpenAIGPT(llm_cfg)
response = mdl.chat("What is the capital of Ontario?", max_tokens=10)
print(response)

2. 创建智能体 (Agent)

将 LLM 封装进智能体，智能体可以维护对话状态。

# 配置智能体
agent_cfg = lr.ChatAgentConfig(llm=llm_cfg)
agent = lr.ChatAgent(agent_cfg)

# 发起对话 (自动维护上下文)
agent.llm_response("What is the capital of China?") 
response = agent.llm_response("And India?")

3. 运行交互式任务 (Task)

将智能体包装成任务，以便与用户或其他智能体进行交互循环。

# 定义任务
task = lr.Task(
    agent, 
    name="Bot", 
    system_message="You are a helpful assistant"
)

# 启动任务 (用户输入 "Hello" 开始)
task.run("Hello")

4. 多智能体协作示例

这是一个经典的“老师 - 学生”场景：老师智能体提问，学生智能体回答。

# 配置两个智能体
teacher_agent = lr.ChatAgent(agent_cfg)
student_agent = lr.ChatAgent(agent_cfg)

# 定义老师任务
teacher_task = lr.Task(
  teacher_agent, 
  name="Teacher",
  system_message="""
    Ask your student concise numbers questions, and give feedback. 
    Start with a question.
    """
)

# 定义学生任务 (single_round=True 表示回答一次后暂停，等待老师反馈)
student_task = lr.Task(
  student_agent, 
  name="Student",
  system_message="Concisely answer the teacher's questions.",
  single_round=True,
)

# 建立子任务关系并运行
teacher_task.add_sub_task(student_task)
teacher_task.run()

通过以上步骤，您即可快速构建起基于 Langroid 的多智能体应用。更多高级功能（如工具调用、RAG、本地模型部署等）请参考官方文档或示例仓库。

版本历史

0.61.12026/03/25

0.61.02026/03/25

0.60.32026/03/16

0.60.22026/03/13

0.60.12026/03/13

0.60.02026/03/12

0.59.392026/02/28

0.59.382026/02/26

0.59.372026/02/24

0.59.362026/02/23

0.59.352026/02/22

0.59.342026/02/11

0.59.332026/02/09

0.59.322026/02/01

0.59.312026/01/29

0.59.302026/01/29

0.59.292026/01/28

0.59.282026/01/28

0.59.272026/01/22

0.59.262026/01/16

常见问题

导入 langroid 或初始化模型时加载速度很慢，有什么优化建议吗？

使用本地部署的 LLM（如 Mistral-7B/Ollama）时出现'history is longer than the max chat context'错误或无响应，如何解决？

如何在多轮对话中处理 LLM 未返回预期格式的工具调用（ResultTool）的情况？

如何添加对 Marker PDF 解析器的支持以实现高效的逐页 Markdown 转换？

使用本地 Mixtral 模型配合 Oobabooga 服务器时，Prompt 似乎未能发送给 LLM，如何排查？

docling 是必须安装的核心依赖吗？

相似工具推荐

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|今天

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 139k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 107.7k|★★☆☆☆|2天前

开发框架图像Agent

NextChat

NextChat 是一款轻量且极速的 AI 助手，旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性，以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发，NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言，它也提供了便捷的自托管方案，支持一键部署到 Vercel 或 Zeabur 等平台。 NextChat 的核心亮点在于其广泛的模型兼容性，原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型，让用户在一个界面即可自由切换不同 AI 能力。此外，它还率先支持 MCP（Model Context Protocol）协议，增强了上下文处理能力。针对企业用户，NextChat 提供专业版解决方案，具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能，满足公司对数据隐私和个性化管理的高标准要求。

★ 87.6k|★★☆☆☆|今天

开发框架语言模型

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。

★ 85k|★★☆☆☆|今天

图像数据工具视频

ragflow

RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。

★ 77.1k|★★★☆☆|昨天

Agent图像开发框架

使用场景

没有 langroid 时

使用 langroid 后

运行环境要求

快速开始

文档 · 示例仓库 · Discord · 贡献指南

使用 Langroid 编程的快速预览

🔥 更新/发布

🚀 演示

⚡ 亮点

⚙️ 安装与设置

安装 langroid

Claude Code 插件（可选）

设置环境变量（API 密钥等）

🐳 Docker 使用说明

🎉 使用示例

❤️ 感谢我们的 支持者

Langroid 联合创始人

Langroid 快速上手指南

环境准备

安装步骤

1. 基础安装

2. 可选依赖

基本使用

1. 直接调用 LLM

2. 创建智能体 (Agent)

3. 运行交互式任务 (Task)

4. 多智能体协作示例

版本历史

常见问题

相似工具推荐

stable-diffusion-webui

everything-claude-code

ComfyUI

NextChat

ML-For-Beginners

ragflow

安装 `langroid`

❤️ 感谢我们的支持者