multi-agent-postgres-data-analytics

873 179 较难 1 次阅读昨天MIT语言模型数据工具Agent

AI 解读由 AI 自动生成，仅供参考

multi-agent-postgres-data-analytics 是一个实验性学习项目，旨在探索如何利用多智能体系统与数据库进行自然语言交互。它允许用户直接用日常语言向 PostgreSQL 数据库提问，系统会自动理解意图、生成查询并返回结果，从而降低了直接编写 SQL 的技术门槛。

该项目核心解决了传统数据查询依赖硬编码规则或专业 SQL 知识的问题，通过大语言模型的推理能力实现更灵活的数据分析。需要特别说明的是，这并非一个成熟的生产级框架或开箱即用的工具库，而是一个用于演示多智能体架构构建过程的“垫脚石”。作者鼓励开发者结合配套视频系列，深入理解其背后的设计原则与对话流程。

因此，它最适合希望深入学习多智能体系统（Multi-Agent Systems）架构的开发者和技术研究人员。对于想要从零开始构建自主代理应用、理解智能体协作模式（如编排器、对话流设计）的学习者而言，这是一个极具价值的参考案例。

在技术亮点上，项目融合了 OpenAI GPT-4、微软 AutoGen 多智能体框架以及 Guidance 库，展示了如何让多个具备不同职能的 AI 智能体通过消息交换协同工作，以完成复杂的数据库查询任务，为未来构建更高级的自主软件提供了实践思路。

使用场景

某电商公司的数据分析师需要在促销活动期间，快速从庞大的 PostgreSQL 订单库中挖掘用户行为趋势以调整营销策略。

没有 multi-agent-postgres-data-analytics 时

分析师必须手动编写复杂的 SQL 多表连接查询，稍有语法错误就会导致整个分析流程中断。
面对“找出上周复购率下降最明显的前五个品类”这类模糊的自然语言需求，需反复与开发人员沟通才能转化为精确的代码逻辑。
每次验证新假设都需要重新修改脚本并等待执行，从产生想法到获取数据结果往往耗时数小时。
非技术背景的产品经理无法直接探查数据，严重依赖分析师作为“中间人”传递信息，沟通成本极高。

使用 multi-agent-postgres-data-analytics 后

分析师直接用自然语言提问，系统背后的多智能体团队自动协作生成、校验并执行准确的 SQL 语句。
多个专用 Agent（如规划者、代码编写者、数据库专家）自动拆解复杂意图，无需人工干预即可处理模糊的业务问题。
实现了“即问即答”的交互模式，将原本数小时的数据提取与验证过程压缩至分钟级，大幅加速决策循环。
产品经理可直接通过对话界面探索数据，系统自动协调不同 Agent 完成推理与查询，打破了技术与业务之间的壁垒。

multi-agent-postgres-data-analytics 通过将自然语言理解与自动化 SQL 执行相结合，让数据交互从“编写代码”转变为“直接对话”，极大释放了团队的数据洞察潜力。

运行环境要求

操作系统

未说明

GPU

未说明

内存

未说明

依赖

notes这是一个实验性学习项目，非生产级框架。运行前需配置 PostgreSQL 数据库连接和 OpenAI API 密钥（在 .env 文件中）。项目使用 Poetry 进行依赖管理。由于基于 LLM（大语言模型）和多智能体交互，实际资源消耗取决于并发代理数量和上下文长度，主要依赖云端 API 而非本地算力。

python^3.10

OpenAI (GPT-4, Assistance API)

AutoGen

Postgres

Guidance

Poetry

multi-agent-postgres-data-analytics hero image

快速开始

多智能体 PostgreSQL 数据分析

我们与数据互动的方式正在发生变化。

多智能体 PostgreSQL 数据分析

💬 请先阅读此说明 💬

本仓库是一个用于构建多智能体系统的实验和 学习工具。

它是迈向完全自主、智能体化软件 的 许多步骤中的一个。

它不是框架、库或捷径。

它是帮助你内化概念、模式和构建模块的 垫脚石，以便你能够构建自己的多智能体系统和应用。

代码只能在某一时刻讲述一个故事。我强烈建议你观看视频系列，以了解这个实验性代码库结构背后的 如何以及为什么。

在该系列中，我们将从零开始构建，并深入探讨围绕多智能体软件的复杂性、原则、模式和理念。视频顺序如下，分支对应于各个视频。

本仓库不会在视频系列结束后继续维护或更新。它只是我们在视频系列中构建的代码的一个时间点快照，仅供你在构建自己的多智能体系统的过程中参考，仅此而已。

当我们完成整个系列时，将冻结代码库。之后我们会将其作为实验、产品和视频的参考。

💻 多智能体 PostgreSQL 数据分析工具 💻

这是一个多智能体系统，允许你用自然语言提问关于你的 PostgreSQL 数据库的问题。

该代码库由 GPT-4、Assistance API、AutoGen、PostgreSQL 和 Guidance 提供支持。

这是众多利用 LLM（大型语言模型）实现推理和决策的多智能体应用中的第一个，从而减少了对显式规则或逻辑的依赖。

💻 设置 💻

请先阅读代码库。请记住，这只是一个实验和学习工具，而不是框架或库。
运行 git branch -a 查看所有分支。每个分支都对应视频系列中的一个视频。
- 使用 git checkout <branch-name> 切换到你想查看的分支。
poetry install
cp .env.sample .env
填写 .env 文件，填入你的 PostgreSQL URL 和 OpenAI API 密钥。
对你的数据库运行一个提示：
- poetry run start --prompt "<向你的智能体提问关于你的 PostgreSQL 数据库的问题>"
  - 可以先从简单的问题开始，熟悉一下，然后再逐步尝试更复杂的问题。

🛠️ 核心技术栈 🛠️

OpenAI - GPT-4、GPT-4 Turbo、Assistance API
AutoGen - 多智能体框架
PostgreSQL - 数据库
Guidance - 结构化 LLM 回答
Aider - AI 配对编程
Poetry - 包管理器
Python ^3.10 - 编程语言

🔵 多智能体模式与术语 🔵

在整个代码库中，我们构建了多种现有及新出现的模式和术语，你可能已经以某种形式见过它们。以下是其中最重要的几个概述：

智能体 - 智能体是一种由 LLM 驱动的工具，具有单一目的，可以被赋予特定的功能和/或提示。
多智能体团队 - 由多个智能体组成的集合，它们通过消息交换共同协作以达成目标。
对话 - 多智能体团队之间消息的交换。
对话流程 - 智能体之间的沟通方式。智能体之间的沟通方式会彻底改变应用程序的工作方式。对话流程决定了哪个智能体发言、发言顺序、与谁交流以及说什么。
编排者 - 管理单个智能体团队、他们的对话及其输出。编排者包含不同类型的对话流程。
工具箱 - 工具箱是智能体可以使用的工具。可以把它想象成一个前端商店。它包含了状态和函数，智能体和编排者都可以在应用程序的生命周期内使用。虽然通常只有智能体会更新状态，但智能体和编排者都可以消费和操作工具箱的状态。
决策智能体 - 能够给出具体决策的智能体，这些决策可以决定应用程序的流程。要构建复杂的智能体系统，智能体需要具备做出具体决策的能力，从而驱动应用程序的流程。
结构化与非结构化智能体 - 结构化智能体是指那些返回结构化数据的智能体。非结构化智能体则是指返回非结构化数据的智能体。通常情况下，决策智能体属于结构化智能体。

📺 视频系列 - 通过观看学习 📺

与您的数据库对话：https://talktoyourdb.com

独家测试版启动代码：9999

🧠 整个系列的主要收获 🧠

💡 为什么多代理应用很重要？

它们之所以重要，是因为它们使我们能够创建更精确的世界模型。
我们成为协调者，从而减少工程层面的工作，更多地专注于产品层面。
它们以一种前所未有的方式实现了类人化的推理和决策能力。
我们可以构建出在与我们协同工作时，能像人类一样做出决策的系统。
我们可以解决那些以前需要专门招聘人员或整个团队才能解决的问题。

✅ 多代理系统的优点

可以为特定的代理分配功能和提示，实现专业化，从而获得更好的结果。
代理可以反思结果并提供反馈，进而改进结果。
可以模拟真实的组织结构，无论是现有的还是新的。
生态系统正在迅速发展。每天都有新的工具和框架被开发出来。
上行潜力极其巨大。我们谈论的是非对称的投资回报率、最大的杠杆效应以及超线性增长的收益。拥有的自主性构建模块越多，你的工程和产品潜力就越强大。
多代理工程可能是目前软件领域最重要的发展方向（2023-2024年）。
实现自主性软件的道路已经清晰：先解决小问题，创建可重用的构建模块，然后将它们组合起来解决更大的问题。
GPT-4毫无疑问可以支持多代理系统。它是遥遥领先的最佳模型，能够轻松提供令人惊叹的推理能力，触手可及。

❌ 多代理系统的缺点

正确设定代理的角色和功能是一门艺术。你需要多少个代理？它们分别做什么？你如何确定？
测试成本可能很高，并且会随着代理数量的增加而上升。代理越多，每次查询的成本就越高。
由于大语言模型的非确定性，调试多代理系统为何未能按预期运行可能会非常困难。
内存管理是一个重大问题。上下文窗口迫使开发者编写许多复杂而精巧的代码来管理内存。
AI 代理生态系统中充斥着过多的噪音和炒作。很多内容只是吸引眼球的噱头，缺乏实际价值。很难找到优质资源。
公开构建多代理系统的工程师非常少。大多数案例都只是玩具级别的示例，或者直接从示例代码库中照搬。
OpenAI每次发布新版本都会无意中打击初创企业。致力于构建基于大语言模型的应用程序存在风险。
以当前的价格，我们无法在GPT-4上运行一个完全自主的系统，即使只运行一小时也会每天烧掉数千美元。价格必须下降，同时不能牺牲质量（这里指的是开源模型）。
很难判断何时应该编写明确的代码、进行提示工程，还是构建一个多代理团队。这是一项需要时间才能掌握的新技能。

🧠 2024年多代理/LLM/自主性预测 🧠

2024-predictions

Multi-Agent Postgres 数据分析工具快速上手指南

本指南旨在帮助开发者快速部署并体验基于多智能体（Multi-Agent）架构的 Postgres 数据库自然语言查询工具。

注意：本项目是一个实验性学习工具，旨在展示多智能体系统的构建概念与模式，而非一个成熟的生产级框架或库。建议结合配套的视频系列深入理解其设计思路。

环境准备

在开始之前，请确保您的开发环境满足以下要求：

操作系统：Linux, macOS 或 Windows (WSL2 推荐)
Python 版本：Python 3.10 或更高版本
包管理器：已安装 Poetry
数据库：可访问的 PostgreSQL 数据库实例
API 密钥：有效的 OpenAI API Key (需支持 GPT-4 或 Assistance API)

安装步骤

1. 克隆代码库

首先将项目克隆到本地：

git clone https://github.com/disler/multi-agent-postgres-data-analytics.git
cd multi-agent-postgres-data-analytics

2. 选择分支（可选）

该项目每个分支对应视频教程的一个阶段。您可以查看所有分支并切换到特定版本进行学习：

# 查看所有分支
git branch -a

# 切换到指定分支 (例如 v10 最终版)
git checkout v10-talk-to-your-database-beta-launch

如果不切换，默认使用当前主分支代码。

3. 安装依赖

使用 Poetry 安装项目所需依赖：

poetry install

(国内用户若遇到下载慢的问题，可尝试配置 Poetry 使用国内源，或在 pyproject.toml 中调整源设置)

4. 配置环境变量

复制示例配置文件并填入您的凭证：

cp .env.sample .env

编辑 .env 文件，填入以下关键信息：

OPENAI_API_KEY: 您的 OpenAI API 密钥
DATABASE_URL: 您的 PostgreSQL 连接字符串 (格式如: postgresql://user:password@host:port/dbname)

基本使用

配置完成后，您可以通过命令行直接向数据库提问。系统会自动调度多个 AI 智能体来解析意图、生成 SQL 并返回结果。

运行示例

执行以下命令启动智能体并进行查询：

poetry run start --prompt "查询数据库中用户数量最多的前 5 个城市"

使用建议：

由简入繁：初次使用时，建议先提出简单的统计问题（如“总共有多少张表？”、“某列的平均值是多少？”），以熟悉系统的响应模式。
自然语言：直接使用日常语言描述需求，无需编写 SQL。
观察过程：系统将展示多智能体之间的协作过程（包括思考、生成 SQL、执行纠错等步骤）。

提示：本项目的核心价值在于理解多智能体协作模式（如 Orchestrator, Decision Agents, Instruments 等概念），鼓励开发者阅读源码并结合视频教程进行二次开发。

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

★ 349.3k|★★★☆☆|昨天

Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|2天前

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 142.7k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 107.9k|★★☆☆☆|昨天

开发框架图像Agent

LLMs-from-scratch

LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目，旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型（LLM）。它不仅是同名技术著作的官方代码库，更提供了一套完整的实践方案，涵盖模型开发、预训练及微调的全过程。该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型，却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码，用户能够透彻掌握 Transformer 架构、注意力机制等关键原理，从而真正理解大模型是如何“思考”的。此外，项目还包含了加载大型预训练权重进行微调的代码，帮助用户将理论知识延伸至实际应用。 LLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API，而是渴望探究模型构建细节的技术人员而言，这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计：将复杂的系统工程拆解为清晰的步骤，配合详细的图表与示例，让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础，还是为未来研发更大规模的模型做准备

★ 90.1k|★★★☆☆|昨天

语言模型图像Agent

Deep-Live-Cam

Deep-Live-Cam 是一款专注于实时换脸与视频生成的开源工具，用户仅需一张静态照片，即可通过“一键操作”实现摄像头画面的即时变脸或制作深度伪造视频。它有效解决了传统换脸技术流程繁琐、对硬件配置要求极高以及难以实时预览的痛点，让高质量的数字内容创作变得触手可及。这款工具不仅适合开发者和技术研究人员探索算法边界，更因其极简的操作逻辑（仅需三步：选脸、选摄像头、启动），广泛适用于普通用户、内容创作者、设计师及直播主播。无论是为了动画角色定制、服装展示模特替换，还是制作趣味短视频和直播互动，Deep-Live-Cam 都能提供流畅的支持。其核心技术亮点在于强大的实时处理能力，支持口型遮罩（Mouth Mask）以保留使用者原始的嘴部动作，确保表情自然精准；同时具备“人脸映射”功能，可同时对画面中的多个主体应用不同面孔。此外，项目内置了严格的内容安全过滤机制，自动拦截涉及裸露、暴力等不当素材，并倡导用户在获得授权及明确标注的前提下合规使用，体现了技术发展与伦理责任的平衡。

★ 88.9k|★★★☆☆|昨天

开发框架图像Agent