AgentPilot

GitHub

538 77 简单 2 次阅读 4天前AGPL-3.0语言模型开发框架图像Agent插件

AI 解读由 AI 自动生成，仅供参考

AgentPilot 是一个开源的 AI 工作流自动化平台，让你轻松创建、组织和运行从简单到复杂的 AI 任务流程。无论是与单个大语言模型对话，还是协调多个 AI 智能体协同完成任务，它都能提供直观流畅的操作体验。

它解决了传统 AI 工具难以灵活编排多步骤、多人协作式任务的问题，特别适合需要反复调试、迭代优化工作流的场景。通过支持分支对话、消息重跑和可视化图结构编排，用户可以像搭积木一样构建并实时交互式调整 AI 流程。

AgentPilot 还具备可定制的界面和基于自然语言的时间调度功能（例如“每小时”或“每年2月29日”），让自动化任务更贴近实际需求。

这款工具主要面向开发者、AI 研究人员和技术爱好者，也适合有一定技术背景的产品经理或设计师，用于快速原型验证或构建个性化的 AI 助手系统。其桌面应用形式降低了部署门槛，开箱即用，同时保留了高度的扩展性与灵活性。

使用场景

一家跨境电商团队的运营专员小李，每周需要从多个平台（Shopify、Amazon、Google Analytics）提取销售和流量数据，生成中英文双语周报，并发送给不同地区的负责人。

没有 AgentPilot 时

需手动登录三个平台分别导出数据，再复制粘贴到 Excel 中清洗整合，耗时约2小时。
撰写周报需先用 ChatGPT 分析数据、生成中文摘要，再切换另一个会话翻译成英文，过程割裂且容易遗漏上下文。
若发现某处数据有误，需从头重跑整个流程，无法局部修改或回溯特定步骤。
每次发送邮件前还需人工核对收件人列表和语言版本，容易发错对象。
自动化尝试依赖复杂脚本，非技术人员难以维护或调整。

使用 AgentPilot 后

小李创建了一个多智能体工作流：一个代理调用各平台 API 获取数据，一个负责分析并生成中文报告，另一个自动翻译并格式化为英文版本。
整个工作流可在图形界面中一键执行，全程无需切换窗口或手动中转信息。
若某环节出错（如翻译不准确），可直接在聊天分支中修改提示词并重新运行该节点，不影响其他部分。
设置“每周一上午9点”自动触发该流程，并根据预设规则自动分发邮件给对应区域负责人。
界面支持自定义输入表单，未来只需调整配置即可适配新增的数据源或报告模板。

AgentPilot 将原本碎片化、易出错的手动操作，转变为可复用、可调试、可调度的端到端 AI 工作流。

运行环境要求

操作系统

Linux
macOS
Windows

GPU

未说明

内存

未说明

依赖

notes支持通过插件集成多种大模型提供商；代码解释器默认支持9种语言；部分功能（如调度器）标记为Premium；从源码构建的详细依赖和环境要求需参考文档 docs/guides/how_to_build.md；Windows版本运行时需保持控制台窗口可见；Linux下创建虚拟环境可能不会自动安装pip。

python未说明

LiteLLM

Instructor

Open Interpreter

快速开始

💬 Agent Pilot

️ AgentPilot desktop demo

一个多功能的工作流自动化系统。创建、组织并执行复杂的 AI 驱动任务。
无论你是想与单个大语言模型（LLM, Large Language Model）聊天，还是与复杂的多成员工作流交互，Agent Pilot 都能提供无缝体验。

凭借直观且功能丰富的界面，你可以轻松设计 AI 工作流，并实时与其进行对话。
支持分支对话（Branching chats），实现灵活的交互和迭代优化。

Agent Pilot 提供可生成且高度可定制的用户界面（UI），允许你创建自定义页面和层级化配置。
这种灵活性让你能够根据自身需求自由设计界面，并轻松集成到你的工作流中。

系统支持定时和周期性工作流，可通过自然语言表达的时间设定运行计划，自动化范围从每秒一次到每闰年一次均可实现。

AgentPilot gif demo

快速开始

二进制文件（Binaries）

平台	下载
Linux	AgentPilot_0.5.1_Linux.tar.gz MD5: e74e736e3efbd459b411ecffc45e936e SHA1: 93b12bd208095f8d8b34395446de23d233a1baed
Windows	AgentPilot_0.5.1_Windows.zip MD5: 17079a8f2faf9683c59d11d0b67a8092 SHA1: c5a30c02f17782ead98c24098e874c9ba2edc950
Mac Intel	AgentPilot_0.5.1_Mac_Intel.tar.gz MD5: 2e1e03e5305ea279df1b76d1a8074cb7 SHA1: 9369152f1b69ff2a4ca476ecf1b377b5ce0e072b

从源码构建：如何从源码构建

[!TIP] 在启动应用前，用新版本可执行文件替换旧版本，即可将旧数据库迁移到新版本。

功能特性

👤 创建智能体（Agents）

创建新智能体，编辑其配置，并将其整理到文件夹中。
多成员工作流可保存为单个智能体，并支持无限嵌套。

📝 管理对话（Chats）

查看、继续或删除之前的工作流对话，并将其整理到文件夹中。

🌱 分支工作流（Branching Workflows）

可编辑消息、工具和代码并重新运行，从而以更实用的方式与工作流交互。
分支功能适用于所有插件和多成员对话。

👥 图形化工作流（Graph Workflows）

无缝地向工作流中添加其他成员或模块，并配置它们之间的交互方式。
垂直对齐的成员将并行执行。

可用成员类型：

User（用户） - 即你自己，将等待你的输入。
Agent（智能体） - 调用大语言模型（LLM）并集成工具和消息生成响应。
Text（文本） - 简单的文本块，可嵌套其他模块。
Code（代码） - 执行任意代码并返回输出结果。
Prompt（提示） - 根据单条提示获取大语言模型（LLM）的响应。
Module（模块） - 运行或获取任意模块中的方法或变量。
Workflow（工作流） - 上述任意类型的组合。

📦 模块块（Blocks）

管理一组可在任意工作流或文本字段中使用的可嵌套模块块，提升复用性和一致性。
默认情况下，模块块是一个简单的文本块，但它也可以是上述任意成员类型，甚至是一个多成员工作流。
这些模块块可快速拖入任意工作流，或在文本字段（如系统消息）中通过花括号引用模块名使用，例如 {block-name}。

🔨 工具（Tools）

创建和管理可分配给智能体的工具。
工具与模块块功能相同，但默认为单个 Code 成员。
工具也可以是完整的工作流，这意味着你的智能体不仅能运行代码，还能执行整个工作流。
可配置工具参数，这些参数可被所有工作流成员类型访问。
参数可在运行时修改并重新执行，从而创建可循环遍历的分支点。

💻 模块（Modules）

模块是运行时导入的 Python 文件。
适用于工具包、守护进程、记忆存储、自定义页面等需要持久化的场景。

📐 可定制 UI

包含一套灵活而强大的基础类，用于构建复杂的层级化配置界面。
整个应用程序均基于此框架构建。
开发者可轻松修改或创建配置页面，即使在应用运行时也可进行。

🕒 调度器（Scheduler，高级功能）

可安排工作流在特定时间或间隔自动运行。
支持自然语言表达式，实现灵活调度。
例如，可设置工作流每 5 分钟运行一次、每天下午 3 点运行，或每月第二个星期二运行。

📄 结构化输出（Structured Outputs）

得益于 Instructor，成员可配置为输出结构化数据。

📦 插件（Addons）

创建并导入自定义插件，以扩展 Agent Pilot 的功能。

💻 代码解释器（Code Interpreter）

Open Interpreter 已集成到 Agent Pilot 中，既可作为独立插件使用，
也可用于执行 9 种语言的代码（Python、Shell、AppleScript、HTML、JavaScript、PowerShell、R、React、Ruby）。

代码可通过以下方式执行：

任意工作流（对话、模块块、工具）中的 'Code' 成员。
角色为 'Code' 的消息。

你应始终理解正在运行的代码，任何执行的代码均由你自己负责。

对于代码消息，可在设置中启用自动运行。
要查看代码消息的实际效果，请与预配置的 Open Interpreter 智能体对话。

🪄 AI 生成（AI Generation）

'System Blocks' 文件夹下的模块用于生成或增强字段。
默认已包含 Claude 的提示词（prompt）生成器，你可以对其进行调整或创建自己的版本。

Prompt - 经 AI 增强的用户输入
Agent - AI 生成的智能体（即将推出）
- System message - AI 生成的系统消息（即将推出）
Page - AI 生成的页面（即将推出）

🔌 插件（Plugins）

Agent Pilot 支持以下插件：

Agent - 创建自定义智能体行为
- Open Interpreter
- OpenAI Assistant
- CrewAI Agent（当前已禁用）
Workflow - 创建工作流行为
- CrewAI Workflow（当前已禁用）
Provider - 添加对模型提供商的支持
- Litellm（支持 100+ 模型）
创建一个插件

👄 语音（Voice）

即将回归
~~智能体可连接文本转语音（text-to-speech）服务，结合个性上下文模块（personality context block），让你的智能体栩栩如生！~~

🔠 模型（Models）

LiteLLM 已集成，并支持以下提供商：

AI21
AWS Bedrock
AWS Sagemaker
Aleph Alpha
Anthropic
Anyscale
Azure OpenAI
Baseten
Cloudflare
Cohere
Custom API Servers（自定义 API 服务器）
DeepInfra
DeepSeek
Gemini
Github
Groq
Huggingface
Mistral
NLP Cloud
Nvidia NIM
Ollama
OpenAI
OpenRouter
PaLM API Google
Perplexity AI
Petals
Replicate
Together AI
VLLM
VertexAI Google
Voyage

贡献（Contributions）

欢迎并感谢您为 Agent Pilot 项目做出贡献。请随时提交 Pull Request。

已知问题（Known Issues）

使用自动运行代码（auto run code）和 Open Interpreter 时需谨慎：任何聊天窗口中，如果最后一条消息是代码，它将自动开始执行。我将添加一个标记，用于记录倒计时是否已被停止。
Windows 的 exe 版本由于一个奇怪的 bug，必须显示控制台窗口。
Linux 上存在一个问题：创建虚拟环境（venv）时不会自动安装 pip。
修改 OpenAI Assistant 的配置不会重新加载该 Assistant，目前需要关闭并重新打开聊天窗口。

如果你觉得这个项目对你有帮助，请考虑通过点个 Star 或打赏来表示支持 :)

BTC:

ETH:

AgentPilot 快速上手指南

环境准备

操作系统：支持 Linux、Windows 和 macOS（Intel 架构）
依赖项：无需额外安装 Python 或其他运行时（官方提供预编译二进制包）
网络要求：首次启动需联网以加载模型配置；若使用本地模型（如 Ollama），请确保对应服务已运行

💡 国内用户建议配置代理或使用支持国内访问的模型提供商（如 OpenRouter、Groq 等）

安装步骤

方法一：下载预编译二进制包（推荐）

根据你的操作系统，从以下链接下载对应版本：

平台	下载链接
Linux	AgentPilot_0.5.1_Linux.tar.gz
Windows	AgentPilot_0.5.1_Windows.zip
Mac Intel	AgentPilot_0.5.1_Mac_Intel.tar.gz

解压后直接运行可执行文件即可：

# Linux 示例
tar -xzf AgentPilot_0.5.1_Linux.tar.gz
cd AgentPilot_0.5.1_Linux
./AgentPilot

⚠️ Windows 用户需保持控制台窗口可见（已知问题）

方法二：从源码构建（高级用户）

参考官方文档：How to build from source

基本使用

1. 启动应用

运行 AgentPilot 可执行文件，首次启动会自动打开图形界面。

2. 配置模型提供商

进入 Settings > Providers
选择一个支持的提供商（如 OpenAI、Ollama、Groq 等）
填写 API Key 或本地地址（例如 Ollama 默认为 http://localhost:11434）

3. 创建简单聊天代理

点击左侧 Agents → + New Agent
选择 Agent 类型
在配置中指定使用的模型（如 gpt-4o 或 llama3）
保存后点击该代理即可开始对话

4. 使用代码解释器（可选）

与内置的 Open Interpreter 代理对话
输入如 画一个正弦波 或 列出当前目录文件 等指令
启用自动运行代码：Settings > Code Interpreter > Auto-run code

🔒 注意：所有执行的代码由你本人负责，请勿运行不可信内容

现在你已可以：

与单个 AI 聊天
创建多成员工作流
使用自然语言调度任务（Premium 功能）
通过 {block-name} 在任意文本字段复用代码块或提示词

版本历史

v0.5.12025/05/15

v0.5.02025/02/21

v0.4.22025/01/23

v0.4.12025/01/21

v0.4.02025/01/16

v0.3.2.12024/09/14

v0.3.22024/09/13

v0.3.12024/07/12

v0.3.02024/07/04

v0.2.02024/03/14

v0.1.72024/01/12

v0.1.62024/01/10

v0.1.52023/12/13

v0.1.42023/12/09

v0.1.32023/12/08

v0.1.22023/12/03

v0.1.12023/12/01

v0.1.02023/11/29

v0.0.92023/10/26

v0.0.22023/10/21

常见问题

是否支持自定义 API 端点 URL？

在 Linux（如 Debian 或 Ubuntu）上启动 AgentPilot AppImage 时出现 libGL 驱动错误怎么办？

AgentPilot 在 Linux 启动时因找不到 configuration.yaml 而崩溃，如何解决？

在 Arch Linux 上运行 AgentPilot 时出现 PySide6 按钮初始化错误（'icon' is not a Qt property）怎么办？

AgentPilot AppImage 在 KDE 桌面环境下启动后立即静默退出，如何排查？

如何正确放置 AgentPilot AppImage 和配置文件以符合 Linux 文件系统规范？

相似工具推荐

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|今天

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 139k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 107.7k|★★☆☆☆|2天前

开发框架图像Agent

NextChat

NextChat 是一款轻量且极速的 AI 助手，旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性，以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发，NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言，它也提供了便捷的自托管方案，支持一键部署到 Vercel 或 Zeabur 等平台。 NextChat 的核心亮点在于其广泛的模型兼容性，原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型，让用户在一个界面即可自由切换不同 AI 能力。此外，它还率先支持 MCP（Model Context Protocol）协议，增强了上下文处理能力。针对企业用户，NextChat 提供专业版解决方案，具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能，满足公司对数据隐私和个性化管理的高标准要求。

★ 87.6k|★★☆☆☆|今天

开发框架语言模型

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。

★ 85k|★★☆☆☆|今天

图像数据工具视频

ragflow

RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。

★ 77.1k|★★★☆☆|昨天

Agent图像开发框架