sd-webui-agent-scheduler

691 89 简单 3 次阅读 3天前图像Agent插件

AI 解读由 AI 自动生成，仅供参考

sd-webui-agent-scheduler 是一个为 Stable Diffusion Web UI（如 Automatic1111 或 Vladmandic 版本）设计的开源任务调度插件，帮助用户更高效地管理批量图像生成任务。它解决了在使用 AI 绘图时手动排队、反复设置参数、无法灵活调整顺序或暂停恢复等痛点，尤其适合需要连续生成多组图像的场景。

无论是设计师想测试不同提示词效果，还是研究人员批量跑实验，或是普通用户想一次安排多个出图任务，都能从中受益。界面直观支持拖拽排序、一键暂停/继续、历史记录回看、任务筛选与重命名，还能双击快速修改参数并重新入队。隐藏功能如“用所有模型排队”或“指定文件夹内模型批量生成”，大幅提升工作效率。

技术亮点在于无缝集成现有 Web UI，提供类桌面应用的任务管理体验，并支持 API 调用，方便进阶用户自动化流程。安装简单，兼容主流分支，只需几秒即可启用。无论你是刚入门的新手还是追求效率的老手，Agent Scheduler 都能让你的 AI 作图流程更从容有序。

使用场景

一位独立游戏美术师正在为新作《星尘幻想》批量生成不同风格的角色立绘，需在3种模型（写实、二次元、赛博朋克）下测试同一组提示词效果。

没有 sd-webui-agent-scheduler 时

每次切换模型都得手动重填提示词、参数和ControlNet设置，重复操作易出错且耗时。
生成中途想插队紧急任务（如老板临时要的封面图），只能中断当前队列或等全部跑完，效率极低。
多个任务跑完后难以回溯哪个图对应哪个模型+参数组合，常需反复截图记录，管理混乱。
想对比“同一提示词 + 不同模型”的效果，必须手动逐个排队，无法一键批量调度。
队列卡住或崩溃后，已排队的任务全丢失，需从头重建，浪费算力与时间。

使用 sd-webui-agent-scheduler 后

直接点击“Enqueue with all checkpoints”，自动将当前设置分发到3个模型并行排队，省去90%重复配置时间。
遇到紧急任务可直接拖拽至队列顶部或点击▶️优先执行，无需中断或等待，灵活响应需求变更。
所有任务历史带参数快照和结果预览，双击ID还能重命名或修改参数重新排队，版本追溯一目了然。
支持按文件夹筛选模型（如只选“anime”子目录），精准控制批量范围，避免无效生成。
队列支持暂停/恢复，意外中断后重启WebUI仍保留任务列表，点击↩️即可续跑，保障长流程稳定性。

sd-webui-agent-scheduler 把零散的手工操作转化为可视化、可调度、可追溯的自动化流水线，让AI图像生成真正融入专业生产节奏。

运行环境要求

GPU

未说明

内存

未说明

依赖

notes需配合 Automatic1111 或 Vladmandic 的 Stable Diffusion WebUI 使用，且版本需兼容指定 commit；启动时需添加 --api 参数以启用 API 功能；建议保持 WebUI 和扩展均为最新版以避免兼容性问题。

python未说明

快速开始

Agent Scheduler

隆重推出 AgentScheduler，一款为 Automatic1111/Vladmandic Stable Diffusion Web UI 打造的扩展插件，助你大幅提升图像生成工作流效率！

兼容性

本版本 AgentScheduler 兼容以下最新版本：

A1111: commit baf64946
Vladmandic: commit 9726b4d

旧版本可能无法正常运行。

安装

使用 Vlad 的 WebUI 分支

该扩展已内置于 Vlad 分支的内置扩展中。

使用内置扩展列表

打开“Extensions”（扩展）标签页
切换到“Install From URL”（从 URL 安装）子标签页
粘贴仓库地址：https://github.com/ArtVentureX/sd-webui-agent-scheduler.git
点击“Install”（安装）

Install

手动克隆

git clone "https://github.com/ArtVentureX/sd-webui-agent-scheduler.git" extensions/agent-scheduler

（第二个参数指定文件夹名称，可自定义）。

基础功能

Extension Walkthrough 1

1️⃣ 输入常规提示词与设置。点击 Enqueue（入队），将当前提示词、设置、ControlNet 等发送至 AgentScheduler。

Extension Walkthrough 2

2️⃣ AgentScheduler 扩展标签页。

3️⃣ 查看所有排队任务、当前正在生成的图像及任务相关信息。拖拽每行开头的句柄可重新调整生成顺序。

4️⃣ 点击 Pause（暂停）停止队列自动生成；点击 Resume（恢复）重新开始。

5️⃣ 点击 ▶️ 优先处理选中任务，或在队列暂停时启动单个任务。点击 Delete（删除）移除不需要的任务。

Extension Walkthrough 3

6️⃣ 显示队列历史记录。

7️⃣ Filter（筛选）任务状态或按文本搜索。

8️⃣ Bookmark（书签）标记任务以便快速筛选。

9️⃣ 双击任务 ID 可 重命名 并快速更新基础参数。点击 ↩️ Requeue（重新入队）旧任务。

🔟 点击每个任务以查看生成结果。

https://github.com/ArtVentureX/sd-webui-agent-scheduler/assets/133728487/50c74922-b85f-493c-9be8-b8e78f0cd061

隐藏功能：

同时对所有检查点（checkpoint）排队

右键点击 Enqueue 按钮并选择 Queue with all checkpoints（使用所有检查点排队），即可快速将当前设置与所有可用检查点一同入队。

对部分检查点排队

启用自定义检查点选择器后（见下方扩展设置），你可以选择一个文件夹（或子文件夹），将其中所有检查点加入队列。例如：选择 anime 将入队 anime\AOM3A1B_oragemixs、anime\counterfeit\Counterfeit-V2.5_fp16 和 anime\counterfeit\Counterfeit-V2.5_pruned。

编辑已排队任务

双击已排队任务进行编辑。可通过修改 task_id 为任务命名，或更新部分基础参数：prompt（提示词）、negative prompt（负面提示词）、sampler（采样器）、checkpoint（检查点）、steps（步数）、cfg scale（CFG 比例）。

扩展设置

前往 Settings > Agent Scheduler 访问扩展设置。

Settings

Disable Queue Auto-Processing（禁用队列自动处理）：勾选此项将在启动时禁用队列自动处理。你也可以在扩展标签页中临时暂停或恢复队列。

Queue Button Placement（队列按钮位置）：更改 UI 上队列入队按钮的位置。

Hide the Checkpoint Dropdown（隐藏检查点下拉菜单）：本扩展提供自定义检查点下拉菜单。

Custom Checkpoint

默认情况下，入队任务使用当前加载的检查点。但切换系统检查点需要时间加载至内存，且图像生成过程中无法更换检查点。你可以使用此下拉菜单快速将带有自定义检查点的任务入队。

Auto Delete Queue History（自动删除队列历史）：选择保留队列历史的时间范围。超过设定时间的任务将被自动删除。请注意，已加书签的任务不会被删除。

API 访问

本扩展的所有功能均可通过 HTTP API 访问。您可以通过 http://127.0.0.1:7860/docs 查看 API 文档。请记得在启动参数中加入 --api。

API docs

任务队列（Queue Task）

两个 API /agent-scheduler/v1/queue/txt2img 和 /agent-scheduler/v1/queue/img2img 支持原始 WebUI API 的所有参数。这些 API 会返回任务 ID，可用于后续更新操作。

{
  "task_id": "string"
}

下载结果

使用 API /agent-scheduler/v1/results/{id} 获取生成的图像。该 API 支持两种响应格式：

Base64 编码的 JSON 格式

{
  "success": true,
  "data": [
    {
      "image": "data:image/png;base64,iVBORw0KGgoAAAAN...",
      "infotext": "1girl\nNegative prompt: EasyNegative, badhandv4..."
    },
    {
      "image": "data:image/png;base64,iVBORw0KGgoAAAAN...",
      "infotext": "1girl\nNegative prompt: EasyNegative, badhandv4..."
    }
  ]
}

带查询参数 zip=true 的 ZIP 文件格式

API 回调（Callback）

在排队任务时传入参数 callback_url 以注册 API 回调。例如：

{
  "prompt": "1girl",
  "negative_prompt": "easynegative",
  "callback_url": "http://somehost:port/task_completed"
}

回调端点必须支持 POST 方法，且请求体需为 multipart/form-data 编码格式。请求体结构如下：

{
  "task_id": "abc123",
  "status": "done",
  "files": [list of image files],
}

使用 FastApi 处理回调的示例代码：

from fastapi import FastAPI, UploadFile, File, Form

@app.post("/task_completed")
async def handle_task_completed(
    task_id: Annotated[str, Form()],
    status: Annotated[str, Form()],
    files: Optional[List[UploadFile]] = File(None),
):
    print(f"Received {len(files)} files for task {task_id} with status {status}")
    for file in files:
        print(f"* {file.filename} {file.content_type} {file.size}")
        # ... 对文件内容进行处理 ...

# Received 1 files for task 3cf8b150-f260-4489-b6e8-d86ed8a564ca with status done
# * 00008-3322209480.png image/png 416400

故障排除

请确保您正在运行最新版本的扩展以及已更新的 WebUI。

要更新扩展，请前往 Extension 标签页，点击 Check for Updates，然后点击 Apply and restart UI。
要更新 WebUI 本身，请在 webui.bat（或 webui.sh）所在目录执行命令 git pull origin master。

排查问题步骤：

检查 WebUI 输出控制台中的错误信息。
在浏览器中按 F12，切换到 Console 标签页并刷新页面，在此处查找任何错误消息。

常见错误：

AttributeError: module 'modules.script_callbacks' has no attribute 'on_before_reload'

如果在输出控制台看到此错误，请尝试将 WebUI 更新至最新版本。

更新：扩展现已改为打印以下警告信息：YOUR SD WEBUI IS OUTDATED AND AGENT SCHEDULER WILL NOT WORKING PROPERLY. 您仍可使用该扩展，但在重新加载后可能无法正常工作。

~~ReferenceError: submit_enqueue is not defined~~

~~如果您点击 Enqueue 按钮无反应，并在浏览器 F12 控制台中发现上述错误，请参考此评论中的步骤。~~

更新：此问题现已修复。

TypeError: issubclass() arg 1 must be a class 请更新扩展，此问题很可能已被修复。

TypeError: Object of type X is not JSON serializable 请更新扩展，此问题应已修复。若仍未解决，请提交 Issue 报告并附上已安装扩展列表。

对于其他错误，欢迎提交新的 Github issue。

贡献

我们欢迎对 Agent Scheduler 扩展项目的贡献！欢迎您通过 GitHub 仓库提交问题、错误报告和功能建议。

如果您觉得本扩展有帮助，请给我们一个 ⭐！

许可证

本项目采用 Apache License 2.0 许可证。

免责声明

本项目的作者不对因使用本软件而产生的任何损害或法律问题负责。用户须自行确保其使用本软件时遵守所有适用法律法规，并承担与使用相关的全部风险。作者不对因输入或输出内容引发的任何版权侵犯或法律问题负责。

由构建 SIPHER//AGI、PROTOGAIA、ATHERLABS 与 SIPHER ODYSSEY 的团队打造

关于 ProtoGAIA

ProtoGAIA 为生成式 AI 图像工作流提供强大的协作功能，旨在帮助各级设计师和创意专业人士更高效地协作，释放创造力，并对创作过程实现完全透明化与追踪管理。

当前 protoGAIA 功能

作为一个致力于将生成式 AI（Generative AI）的强大能力带给大众的开源项目，ProtoGAIA 提供以下核心功能：

✅ 无缝访问：支持桌面端与移动端使用

✅ 强大的宏（Macro）能力，支持任务链式编排，并打包为“宏命令”，便于 AI Agent 自动化执行

✅ 多人协作用户体验。提供强大的协作功能，如实时评论与反馈、版本控制、图片/文件/项目共享等

✅ 房间聊天室（Rooms Chat），支持用户间活跃讨论，并直接在聊天中运行生成式 AI 工作流

✅ 自定义模型管理，包括 Lora、扩散模型（Diffusion Models）、Controlnet 模型等

✅ 强大的语义搜索能力

✅ AI 驱动的智能聊天框，可快速触发生成式 AI 任务与工作流

✅ 站在巨人肩上，整合 A1111/Vladnmandic 等先驱成果，在单一平台上实现从创意构思到最终成果的完整协作流程

✅ 自动化工具，用于处理部分重复性任务

✅ 安全透明，利用哈希（hashing）与元数据追踪模型、Lora、图像的来源与历史，确保可追溯性并提升协作效率

✅ 个性化 UI/UX 设计，兼顾新手与资深用户，可快速通过编辑提示词（prompts）与负向提示词（negative prompts）、选择新训练模型及输出质量等方式，对现有 SD 图像进行再创作

✅ 所有模型、Lora、图像均支持来源追踪（Provenance Tracking），便于追溯与协作

✅ 为新手与资深用户定制 UI/UX，可快速通过编辑提示词与负向提示词、选择新训练模型及输出质量等方式，对现有 SD 图像进行再创作

✅ 生成式 AI 学习文章与教程

✅ 投票系统，评选最佳生成式 AI 图像、模型、配方、宏等

✅ 通过“全局探索”（Global Explore）标签页，开放分享生成式 AI 图像、模型、配方、宏等内容

目标用户

ProtoGAIA 专为以下目标用户群体设计：

创作者
小型设计团队或自由职业者
设计机构与游戏工作室
AI Agent

🎉 敬请关注后续更新

希望您觉得本扩展实用。我们将持续添加新功能并优化体验，以更好地支持您的创意工作流。

欲获取最新动态与更新，请关注我们的 GitHub 与 Twitter。我们欢迎您的反馈与建议，并期待听到 AgentScheduler 如何帮助您简化工作流程、释放创造力！

sd-webui-agent-scheduler 快速上手指南

环境准备

系统要求：支持 Windows / Linux / macOS，推荐使用 NVIDIA GPU + CUDA 环境
前置依赖：
- 已安装并运行 AUTOMATIC1111/stable-diffusion-webui 或 vladmandic/automatic
- WebUI 版本需为最新（至少包含 commit baf6946 或 9726b4d）
- 如需 API 调用，请启动时添加 --api 参数

国内用户建议使用镜像加速拉取模型与扩展，如配置 HF_ENDPOINT=https://hf-mirror.com

安装步骤

方法一：通过内置扩展列表安装（推荐）

打开 WebUI → 进入 Extensions 标签页
切换到 Install from URL 子标签

在输入框粘贴仓库地址：

https://github.com/ArtVentureX/sd-webui-agent-scheduler.git

点击 Install 按钮，等待安装完成
重启 WebUI 生效

方法二：手动克隆安装

在 WebUI 根目录下执行：

git clone "https://github.com/ArtVentureX/sd-webui-agent-scheduler.git" extensions/agent-scheduler

可自定义文件夹名（如 agent-scheduler），不影响功能

方法三：使用 Vlad Fork（已内置）

若你使用的是 vladmandic/automatic，该扩展已预装，无需额外安装。

基本使用

1. 添加任务到队列

在文生图（txt2img）或图生图（img2img）界面填写提示词、参数等
点击 Enqueue 按钮，当前设置将被加入调度队列

💡 高级技巧：右键 Enqueue → 选择 Queue with all checkpoints 可批量为所有模型创建任务

2. 管理队列任务

切换到 AgentScheduler 标签页
查看当前排队任务、生成状态、历史记录
支持操作：
- ▶️ 优先执行选中任务
- 🗑️ 删除任务
- ↔️ 拖拽调整顺序
- ⭐ 收藏任务便于筛选
- 🔍 搜索或按状态过滤
- ↩️ 重新入队历史任务

3. 编辑任务参数

双击队列中的任务 → 弹出编辑窗口
可修改：任务名（task_id）、正向提示词、负向提示词、采样器、模型、步数、CFG值等

4. 启用自动处理（默认开启）

默认启动后自动处理队列
如需手动控制，在设置中勾选 Disable Queue Auto-Processing
在队列页可随时点击 Pause / Resume 控制启停

✅ 至此，你已掌握核心功能！进阶功能如 API 调用、回调通知、自定义模型目录等，请参考官方文档或设置页面。

常见问题

“Enqueue”按钮无法点击，怎么办？

遇到 CUDA 错误“misaligned address”如何解决？

更新到 A1111 1.6.0 后插件导致界面卡死，如何修复？

插件是否支持显示与原生 SD 相同的动态生成进度？

插件使用 CDN 加载的第三方 JS 库，导致离线不可用，如何解决？

任务因 CUDA OOM 崩溃后，整个队列都会失败，能否自动暂停？

相似工具推荐

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|今天

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 139k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 107.7k|★★☆☆☆|2天前

开发框架图像Agent

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。

★ 85k|★★☆☆☆|今天

图像数据工具视频

ragflow

RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。

★ 77.1k|★★★☆☆|昨天

Agent图像开发框架

PaddleOCR

PaddleOCR 是一款基于百度飞桨框架开发的高性能开源光学字符识别工具包。它的核心能力是将图片、PDF 等文档中的文字提取出来，转换成计算机可读取的结构化数据，让机器真正“看懂”图文内容。面对海量纸质或电子文档，PaddleOCR 解决了人工录入效率低、数字化成本高的问题。尤其在人工智能领域，它扮演着连接图像与大型语言模型（LLM）的桥梁角色，能将视觉信息直接转化为文本输入，助力智能问答、文档分析等应用场景落地。 PaddleOCR 适合开发者、算法研究人员以及有文档自动化需求的普通用户。其技术优势十分明显：不仅支持全球 100 多种语言的识别，还能在 Windows、Linux、macOS 等多个系统上运行，并灵活适配 CPU、GPU、NPU 等各类硬件。作为一个轻量级且社区活跃的开源项目，PaddleOCR 既能满足快速集成的需求，也能支撑前沿的视觉语言研究，是处理文字识别任务的理想选择。

★ 74.9k|★★★☆☆|今天

语言模型图像开发框架