sd-webui-agent-scheduler

GitHub
691 89 简单 3 次阅读 3天前图像Agent插件
AI 解读 由 AI 自动生成,仅供参考

sd-webui-agent-scheduler 是一个为 Stable Diffusion Web UI(如 Automatic1111 或 Vladmandic 版本)设计的开源任务调度插件,帮助用户更高效地管理批量图像生成任务。它解决了在使用 AI 绘图时手动排队、反复设置参数、无法灵活调整顺序或暂停恢复等痛点,尤其适合需要连续生成多组图像的场景。

无论是设计师想测试不同提示词效果,还是研究人员批量跑实验,或是普通用户想一次安排多个出图任务,都能从中受益。界面直观支持拖拽排序、一键暂停/继续、历史记录回看、任务筛选与重命名,还能双击快速修改参数并重新入队。隐藏功能如“用所有模型排队”或“指定文件夹内模型批量生成”,大幅提升工作效率。

技术亮点在于无缝集成现有 Web UI,提供类桌面应用的任务管理体验,并支持 API 调用,方便进阶用户自动化流程。安装简单,兼容主流分支,只需几秒即可启用。无论你是刚入门的新手还是追求效率的老手,Agent Scheduler 都能让你的 AI 作图流程更从容有序。

使用场景

一位独立游戏美术师正在为新作《星尘幻想》批量生成不同风格的角色立绘,需在3种模型(写实、二次元、赛博朋克)下测试同一组提示词效果。

没有 sd-webui-agent-scheduler 时

  • 每次切换模型都得手动重填提示词、参数和ControlNet设置,重复操作易出错且耗时。
  • 生成中途想插队紧急任务(如老板临时要的封面图),只能中断当前队列或等全部跑完,效率极低。
  • 多个任务跑完后难以回溯哪个图对应哪个模型+参数组合,常需反复截图记录,管理混乱。
  • 想对比“同一提示词 + 不同模型”的效果,必须手动逐个排队,无法一键批量调度。
  • 队列卡住或崩溃后,已排队的任务全丢失,需从头重建,浪费算力与时间。

使用 sd-webui-agent-scheduler 后

  • 直接点击“Enqueue with all checkpoints”,自动将当前设置分发到3个模型并行排队,省去90%重复配置时间。
  • 遇到紧急任务可直接拖拽至队列顶部或点击▶️优先执行,无需中断或等待,灵活响应需求变更。
  • 所有任务历史带参数快照和结果预览,双击ID还能重命名或修改参数重新排队,版本追溯一目了然。
  • 支持按文件夹筛选模型(如只选“anime”子目录),精准控制批量范围,避免无效生成。
  • 队列支持暂停/恢复,意外中断后重启WebUI仍保留任务列表,点击↩️即可续跑,保障长流程稳定性。

sd-webui-agent-scheduler 把零散的手工操作转化为可视化、可调度、可追溯的自动化流水线,让AI图像生成真正融入专业生产节奏。

运行环境要求

GPU

未说明

内存

未说明

依赖
notes需配合 Automatic1111 或 Vladmandic 的 Stable Diffusion WebUI 使用,且版本需兼容指定 commit;启动时需添加 --api 参数以启用 API 功能;建议保持 WebUI 和扩展均为最新版以避免兼容性问题。
python未说明
sd-webui-agent-scheduler hero image

快速开始

Agent Scheduler

隆重推出 AgentScheduler,一款为 Automatic1111/Vladmandic Stable Diffusion Web UI 打造的扩展插件,助你大幅提升图像生成工作流效率!

目录


兼容性

本版本 AgentScheduler 兼容以下最新版本:

旧版本可能无法正常运行。

安装

使用 Vlad 的 WebUI 分支

该扩展已内置于 Vlad 分支 的内置扩展中。

使用内置扩展列表

  1. 打开“Extensions”(扩展)标签页
  2. 切换到“Install From URL”(从 URL 安装)子标签页
  3. 粘贴仓库地址:https://github.com/ArtVentureX/sd-webui-agent-scheduler.git
  4. 点击“Install”(安装)

Install

手动克隆

git clone "https://github.com/ArtVentureX/sd-webui-agent-scheduler.git" extensions/agent-scheduler

(第二个参数指定文件夹名称,可自定义)。

基础功能

Extension Walkthrough 1

1️⃣ 输入常规提示词与设置。点击 Enqueue(入队),将当前提示词、设置、ControlNet 等发送至 AgentScheduler

Extension Walkthrough 2

2️⃣ AgentScheduler 扩展标签页。

3️⃣ 查看所有排队任务、当前正在生成的图像及任务相关信息。拖拽每行开头的句柄可重新调整生成顺序。

4️⃣ 点击 Pause(暂停)停止队列自动生成;点击 Resume(恢复)重新开始。

5️⃣ 点击 ▶️ 优先处理选中任务,或在队列暂停时启动单个任务。点击 Delete(删除)移除不需要的任务。

 Extension Walkthrough 3

6️⃣ 显示队列历史记录。

7️⃣ Filter(筛选)任务状态或按文本搜索。

8️⃣ Bookmark(书签)标记任务以便快速筛选。

9️⃣ 双击任务 ID 可 重命名 并快速更新基础参数。点击 ↩️ Requeue(重新入队)旧任务。

🔟 点击每个任务以 查看 生成结果。

https://github.com/ArtVentureX/sd-webui-agent-scheduler/assets/133728487/50c74922-b85f-493c-9be8-b8e78f0cd061

隐藏功能:

同时对所有检查点(checkpoint)排队

右键点击 Enqueue 按钮并选择 Queue with all checkpoints(使用所有检查点排队),即可快速将当前设置与所有可用检查点一同入队。

image

对部分检查点排队

image

image

启用自定义检查点选择器后(见下方扩展设置),你可以选择一个文件夹(或子文件夹),将其中所有检查点加入队列。例如:选择 anime 将入队 anime\AOM3A1B_oragemixsanime\counterfeit\Counterfeit-V2.5_fp16anime\counterfeit\Counterfeit-V2.5_pruned

编辑已排队任务

双击已排队任务进行编辑。可通过修改 task_id 为任务命名,或更新部分基础参数:prompt(提示词)、negative prompt(负面提示词)、sampler(采样器)、checkpoint(检查点)、steps(步数)、cfg scale(CFG 比例)。

image

扩展设置

前往 Settings > Agent Scheduler 访问扩展设置。

Settings

Disable Queue Auto-Processing(禁用队列自动处理):勾选此项将在启动时禁用队列自动处理。你也可以在扩展标签页中临时暂停或恢复队列。

Queue Button Placement(队列按钮位置):更改 UI 上队列入队按钮的位置。

Hide the Checkpoint Dropdown(隐藏检查点下拉菜单):本扩展提供自定义检查点下拉菜单。

Custom Checkpoint

默认情况下,入队任务使用当前加载的检查点。但切换系统检查点需要时间加载至内存,且图像生成过程中无法更换检查点。你可以使用此下拉菜单快速将带有自定义检查点的任务入队。

Auto Delete Queue History(自动删除队列历史):选择保留队列历史的时间范围。超过设定时间的任务将被自动删除。请注意,已加书签的任务不会被删除。

API 访问

本扩展的所有功能均可通过 HTTP API 访问。您可以通过 http://127.0.0.1:7860/docs 查看 API 文档。请记得在启动参数中加入 --api

API docs

任务队列(Queue Task)

两个 API /agent-scheduler/v1/queue/txt2img/agent-scheduler/v1/queue/img2img 支持原始 WebUI API 的所有参数。这些 API 会返回任务 ID,可用于后续更新操作。

{
  "task_id": "string"
}

下载结果

使用 API /agent-scheduler/v1/results/{id} 获取生成的图像。该 API 支持两种响应格式:

  • Base64 编码的 JSON 格式
{
  "success": true,
  "data": [
    {
      "image": "data:image/png;base64,iVBORw0KGgoAAAAN...",
      "infotext": "1girl\nNegative prompt: EasyNegative, badhandv4..."
    },
    {
      "image": "data:image/png;base64,iVBORw0KGgoAAAAN...",
      "infotext": "1girl\nNegative prompt: EasyNegative, badhandv4..."
    }
  ]
}
  • 带查询参数 zip=true 的 ZIP 文件格式

API 回调(Callback)

在排队任务时传入参数 callback_url 以注册 API 回调。例如:

{
  "prompt": "1girl",
  "negative_prompt": "easynegative",
  "callback_url": "http://somehost:port/task_completed"
}

回调端点必须支持 POST 方法,且请求体需为 multipart/form-data 编码格式。请求体结构如下:

{
  "task_id": "abc123",
  "status": "done",
  "files": [list of image files],
}

使用 FastApi 处理回调的示例代码:

from fastapi import FastAPI, UploadFile, File, Form

@app.post("/task_completed")
async def handle_task_completed(
    task_id: Annotated[str, Form()],
    status: Annotated[str, Form()],
    files: Optional[List[UploadFile]] = File(None),
):
    print(f"Received {len(files)} files for task {task_id} with status {status}")
    for file in files:
        print(f"* {file.filename} {file.content_type} {file.size}")
        # ... 对文件内容进行处理 ...

# Received 1 files for task 3cf8b150-f260-4489-b6e8-d86ed8a564ca with status done
# * 00008-3322209480.png image/png 416400

故障排除

请确保您正在运行最新版本的扩展以及已更新的 WebUI。

  • 要更新扩展,请前往 Extension 标签页,点击 Check for Updates,然后点击 Apply and restart UI
  • 要更新 WebUI 本身,请在 webui.bat(或 webui.sh)所在目录执行命令 git pull origin master

排查问题步骤:

  • 检查 WebUI 输出控制台中的错误信息。
  • 在浏览器中按 F12,切换到 Console 标签页并刷新页面,在此处查找任何错误消息。

常见错误:

AttributeError: module 'modules.script_callbacks' has no attribute 'on_before_reload'

如果在输出控制台看到此错误,请尝试将 WebUI 更新至最新版本。

更新:扩展现已改为打印以下警告信息:YOUR SD WEBUI IS OUTDATED AND AGENT SCHEDULER WILL NOT WORKING PROPERLY. 您仍可使用该扩展,但在重新加载后可能无法正常工作。

ReferenceError: submit_enqueue is not defined

如果您点击 Enqueue 按钮无反应,并在浏览器 F12 控制台中发现上述错误,请参考 此评论 中的步骤。

更新:此问题现已修复。

TypeError: issubclass() arg 1 must be a class 请更新扩展,此问题很可能已被修复。

TypeError: Object of type X is not JSON serializable 请更新扩展,此问题应已修复。若仍未解决,请提交 Issue 报告并附上已安装扩展列表。

对于其他错误,欢迎提交新的 Github issue

贡献

我们欢迎对 Agent Scheduler 扩展项目的贡献!欢迎您通过 GitHub 仓库提交问题、错误报告和功能建议。

如果您觉得本扩展有帮助,请给我们一个 ⭐!

许可证

本项目采用 Apache License 2.0 许可证。

免责声明

本项目的作者不对因使用本软件而产生的任何损害或法律问题负责。用户须自行确保其使用本软件时遵守所有适用法律法规,并承担与使用相关的全部风险。作者不对因输入或输出内容引发的任何版权侵犯或法律问题负责。


由构建 SIPHER//AGIPROTOGAIAATHERLABSSIPHER ODYSSEY 的团队打造

关于 ProtoGAIA

ProtoGAIA 为生成式 AI 图像工作流提供强大的协作功能,旨在帮助各级设计师和创意专业人士更高效地协作,释放创造力,并对创作过程实现完全透明化与追踪管理。

当前 protoGAIA 功能

作为一个致力于将生成式 AI(Generative AI)的强大能力带给大众的开源项目,ProtoGAIA 提供以下核心功能:

✅ 无缝访问:支持桌面端与移动端使用

✅ 强大的宏(Macro)能力,支持任务链式编排,并打包为“宏命令”,便于 AI Agent 自动化执行

✅ 多人协作用户体验。提供强大的协作功能,如实时评论与反馈、版本控制、图片/文件/项目共享等

✅ 房间聊天室(Rooms Chat),支持用户间活跃讨论,并直接在聊天中运行生成式 AI 工作流

✅ 自定义模型管理,包括 Lora、扩散模型(Diffusion Models)、Controlnet 模型等

✅ 强大的语义搜索能力

✅ AI 驱动的智能聊天框,可快速触发生成式 AI 任务与工作流

✅ 站在巨人肩上,整合 A1111/Vladnmandic 等先驱成果,在单一平台上实现从创意构思到最终成果的完整协作流程

✅ 自动化工具,用于处理部分重复性任务

✅ 安全透明,利用哈希(hashing)与元数据追踪模型、Lora、图像的来源与历史,确保可追溯性并提升协作效率

✅ 个性化 UI/UX 设计,兼顾新手与资深用户,可快速通过编辑提示词(prompts)与负向提示词(negative prompts)、选择新训练模型及输出质量等方式,对现有 SD 图像进行再创作

✅ 所有模型、Lora、图像均支持来源追踪(Provenance Tracking),便于追溯与协作

✅ 为新手与资深用户定制 UI/UX,可快速通过编辑提示词与负向提示词、选择新训练模型及输出质量等方式,对现有 SD 图像进行再创作

✅ 生成式 AI 学习文章与教程

✅ 投票系统,评选最佳生成式 AI 图像、模型、配方、宏等

✅ 通过“全局探索”(Global Explore)标签页,开放分享生成式 AI 图像、模型、配方、宏等内容

目标用户

ProtoGAIA 专为以下目标用户群体设计:

  • 创作者
  • 小型设计团队或自由职业者
  • 设计机构与游戏工作室
  • AI Agent

🎉 敬请关注后续更新

希望您觉得本扩展实用。我们将持续添加新功能并优化体验,以更好地支持您的创意工作流。

欲获取最新动态与更新,请关注我们的 GitHub 与 Twitter。我们欢迎您的反馈与建议,并期待听到 AgentScheduler 如何帮助您简化工作流程、释放创造力!

常见问题

相似工具推荐

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。

162.1k|★★★☆☆|今天
开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上

139k|★★☆☆☆|今天
开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。

107.7k|★★☆☆☆|2天前
开发框架图像Agent

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程,旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周,包含 26 节精炼课程和 52 道配套测验,内容涵盖从基础概念到实际应用的完整流程,有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。 无论是希望转型的开发者、需要补充算法背景的研究人员,还是对人工智能充满好奇的普通爱好者,都能从中受益。课程不仅提供了清晰的理论讲解,还强调动手实践,让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持,通过自动化机制提供了包括简体中文在内的 50 多种语言版本,极大地降低了全球不同背景用户的学习门槛。此外,项目采用开源协作模式,社区活跃且内容持续更新,确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路,ML-For-Beginners 将是理想的起点。

85k|★★☆☆☆|今天
图像数据工具视频

ragflow

RAGFlow 是一款领先的开源检索增强生成(RAG)引擎,旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体(Agent)能力相结合,不仅支持从各类文档中高效提取知识,还能让模型基于这些知识进行逻辑推理和任务执行。 在大模型应用中,幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构(如表格、图表及混合排版),显著提升了信息检索的准确度,从而有效减少模型“胡编乱造”的现象,确保回答既有据可依又具备时效性。其内置的智能体机制更进一步,使系统不仅能回答问题,还能自主规划步骤解决复杂问题。 这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统,还是致力于探索大模型在垂直领域落地的创新者,都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口,既降低了非算法背景用户的上手门槛,也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目,它正成为连接通用大模型与行业专有知识之间的重要桥梁。

77.1k|★★★☆☆|昨天
Agent图像开发框架

PaddleOCR

PaddleOCR 是一款基于百度飞桨框架开发的高性能开源光学字符识别工具包。它的核心能力是将图片、PDF 等文档中的文字提取出来,转换成计算机可读取的结构化数据,让机器真正“看懂”图文内容。 面对海量纸质或电子文档,PaddleOCR 解决了人工录入效率低、数字化成本高的问题。尤其在人工智能领域,它扮演着连接图像与大型语言模型(LLM)的桥梁角色,能将视觉信息直接转化为文本输入,助力智能问答、文档分析等应用场景落地。 PaddleOCR 适合开发者、算法研究人员以及有文档自动化需求的普通用户。其技术优势十分明显:不仅支持全球 100 多种语言的识别,还能在 Windows、Linux、macOS 等多个系统上运行,并灵活适配 CPU、GPU、NPU 等各类硬件。作为一个轻量级且社区活跃的开源项目,PaddleOCR 既能满足快速集成的需求,也能支撑前沿的视觉语言研究,是处理文字识别任务的理想选择。

74.9k|★★★☆☆|今天
语言模型图像开发框架