rgthree-comfy

GitHub
3k 214 简单 1 次阅读 今天MIT图像
AI 解读 由 AI 自动生成,仅供参考

rgthree-comfy 是一款专为 ComfyUI 设计的增强插件,旨在让复杂的节点工作流变得更加整洁、高效和易用。它通过提供一系列精心优化的自定义节点,解决了原生界面中连线杂乱、种子管理不便以及大型工作流难以导航等痛点。

该工具特别适合经常使用 ComfyUI 进行 AI 绘画创作的设计师、艺术家及高级玩家。其核心亮点包括:直观的种子控制节点,支持随机、固定及自动递增/递减模式,操作逻辑类似 Automatic1111;功能强大的重路由(Reroute)节点,允许用户自由调整连线方向与尺寸,大幅减少视觉混乱;以及书签节点,支持设置快捷键快速跳转至特定区域并调整缩放级别,极大提升了长工作流的编辑效率。此外,它还提供了上下文(Context)节点,能够轻松合并或拆分数据流,简化了节点间的连接逻辑。rgthree-comfy 不仅功能实用,还内置了详细的节点帮助文档和灵活的配置选项,帮助用户在保持工作流清晰的同时,更专注于创意实现。

使用场景

一位资深 AI 绘图师正在 ComfyUI 中构建一个包含多分支实验(如不同采样器、提示词变体)的复杂工作流,需要频繁切换视角并复用历史生成参数。

没有 rgthree-comfy 时

  • 连线杂乱难读:原生 Reroute 节点功能单一,无法调整尺寸或方向,导致长距离连线交织成“蜘蛛网”,逻辑走向难以追踪。
  • 导航效率低下:在大型画布中寻找特定模块需反复缩放和平移,缺乏快速定位机制,打断创作心流。
  • 种子控制繁琐:修改随机种子需手动输入数字或连接额外节点,无法像 Automatic1111 那样一键“随机化”或“复用上次种子”。
  • 参数传递冗余:在不同分支间传递通用属性(如模型、VAE)时,需重复连接大量线缆,不仅占用空间且容易出错。

使用 rgthree-comfy 后

  • 布线整洁灵活:利用增强版 Reroute 节点,可自由调整连线宽度、高度及布局,将杂乱的线路整理为清晰的平行线束,视觉逻辑一目了然。
  • 一键极速跳转:通过 Bookmark 节点设置快捷键(如 Alt+Shift+1),瞬间将视图锚定至关键区域并自动适配缩放比例,大幅减少无效操作。
  • 智能种子管理:Seed 节点支持输入 -1 自动随机、-2 递增等快捷指令,并能直接从拖入的图片中读取元数据种子,实验迭代更加流畅。
  • 上下文高效合并:借助 Context 节点,可在单个节点内轻松合并或拆分多组数据流,用极简的连接方式替代了原本冗长的“管道”连线。

rgthree-comfy 通过优化连线交互、导航体验及核心参数控制,将原本臃肿混乱的 ComfyUI 工作流转变为整洁、高效且易于维护的生产管线。

运行环境要求

操作系统
  • 未说明
GPU

未说明

内存

未说明

依赖
notes该工具是 ComfyUI 的自定义节点插件,并非独立运行的应用程序。因此,其运行环境完全取决于宿主软件 ComfyUI 的要求。安装时需将其克隆到 ComfyUI 的 `custom_nodes` 目录下。配置可通过右键菜单或 `rgthree_config.json` 文件进行管理。
python未说明
ComfyUI
rgthree-comfy hero image

快速开始

rgthree-comfy
让 ComfyUI 更加舒适!

节点   |   改进与功能   |   链接修复器


这是一系列在玩转 ComfyUI 时创建的节点和改进。我制作它们是为了让自己的工作流更整洁、更轻松、更快捷。欢迎你也试试看。不过请记住,这些工具是我根据自己的使用场景设计的 :).

上下文节点

开始使用

安装

  1. 安装优秀的 ComfyUi
  2. 将此仓库克隆到 custom_modules 目录下:
    cd ComfyUI/custom_nodes
    git clone https://github.com/rgthree/rgthree-comfy.git
    
  3. 启动 ComfyUI。

设置

你可以配置 rgthree-comfy 的某些方面。例如,未来 ComfyUI 的某个更改可能会破坏 rgthree-comfy,或者你已经有一个类似的扩展,想为 rgthree-comfy 关闭它。

可以通过右键点击图中的空白处,选择 rgthree-comfy > Settings (rgthree-comfy),或者在 ComfyUI 的设置对话框中点击 rgthree-comfy settings 来进入 rgthree 设置。

(注意:设置存储在 rgthree-comfy 目录下的 rgthree_config.json 文件中。还有一些高级设置只能在那里进行配置;在修改之前,可以先从 rgthree_config.json.default 中复制默认设置)。


✴️ 节点

请注意,对于许多 rgthree-comfy 节点,你可以右键单击并选择 🛟 Node Help 菜单项,以获取应用内帮助(如果可用)。

种子

一个直观的种子控制节点,适用于 ComfyUI,其操作方式与 Automatic1111 的种子控制非常相似。

ℹ️ 更多信息
  • 将种子值设为 -1 可以每次使用随机种子。
  • 设为其他数字则会使用固定的种子。
  • 提供快速操作,可随机化或重新使用上次排队的种子。
  • 图像元数据会保存种子值(因此拖入一张图片时,其种子字段已自动设置为其原始种子)。
  • 秘密功能:你可以手动将种子值设为 -2-3,以递增或递减上一次使用的种子值。如果没有上一次的种子值,则会随机生成一个。

路由器节点

重路由

使用这个功能强大的重路由节点,保持你的工作流整洁。它支持多方向和多种尺寸的实际重路由。

ℹ️ 更多信息
  • 右键菜单可用于更改宽度、高度和连接布局。
  • 还可以切换是否可调整大小(最小尺寸为 40x43,但可以调整),以及标题/类型显示。

路由器节点 </details

书签 (🔖)

在画布上的任意位置放置书签节点,然后通过快捷键快速跳转到该位置。

ℹ️ 更多信息
  • 定义 shortcut_key,按下该键即可直接跳转到位于左上角的书签节点。
  • 你还可以定义缩放级别!
  • 小贴士:shortcut_key 可以是多个键的组合。例如,“alt + shift + !” 需要同时按下 Alt 键、Shift 键和“!” 键(即按住 Shift 键时的“1”键)才能触发。 </details

上下文 / 大型上下文

在整体流程中传递属性,并合并新数据。类似于其他一些节点套件中的“管道”,但它更容易合并,也更容易与标准节点互操作——只需一个节点就能完成合并和拆分。

ℹ️ 更多信息
  • Context 和 Context Big 彼此向后兼容。也就是说,连接到 Context Big 的输入会通过 CONTEXT 输出传递给普通的 Context 节点,并作为其中一个输出提供(或者仅在 Context Big 节点上有输出时,比如“steps”)。
  • 小贴士:当把 Context 的输出拖到另一个节点上时,按住 “ctrl” 键并释放,即可自动将其他 Context 输出连接到目标节点。
  • 小贴士:你可以从菜单中切换 Context 和 Context Big 节点。

上下文节点 </details

图像比较器

图像比较器节点会将两张图像叠加在一起进行比较。

ℹ️ 更多信息
  • 注意:右键菜单可能会显示图像选项(打开图像、保存图像等),这些选项会根据点击位置而作用于第一张图像(image_a)或第二张图像(image_b)。
  • 输入:
    • image_a 必填。 用于比较的第一张图像。如果未提供 image_b,且 image_a 是一批图像,则比较器会使用 image_a 中的前两张图像。
    • image_b 可选。 用于比较的第二张图像。只有当 image_a 是包含两张图像的批次时,此输入才为可选。
  • 属性: 你可以通过右键点击节点并选择“Properties”或“Properties Panel”来更改以下属性:
    • comparer_mode - 可选择“滑动”或“点击”。默认为“滑动”。

图像插入裁剪

该节点允许你根据像素值或百分比值裁剪输入图像。

显示任意内容

在执行后显示来自后端的大多数文本数据。

强力 LoRA 加载器

一个超级简单的 LoRA 加载器节点,可以一次性加载多个 LoRA,并快速切换每个 LoRA,所有功能都浓缩在一个超紧凑的节点中。

ℹ️ 更多信息
  • 点击“+ Add Lora”按钮即可添加任意数量的 LoRA,几乎没有任何限制!
  • 右键点击 LoRA 控件,会出现特殊选项,可以将其向上或向下移动(仅影响显示顺序,不影响图像效果)、开启或关闭,或直接删除整行。
  • 在属性中,将 Show Strengths 设置为显示单一的简单强度值(模型和 CLIP 均使用该值),或切换到更高级的视图,分别调整模型和 CLIP 的强度。 </details

LoRA 加载堆栈

已弃用。 请改用 Power Lora Loader

一个简化的 LoRA 加载堆栈。与其他套件类似,但与标准输入/输出的兼容性更强。

励能提示词

让你的提示词更强大,添加嵌入、LoRA 的下拉菜单,甚至可以保存提示词片段。

ℹ️ 更多信息
  • 本质上,你可以将励能提示词当作一个字符串原语节点使用,同时增加用于选择嵌入和 LoRA 的下拉菜单,无需进一步处理。它会直接输出原始的 TEXT 到另一个节点,用于 LoRA 处理、CLIP 编码等。
  • 将一个 CLIP 节点连接到输入端,即可对文本进行编码,该节点会同时输出 CLIPCONDITIONING 数据。
  • 将一个 MODEL 节点连接到输入端,可以自动解析并加载文本中的 <lora:...> 标签,而无需单独使用 LoRA 加载器。

励能提示词 - 简单版

与上述励能提示词相同,但不支持 LoRA;专为稍显简洁的负面提示词设计 (因为负面提示词不支持 LoRA)

SDXL 励能提示词 - 正面

上述励能提示词的 SDXL 版本。它包含 text_gtext_l 作为独立的文本输入,以及几个额外的输入槽,以确保正确的 CLIP 编码。可与以下内容结合使用:

SDXL 励能提示词 - 简单版

类似于非 SDXL 的“励能提示词 - 简单版”节点,这个版本基本上与 SDXL 励能提示词相同,但不支持 LoRA,适用于非 LoRA 的正面提示词或 SDXL 的负面提示词 (因为负面提示词不支持 LoRA)

SDXL 配置

仅是一些用于 SDXL 提示词的配置字段。其实也可以用于非 SDXL 情况。

上下文切换 / 大型上下文切换

一个强大的分支工作流节点。它会选择第一个非空的上下文输入。

ℹ️ 更多信息
  • 输入多个上下文节点,上下文切换节点会自动选择第一个非空的上下文继续执行。
  • 想知道如何将上下文设置为 null?请与 快速静音快速组静音 结合使用。

任意切换

一个功能强大的节点,类似于上述的上下文切换节点,会选择第一个非空的输入。

ℹ️ 更多信息
  • 输入多个相同类型的输入,任意切换节点会自动选择第一个非空值继续执行。
  • 想知道如何将上下文设置为 null?请与 快速静音快速组静音 结合使用。

励能原语

一个可以输出原语(STRING、INT、FLOAT、BOOLEAN)的单一节点。如果连接了输入,它会将输入的原语类型转换为所需的输出类型。

ℹ️ 更多信息
  • 你可以从右键菜单或属性中隐藏类型选择输入。
  • 你还可以通过右键菜单快速切换输出类型。

励能计算

一个功能强大且用途广泛的节点,通过多行代码解析来实现多种实用功能。该节点可用于简单的字符串拼接或数学运算;也可以用于获取图像尺寸或节点的小部件,并进行高级列表推导。如果你需要在工作流中输出某些内容,这就是合适的节点。

更多文档可在 wiki 中找到。

ℹ️ 更多信息
  • 可以评估几乎任何类型的输入,并选择 INT、FLOAT、STRING 或 BOOLEAN 作为输出。

  • 连接一些节点,即可进行简单的数学运算,如 a + bceil(1 / 2)

  • 也可以做更复杂的事情,比如输入一张图片,然后获取其宽度,例如 a.shape[2]

  • 更加强大的是,你可以针对发送到后端的提示词中的节点进行操作。例如,如果你有一个 ID 为 5 的励能 LoRA 加载器节点,并希望获取已启用 LoRA 的逗号分隔列表,可以输入:

    loras = [v.lora for v in node(5).inputs.values() if 'lora' in v and v.on]
    ', '.join(loras)
    

快速组静音

快速组静音是一个无输入节点,它可以自动收集当前工作流中的所有组,并允许你快速静音或取消静音组内的所有节点。

ℹ️ 更多信息
  • 组会自动显示,不过你可以在 节点属性 中进行筛选、排序等操作 (右键点击节点,然后从菜单中选择“属性”或“属性面板”)。属性包括:

  • matchColors - 仅添加与指定颜色匹配的组。可以是 ComfyUI 颜色(红色、浅蓝色)或十六进制代码(#a4d399)。可以添加多个颜色,用逗号分隔。

  • matchTitle - 根据标题匹配(字符串匹配或正则表达式)过滤切换列表。

  • showNav - 添加或移除快速导航箭头,以便跳转到该组。(默认:真)

  • showAllGraphs - 显示工作流中所有[子]图中的组。(默认:真)

  • sort - 按“字母数字”顺序、图“位置”或“自定义字母表”对切换项进行排序。(默认:“位置”)

  • customSortAlphabet - 当排序属性设置为“自定义字母表”时,你可以在此处定义要使用的字母表,系统会根据每个组名称的开头字母进行匹配并排序。如果组名与自定义字母表中的条目不匹配,则会按字母数字顺序排在匹配的组之后。

    这可以是一个单个字符的列表,如“zyxw…”;也可以是更精细控制的逗号分隔字符串,如“sdxl,pro,sd,n,p”。

    注意,当两个组名匹配同一个自定义字母表条目时,正常的字母数字顺序会打破平局。例如,自定义字母表为“e,s,d”的情况下,组名会按照“SDXL、SEGS、Detailer”的顺序排列,尽管自定义字母表中“e”在“d”之前(人们可能会预期“SE”应该排在“SD”之前)。

    如果希望“SEGS”排在“SDXL”之前,可以使用更长的字符串。例如,自定义字母表值为“se,s,f”时,就可以达到这一效果。

  • toggleRestriction - 可选地,尝试限制最多只能启用一个或始终只启用一个节点的小部件。

    注意:如果使用“最多一个”或“始终一个”的设置,那么只有在点击此节点上的切换开关时才会强制执行;如果在初始切换点击之外更改组内的节点,则不会强制执行这些限制,可能导致同时启用多个切换的情况。如果节点被多个组重叠覆盖,也可能出现这种情况。

快速组旁路

与上述 快速组静音 相同,但会将连接的节点设置为“旁路”而不是“静音”

快速静音器

一个强大的“控制面板”节点,可快速切换已连接节点的静音状态,使其迅速被静音或启用。

ℹ️ 更多信息
  • 添加一个包含所有已连接节点的集合,将其作为一个“仪表盘”放置在画布上,以便快速启用和禁用节点。提供两个独立的节点:一个用于“静音”已连接节点,另一个用于“旁路”已连接节点。

快速旁路器

与快速静音器相同,但会将已连接节点设置为“旁路”状态。

快速操作按钮

哇哦,这个节点可以让你对已连接的节点和/或 ConfyUI 进行半自动化操作。

ℹ️ 更多信息
  • 连接节点后,只需按下按钮即可至少对它们进行静音、旁路或启用操作。
  • 某些节点还会暴露额外的操作选项。例如,在 Seed 节点上,按下按钮时可以选择“每次随机”或“使用上次排队的种子”。
  • 此外,还可以通过节点属性设置快捷键,无需点击即可切换按钮的操作!

节点收集器

用于整理混乱的连线,它可以接受任意数量的输入节点,并将它们传递给另一个节点。

⚠️ 目前,此节点最好仅连接到 快速静音器快速旁路器静音/旁路中继器

静音/旁路中继器

一个功能强大的节点,会将其静音/旁路/激活模式分发给所有已连接的输入节点;如果该节点位于一个没有连接任何输入的组中,则会将其静音/旁路/激活模式分发给该组中的所有节点。

ℹ️ 更多信息
  • 💡 小贴士 #1:将此节点的输出连接到 快速静音器快速旁路器,这样你就可以通过一个开关一键静音、旁路或启用多个节点。

  • 💡 小贴士 #2:将一个 静音/旁路中继器 节点连接到此节点的输入端,使中继器能够自动将静音/旁路/启用的状态变化传递给中继器。

静音/旁路中继器

一个高级节点,当与 静音/旁路中继器 配合使用时,它会将其输入节点的模式(静音、旁路或激活)中继到一个连接的中继器上,而该中继器则会将这一模式变化重复应用到其所有输入节点上。

ℹ️ 更多信息
  • 当所有已连接的输入节点都处于静音状态时,中继器会默认将连接的中继器设置为静音状态。
  • 当所有已连接的输入节点都处于旁路状态时,中继器会默认将连接的中继器设置为旁路状态。
  • 当_任何_已连接的输入节点处于激活状态时,中继器会默认将连接的中继器设置为激活状态。
  • 注意:如果没有连接任何输入,中继器会根据其自身模式的变化来设置连接中继器的模式。注意,如果连接了任何输入,则上述规则将生效,此时中继器自身的模式将不再起作用。
  • 进阶小贴士:你可以在“属性”中更改上述信号的发送方式。例如,你可以配置一个反向中继器,使其在任何输入处于激活状态时发送静音信号(而不是激活信号),而在所有输入都处于静音状态时发送激活信号(而不是静音信号)等。

随机解静音器

一个高级节点,用于在图表排队时随机解除其中一个输入的静音状态,并立即重新将其静音。

ℹ️ 更多信息
  • 注意:所有输入节点必须一开始就被静音;否则,此节点将无法随机解除其他节点的静音。(这一点非常强大,因为生成的图像可以直接拖入,所选的输入节点就已经被解静音并开始工作,无需进一步操作。)
  • 提示:将一个中继器的输出连接到此节点的输入端,并将该中继器放置在一个没有任何其他输入的组中,这样它就能对该组的所有节点进行静音/解静音操作。

标签

一个纯粹的视觉节点,允许你在工作流中添加一个浮动标签。

ℹ️ 更多信息
  • 显示的文本是节点的“标题”,你可以在节点属性中调整字体大小、字体系列、字体颜色、文本对齐方式,以及背景颜色、内边距、背景边框圆角半径和旋转角度(以度为单位)。只需双击节点即可打开属性面板。
  • 标题还支持使用转义序列“\n”来在绘制标签时插入换行符。
  • 进阶小贴士 #1:你可以在属性面板中添加多行文本 _(因为 ComfyUI 允许在那里使用 Shift + Enter 键)。
  • 进阶小贴士 #2:你可以使用 ComfyUI 的原生“固定”选项(右键菜单中),使标签固定在工作流上,并且鼠标点击可以穿透标签。你也可以随时右键取消固定。
  • 进阶小贴士 #3:颜色值是十六进制字符串,例如“#FFFFFF”代表白色,“#660000”代表深红色。你还可以提供第7位和第8位数值(或者如果是简写形式则提供第5位和第6位),以创建半透明的颜色。例如,“#FFFFFF88”就是半透明的白色。

高级技巧

首先,谈谈静音的重要性

这些节点的强大之处很大程度上源于“静音”。静音是正确实现利用上下文切换节点的工作流多路径的基础。

虽然其他扩展也可能提供类似的切换功能,但它们常常处理不当,导致你的工作流执行了不必要的计算。有些切换节点虽然有选择器来决定传递哪个输入,但却不会停止其他输入的执行,这会造成资源浪费。相比之下,上下文切换节点的工作原理是选择第一个非空的上下文进行传递,而正确的静音操作正是让之前的节点变为“空”的一种方法,并且在正确设置的情况下不会产生额外的工作量。

理解静音,就是理解图流的运行机制

静音功能,以及开关节点的使用,常常会让初学者感到困惑。这是因为人们往往会认为,静音某个节点或使用开关,应该能够阻止或引导图流的“正向”流动。然而事实并非如此,实际上,ComfyUI 的图流是从后向前开始执行的。

假设你有一个工作流,路径类似于 ... > 上下文 > KSampler > VAE 解码 > 保存图像。乍一看,你可能会觉得,只要静音最前面的上下文节点,图流在正向执行时就会在此处停止,从而跳过后续的所有步骤。但很快你就会发现,这样做会导致错误,因为图流并不会真正地“正向”推进。相反,当一个工作流被处理时,它会首先从每个“输出节点”(例如预览图像、保存图像,甚至是显示字符串等)开始,然后反向追踪所有可能的路径,直到找到这些输出节点为止。

以刚才提到的 ... > 上下文 > KSampler > VAE 解码 > 保存图像 为例,我们实际上需要静音的是“保存图像”节点,才能终止这条路径。一旦我们静音了该节点,由于没有了输出节点,整个链路上的其他节点都不会被执行。

接下来,我们来看一个具体的示例。

强大的组合:使用上下文、上下文开关与快速静音器

上下文节点

  1. 使用 上下文开关(截图中为水蓝色)按优先级顺序输入上下文信息。在上述工作流中,Upscale Out 上下文位于首位,因此如果该上下文启用,它将被选作最终输出。若未启用,则会使用来自上方重新路由的第二个输入槽中的上下文信息。

    • 注意,“Upscale Preview”位于 Upscale Out 上下文节点之后,直接使用其图像,而不是通过上采样后的 VAE 解码器 获取图像。这样设计是有意为之:当我们禁用 Upscale Out 上下文时,所有的上采样节点都不会运行,从而节省宝贵的 GPU 资源。如果我们将预览直接连接到 VAE 解码器,即使 Upscale Out 上下文被禁用,上采样操作仍会持续进行以生成预览图像。
  2. 现在,我们可以通过静音来禁用 Upscale Out 上下文节点。只需选中该节点并按下 Ctrl + M 即可。执行此操作后,该节点的输出将变为无,不会传递任何数据给后续节点。在图中可以看到,“Upscale Preview”显示为红色,但这并无大碍——并没有实际的错误会阻止执行。

  3. 接下来,我们将该节点连接到 快速静音器 节点。“快速静音器”作为一个控制面板,可以为任何已连接的节点添加快速切换开关(忽略重新路由)。在图中,我们同时连接了 Upscaler Out 上下文节点和 Save File 上下文节点,因此可以迅速启用或禁用它们。

    • 此处展示的工作流是一种常见模式:我们可以先用随机种子低成本生成若干基础预览图,然后再从中选择一张进行上采样并保存到磁盘。
  4. 最后,作为可选步骤,你可以看到 节点收集器。如果你希望清理杂乱的连线,可以将其连接到静音器上。虽然它可以连接任何内容,但这样做可能会破坏工作流的正常执行。


⚡ 改进与功能

rgthree-comfy 为 ComfyUI 增加了许多改进、功能和优化,这些并不直接与节点相关。

进度条

一个位于应用窗口顶部的极简进度条,用于显示队列大小、当前提示词执行的进度(在同一窗口内),以及多步节点的执行进度。

你可以在 rgthree-comfy 的设置中启用或禁用该进度条,并调整其高度和大小。

ComfyUI 递归优化

🎉 最新版本的 ComfyUI 已经不再存在递归执行效率低下的问题!因此,此功能已被从 rgthree-comfy 中移除。

右键菜单中的“排队选定的输出节点”

有时你只想排队执行一两条通向特定输出节点的路径,而无需运行整个工作流。现在,你只需右键点击某个输出节点,然后选择 排队选定的输出节点 (rgthree) 即可实现这一目标。

ℹ️ 更多信息
  • 选择你想要执行的 输出 节点。

  • 注意:系统只会捕获并遍历输出节点,而不会包括所有选中的节点。因此,如果你同时选择了某个输出节点和其他路径上的节点,那么只有与该输出节点相连的路径会被执行,而其他非输出节点则不会被执行,即便它们也被选中。

  • 注意:整个工作流会被序列化,然后我们再裁剪掉不需要的部分发送到后端。因此,诸如随机/递增/递减种子之类的操作仍然会执行,即使最终该节点并未被包含在内。

长组合框中的子目录自动嵌套

(默认关闭,处于实验阶段;可在 rgthree-comfy 设置中开启)

自动检测长组合框列表(如加载检查点)中的顶级子目录,并将其拆分为子目录。

组标题中的快速静音/旁路切换按钮

(默认关闭,处于实验阶段;可在 rgthree-comfy 设置中开启)

在组标题的右上角添加静音和/或旁路切换图标,方便你一键切换当前查看的组。

导入单个节点的小部件(拖放)

(默认关闭,处于实验阶段;可在 rgthree-comfy 设置中开启)

允许你将前一代的图像或 JSON 工作流拖放到当前工作流中,并覆盖同名节点的小部件(前提是 ID 和类型匹配)。这在你需要多次使用同一通用工作流时非常有用,比如只需要导入前一代的种子、提示词等数据。

可视化编辑器中的“复制图像”选项

右键点击带有图像的节点时,会出现“复制图像”选项,允许你将图像直接复制到剪贴板。

🎓 我认为这项功能已经成熟,因为 ComfyUI 最近也加入了类似的设置。因此,你不会看到两个重复的菜单项;我的代码会在添加之前检查是否已存在“复制图像”选项。

其他小修复

  • 修复了双击时超宽节点选择器的宽度问题。
  • 修正了文本区域的 z-index,避免其覆盖其他元素,例如属性面板或 @pythongosssss 的图像查看器。
  • 默认情况下,在加载工作流时会检查是否存在无效链接,并记录到控制台。(参见下方的链接修复工具。)

📄 链接修复工具

如果你的工作流有时会出现连接缺失,甚至在加载时报错,可以启动 ComfyUI 并访问 http://127.0.0.1:8188/rgthree/link_fixer。在这里,你可以上传图像或工作流的 JSON 文件,以检查并修复任何无效链接。

此外,你还可以在 rgthree-comfy 的设置中启用链接修复检查功能,这样当你加载包含无效链接的工作流时,系统会立即发出警告。

版本历史

v.1.0.02023/09/12

常见问题

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手,旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚,能够直接接入你日常使用的各类通讯渠道,包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息,OpenClaw 都能即时响应,甚至支持在 macOS、iOS 和 Android 设备上进行语音交互,并提供实时的画布渲染功能供你操控。 这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地,用户无需依赖云端服务即可享受快速、私密的智能辅助,真正实现了“你的数据,你做主”。其独特的技术亮点在于强大的网关架构,将控制平面与核心助手分离,确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者,以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力(支持 macOS、Linux 及 Windows WSL2),即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

349.3k|★★★☆☆|4天前
Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。

162.1k|★★★☆☆|5天前
开发框架图像Agent

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。

108.3k|★★☆☆☆|今天
开发框架图像Agent

gemini-cli

gemini-cli 是一款由谷歌推出的开源 AI 命令行工具,它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言,它提供了一条从输入提示词到获取模型响应的最短路径,无需切换窗口即可享受智能辅助。 这款工具主要解决了开发过程中频繁上下文切换的痛点,让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用,还是执行复杂的 Git 操作,gemini-cli 都能通过自然语言指令高效处理。 它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口,具备出色的逻辑推理能力;内置 Google 搜索、文件操作及 Shell 命令执行等实用工具;更独特的是,它支持 MCP(模型上下文协议),允许用户灵活扩展自定义集成,连接如图像生成等外部能力。此外,个人谷歌账号即可享受免费的额度支持,且项目基于 Apache 2.0 协议完全开源,是提升终端工作效率的理想助手。

100.8k|★★☆☆☆|昨天
插件Agent图像

LLMs-from-scratch

LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目,旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型(LLM)。它不仅是同名技术著作的官方代码库,更提供了一套完整的实践方案,涵盖模型开发、预训练及微调的全过程。 该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型,却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码,用户能够透彻掌握 Transformer 架构、注意力机制等关键原理,从而真正理解大模型是如何“思考”的。此外,项目还包含了加载大型预训练权重进行微调的代码,帮助用户将理论知识延伸至实际应用。 LLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API,而是渴望探究模型构建细节的技术人员而言,这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计:将复杂的系统工程拆解为清晰的步骤,配合详细的图表与示例,让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础,还是为未来研发更大规模的模型做准备

90.1k|★★★☆☆|4天前
语言模型图像Agent

Deep-Live-Cam

Deep-Live-Cam 是一款专注于实时换脸与视频生成的开源工具,用户仅需一张静态照片,即可通过“一键操作”实现摄像头画面的即时变脸或制作深度伪造视频。它有效解决了传统换脸技术流程繁琐、对硬件配置要求极高以及难以实时预览的痛点,让高质量的数字内容创作变得触手可及。 这款工具不仅适合开发者和技术研究人员探索算法边界,更因其极简的操作逻辑(仅需三步:选脸、选摄像头、启动),广泛适用于普通用户、内容创作者、设计师及直播主播。无论是为了动画角色定制、服装展示模特替换,还是制作趣味短视频和直播互动,Deep-Live-Cam 都能提供流畅的支持。 其核心技术亮点在于强大的实时处理能力,支持口型遮罩(Mouth Mask)以保留使用者原始的嘴部动作,确保表情自然精准;同时具备“人脸映射”功能,可同时对画面中的多个主体应用不同面孔。此外,项目内置了严格的内容安全过滤机制,自动拦截涉及裸露、暴力等不当素材,并倡导用户在获得授权及明确标注的前提下合规使用,体现了技术发展与伦理责任的平衡。

88.9k|★★★☆☆|4天前
开发框架图像Agent