ComfyUI-Inspire-Pack
ComfyUI-Inspire-Pack 是专为 ComfyUI 设计的扩展节点集合,旨在提供与庞大的 Impact Pack 差异化且更轻量化的功能补充。它主要解决了用户在复杂工作流中对精细化控制的需求,特别是填补了区域提示(Regional Prompt)、高级 LoRA 调控以及特定预处理流程中的功能空白。
该工具非常适合希望突破基础生成限制的设计师、进阶玩家及工作流开发者。其核心技术亮点包括:强大的"LoRA 块权重”功能,允许用户通过数值或随机种子精细调节 LoRA 在不同网络层的影响,甚至支持保存和复用权重配置;丰富的"SEGS 支持”节点,让 OpenPose、Canny、深度图等多种 ControlNet 预处理器能精准应用于图像的局部区域;此外,它还提供了兼容 A1111 的节点以确保工作流迁移的一致性,并集成了变体种子等创新特性。需要注意的是,ComfyUI-Inspire-Pack 高度依赖 Impact Pack 环境,使用时请确保相关组件已更新至兼容版本,以获得最佳体验。
使用场景
一位角色设计师需要在 ComfyUI 中为游戏角色生成多套服装变体,同时精确控制不同部位的细节风格。
没有 ComfyUI-Inspire-Pack 时
- 调整 LoRA 对模型各层的影响力度极其困难,只能整体开关,无法实现“上半身强风格化、下半身保留原貌”的精细控制。
- 想要对人物面部、手部或特定衣物区域单独应用 ControlNet(如 OpenPose 或深度图),必须手动切割蒙版并搭建复杂的节点组,流程繁琐且易出错。
- 从 WebUI A1111 迁移工作流时,因参数逻辑差异导致生成结果不一致,需要反复试错才能还原预期效果。
- 缺乏便捷的种子变异功能,在区域性提示词(Regional Prompt)中难以快速生成同一构图下的细微表情或姿态变化。
使用 ComfyUI-Inspire-Pack 后
- 利用
LoRA Loader (Block Weight)节点,通过简单的字符代码(如 R, A, B)即可动态调整 LoRA 在不同网络层的权重,轻松实现局部风格融合。 - 直接调用
OpenPose Preprocessor Provider (SEGS)等专用节点,无需手动分割,即可让 ControlNet 自动识别并仅作用于检测到的特定人体分段(SEGS)。 - 借助 A1111 兼容性支持节点,完美复刻 WebUI 的生成逻辑,确保跨平台工作流的效果高度一致,大幅降低迁移成本。
- 在区域性提示词中启用"Variation Seed"功能,一键固定构图的同时,快速批量产出表情和微动作丰富的角色变体图。
ComfyUI-Inspire-Pack 通过提供细粒度的控制权与自动化分段处理能力,将原本需要数小时调试的复杂局部控制工作流缩短至分钟级。
运行环境要求
- 未说明
未说明 (作为 ComfyUI 插件,依赖宿主环境的 GPU 配置)
未说明

快速开始
ComfyUI-Inspire-Pack
此仓库为 ComfyUI 提供了多种扩展节点。这里的节点与 ComfyUI Impact Pack 中的节点相比,具有不同的特性。目前 Impact Pack 已经变得过于庞大……
注意事项:
- V1.18:若要使用 ‘OSS’ 调度器,请将 ComfyUI 更新至 0.3.28 或更高版本(4月13日或之后),并确保 Impact Pack 版本为 V8.11 或更高。
- V1.9.1 为了避免与核心中的
NOISE类型混淆,已将类型名称更改为NOISE_IMAGE。 - V0.73 Regional Prompt 节点新增了 Variation Seed 功能,该功能仅兼容 Impact Pack V5.10 及以上版本。
- V0.69 不再兼容过时的 ComfyUI IPAdapter Plus。(需使用3月24日或之后发布的版本。)
- V0.64 在 RegionalPrompt… 节点中添加了 sigma_factor 参数,要求 Impact Pack 版本不低于 V4.76。
- V0.62 支持在 Regional IPAdapter 中使用 faceid。
- V0.48 优化了通配符节点。此更新需要 Impact Pack V4.39.2 或更高版本。
- V0.13.2 不兼容旧版 ControlNet 辅助预处理器。若要使用
MediaPipeFaceMeshDetectorProvider,请更新至最新版本(9月17日)。 - 警告:如果您使用的是 0.12 至 0.12.2 版本且未使用 GlobalSeed 节点,您的工作流种子可能会被清除。请立即更新。
节点
Lora 块权重 - 这是一个提供 Lora 块权重相关功能的节点。
- 此节点的功能类似于 sd-webui-lora-block-weight。
LoRA 加载器(块权重):加载 LoRA 时,会应用块权重向量。- 在块向量中,可以使用数字、R、A、a、B 和 b。
- R 是根据随机种子按顺序确定的,而 A 和 B 分别代表 A 和 B 参数的值。a 和 b 则分别是 A 和 B 的一半。
XY 输入:LoRA 块权重:这是 Efficiency Nodes XY Plot 中的一个节点,允许您使用 LoRA 块权重。- 必须确保 X 和 Y 连接正确,并将依赖项连接到 XY Plot。
- 注意:要使用此功能,需将
Efficient Nodes更新至9月3日之后发布的版本。
- 生成 LoRA 块权重:不直接将 LoRA 块权重应用于 MODEL,而是以单独的 LBW_MODEL 形式生成。
- 应用 LoRA 块权重:将 LBW_MODEL 应用于 MODEL 和 CLIP。
- 保存 LoRA 块权重:将 LBW_MODEL 保存为 .lbw.safetensors 文件。
- 加载 LoRA 块权重:从 .lbw.safetensors 文件加载 LBW_MODEL。
SEGS 支持节点 - 这是支持 Impact Pack 中 ApplyControlNet (SEGS) 的节点。
OpenPose 预处理器提供商(SEGS):为在 SEGS 中使用 OpenPose ControlNet,应用 OpenPose 预处理器。- 使用此功能需要安装 ControlNet 辅助预处理器。
Canny 预处理器提供商(SEGS):为在 SEGS 中使用 Canny ControlNet,应用 Canny 预处理器。DW 预处理器提供商(SEGS)、MiDaS 深度图预处理器提供商(SEGS)、LeReS 深度图预处理器提供商(SEGS)、MediaPipe 面部网格预处理器提供商(SEGS)、HED 预处理器提供商(SEGS)、假涂鸦预处理器(SEGS)、动漫线稿预处理器提供商(SEGS)、漫画转动漫线稿预处理器提供商(SEGS)、线稿预处理器提供商(SEGS)、颜色预处理器提供商(SEGS)、修复预处理器提供商(SEGS)、平铺预处理器提供商(SEGS)、MeshGraphormer 深度图预处理器提供商(SEGS)MediaPipeFaceMeshDetectorProvider:此节点提供可用于 Impact Pack 检测器的BBOX_DETECTOR和SEGM_DETECTOR,它们使用 ControlNet 辅助预处理器中的MediaPipe-FaceMesh 预处理器。
A1111 兼容性支持 - 这些节点有助于在 ComfyUI 中精确复现 A1111 的生成效果。
KSampler (Inspire):ComfyUI 使用 CPU 生成随机噪声,而 A1111 使用 GPU。影响在 ComfyUI 中复现 A1111 结果的三个重要因素之一,可以通过KSampler (Inspire)来解决。- 其他要点 #1:请确保在提示词中使用的嵌入没有遗漏 ‘embedding:’,例如 ‘embedding:easynegative.’。
- 其他要点 #2:ComfyUI 和 A1111 对权重的解释不同。为了使两者一致,需要使用 BlenderNeko/Advanced CLIP Text Encode。
KSamplerAdvanced (Inspire):Inspire Pack 版本的KSampler (Advanced)。RandomNoise (inspire):Inspire Pack 版本的RandomNoise。- 共同参数
batch_seed_mode决定如何将种子应用于批量潜变量:comfy:此方法会一次性将噪声应用于所有批量潜变量。这有利于防止在生成图像时因种子重复而导致重复图像的出现。incremental:类似于 A1111 的情况,此方法会逐步增加种子,并依次为每个批次应用噪声。这种方法有利于仅通过种子实现直观的复现。variation_strength:在每个批次中,变化强度从设定的variation_strength开始,每次增加xxx。
variation_seed和variation_strength:由种子生成的初始噪声会通过variation_strength转化为variation_seed的形状。如果variation_strength为 0,则完全依赖于种子的影响;若为 1.0,则完全受variation_seed的影响。- 这些参数适用于希望保持由种子生成的图像构图,同时引入轻微变化的情况。
采样器节点
KSampler 进度(Inspire):在 KSampler 中,采样过程会生成潜变量批次。通过使用来自 ComfyUI-VideoHelperSuite 的Video Combine节点,可以将进度制作成视频。Scheduled CFGGuider (Inspire):这是一个使用线性、对数和指数方法调整 from_cfg 到 to_cfg 调度的 CFGGuider。Scheduled PerpNeg CFGGuider (Inspire):这是一个使用线性、对数和指数方法调整 from_cfg 到 to_cfg 调度的 PerpNeg CFGGuider。
提示支持 - 这些节点用于支持提示处理。
从目录加载提示 (Inspire): 它会按顺序从指定目录中读取提示文件。输出为 ZIPPED_PROMPT。指定位于
ComfyUI-Inspire-Pack/prompts/下的目录一个提示文件可以包含多个提示,用
---分隔。示例:
prompts/example注意: 此节点通过
显示高级提供高级选项- load_cap, start_index
从文件加载提示 (Inspire): 它会按顺序从指定文件中读取提示。输出为 ZIPPED_PROMPT。指定位于
ComfyUI-Inspire-Pack/prompts/下的文件示例:
prompts/example/prompt2.txt注意: 此节点通过
显示高级提供高级选项- load_cap, start_index
从文件加载单个提示 (Inspire): 通过索引从包含多个提示的文件中加载单个提示。提示文件目录可以在
extra_model_paths.yaml中指定为inspire_prompts解压提示 (Inspire): 将 ZIPPED_PROMPT 分离为positive、negative和名称组件。positive和negative表示文本提示,而name表示提示的名称。当使用从文件加载提示 (Inspire)从文件加载时,名称对应于文件名。
压缩提示 (Inspire): 由 positive、negative 和 name_opt 创建 ZIPPED_PROMPT。- 如果省略 name_opt,则视为空名称。
提示提取器 (Inspire): 此节点从图像的元数据中读取提示信息。由于它会提取所有文本,因此需要根据信息直接指定用于positive和negative的提示。全局种子 (Inspire): 这是一个无需单独连接线即可控制全局种子的节点。它仅在小部件名称为 'seed' 或 'noise_seed' 时起作用。此外,如果勾选了 'control_before_generate',则会在执行提示之前控制种子。- 已转换为输入的种子不在此范围内。若需单独控制种子,请将其转换为输入并单独控制。
全局采样器 (Inspire): 此节点类似于 GlobalSeed,可同时为工作流中的所有节点设置 sampler_name 和 scheduler。- 它仅适用于同时具有 sampler_name 和 scheduler 的节点,如果
GlobalSampler被静音,则无效。 - 如果部分
sampler_name和scheduler已转换为输入并连接到 Primitive 节点,则仅对已转换的小部件无效。未转换为输入的小部件仍会受到影响。
- 它仅适用于同时具有 sampler_name 和 scheduler 的节点,如果
绑定 [ImageList, PromptList] (Inspire): 将图像列表和压缩提示列表绑定,以列表形式导出image、positive、negative和prompt_label。如果提示数量多于图像数量,则忽略多余的提示;如果提示不足,则根据图像数量用默认输入填充剩余部分。通配符编码 (Inspire): 是 ImpactWildcardEncode 与 BlenderNeko 的 CLIP 文本编码(高级) 的组合节点。- 使用此节点需要同时安装 Impact Pack 和 高级 CLIP 文本编码 扩展。
- 此节点与
ImpactWildcardEncode相同,但使用的是 ComfyUI 默认 CLIP 文本编码之外的CLIP 文本编码(高级)进行编码。 - 要求:Impact Pack V4.18.6 或更高版本
提示构建器 (Inspire): 此节点是一个便捷节点,允许您通过选择类别和预设轻松组装提示。要修改预设,请编辑ComfyUI-InspirePack/resources/prompt-builder.yaml文件。种子探索器 (Inspire): 此节点通过类似提示的形式逐步调整变异种子,帮助探索种子。- 该功能旨在让您找到喜欢的种子后,在此基础上进行微小变化,并进一步调整。
- 在
seed_prompt中,第一个种子被视为初始种子,反射率被忽略,默认始终为 1.0。 - 每个提示之间用逗号分隔,从第二个种子开始,应采用
seed:strength格式。 - 点击“添加到提示”按钮会将
additional_seed:additional_strength追加到提示中。
复合噪声 (Inspire): 此节点会将源噪声覆盖到目标噪声的特定区域之上。列表随机生成器 (Inspire): 当将列表输出连接到信号输入时,此节点会为列表中的所有项目生成随机值。制作基础管道 (Inspire): 这是一个使用通配符编码创建 BASIC_PIPE 的节点。Add select to决定从Select to...组合框中选择的项是作为正面通配符文本还是负面通配符文本输入。移除 ControlNet (Inspire)、移除 ControlNet [RegionalPrompts] (Inspire): 从 CONDITIONING 或 REGIONAL_PROMPTS 中移除 ControlNet。移除 ControlNet [RegionalPrompts] (Inspire)需要 Impact Pack V4.73.1 或更高版本。
区域节点 - 这些节点简化了按区域应用提示词的操作。
- 区域采样器 - 这些节点有助于在
Impact Pack中轻松使用区域采样器。区域提示简单版 (Inspire): 此节点以mask和basic_pipe作为输入,简化了REGIONAL_PROMPTS的创建。按颜色掩码的区域提示 (Inspire): 与区域提示简单版 (Inspire)类似,此功能接受一张颜色掩码图像作为输入,并通过颜色值来定义区域,该颜色值将用作掩码,而不是直接接收掩码。- 颜色值只能是十六进制代码(如 #FFFF00)或十进制数字的形式。
- 区域条件化 - 这些节点帮助简化
Conditioning (Set Mask)的使用。区域条件化简单版 (Inspire)按颜色掩码的区域条件化 (Inspire)
- 区域 IPAdapter - 这些节点便于在
ComfyUI IPAdapter Plus自定义节点中使用 attn_mask 功能。- 要使用此节点,您需要安装 ComfyUI IPAdapter Plus 扩展。
区域IPAdapter掩码版 (Inspire)、按颜色掩码的区域IPAdapter版 (Inspire)区域IPAdapter编码掩码版 (Inspire)、按颜色掩码的区域IPAdapter编码版 (Inspire): 接受embeds而不是image
- 区域种子探索器 - 这些节点通过种子提示限制变化范围,仅将其应用于被掩码覆盖的区域。
按掩码的区域种子探索器 (Inspire)按颜色掩码的区域种子探索器 (Inspire)
区域CFG (Inspire)- 通过将掩码作为乘数应用于配置的 CFG,允许不同区域拥有不同的 CFG 设置。颜色掩码转深度掩码 (Inspire)- 将规格文本中的颜色图转换为深度值介于 0.0 至 1.0 之间的掩码。- 掩码值的范围限定在 0.0 至 1.0。
- base_value: 设置基础掩码的值。
- dilation: 在扁平化之前对每一层掩码进行膨胀处理。
- flatten_method: 扁平化掩码层的方法。
- 包括由 base_value 设置的基础层在内的各层都会被扁平化。
- override: 每个像素都会被上一层的非零值覆盖。
- sum: 每个像素通过叠加所有层的值来进行扁平化。
- max: 每个像素取所有层中的最大值进行扁平化。
图像工具
从目录批量加载图像 (Inspire): 这几乎与 ComfyUI-Advanced-Controlnet 的LoadImagesFromDirectory相同。这只是经过修改的版本。需要注意的是,即使输入图像尺寸不一致,此节点也会强制将加载的图像尺寸归一化为与第一张图像相同的大小,从而生成一批图像。从目录加载图像列表 (Inspire): 这几乎与从目录批量加载图像 (Inspire)相同。然而,需要注意的是,此节点以列表形式加载数据,而非批量加载,因此会以原始尺寸返回图像,不会进行尺寸归一化。加载图像 (Inspire): 此节点类似于 LoadImage,但加载的图像信息会被存储在工作流中。图像本身会保存在工作流中,从而更方便在其他计算机上重现图像生成过程。更改图像批次大小 (Inspire): 更改图像批次大小simple: 如果batch_size大于输入图像的批次大小,则会复制最后一帧;如果小于,则会简单地进行裁剪。
更改潜在变量批次大小 (Inspire): 更改潜在变量批次大小图像批次拆分器 //Inspire、潜在变量批次拆分器 //Inspire: 该脚本会将一批图像/潜在变量拆分为多个单独的图像/潜在变量,每个数量等于指定的split_count。每增加一个split_count,就会多出一个输出槽。如果图像/潜在变量的数量超过split_count,剩余的部分将以“remained”输出返回。颜色图转掩码 (Inspire): 根据 color_map 提取前 max_count 种颜色并创建掩码。min_pixels 表示每种颜色的最小像素数。选择第 N 个掩码 (Inspire): 从掩码批次中提取第 N 个掩码。
后端缓存 - 用于将后端的任意数据存储在缓存中,并在多个工作流之间共享的节点。
缓存后端数据 (Inspire): 使用字符串键将任何后端数据存储到缓存中。标签用于快速引用。获取后端数据 (Inspire): 使用字符串键从缓存中检索后端数据。移除后端数据 (Inspire): 移除缓存中的后端数据。- 此节点中的删除操作仅将其从 Inspire 管理的缓存中移除,如果该数据仍在其他地方被使用,则不会完全从内存中清除。
signal_opt用于控制此节点的执行顺序;即使没有signal_opt输入,它仍然会运行。- 当使用
*作为键时,会清空所有数据。
显示缓存信息 (Inspire): 显示缓存数据的相关信息。- 默认标签缓存大小为 5。您可以在
cache_settings.json中编辑每个标签的默认大小。 - 运行时标签缓存大小可以在
显示缓存信息 (Inspire)节点上修改。例如:ckpt: 10。
- 默认标签缓存大小为 5。您可以在
缓存后端数据 [数字键] (Inspire)、获取后端数据 [数字键] (Inspire)、移除后端数据 [数字键] (Inspire): 这些节点为自动化流程提供便利,允许使用数字作为键。缓存后端数据列表 (Inspire)、缓存后端数据列表 [数字键] (Inspire): 此节点允许输入列表形式的后端缓存数据。相反,像缓存后端数据 [数字键] (Inspire)这样的节点如果不接受列表输入,一旦接收到列表输入,就会尝试重复缓存并覆盖现有数据。因此,为了避免这种情况,必须为每个元素使用唯一的键。此节点会将整个列表一起缓存。通过此节点检索后端数据时,输出将以列表形式呈现。共享检查点加载器 (Inspire): 通过此加载器加载检查点时,它会自动缓存在后端缓存中。此外,如果该检查点已缓存,则会直接从缓存中获取,而无需重新加载。- 当
key_opt为空时,ckpt_name将被设置为缓存键。缓存键输出可用于与“移除后端”节点配合进行删除操作。 - 该节点解决了在工作流切换过程中重复加载检查点的问题。
- 当
共享扩散模型加载器 (Inspire): 类似于“共享检查点加载器 (Inspire)”,但用于加载扩散模型而非检查点。共享文本编码器加载器 (Inspire): 类似于“共享检查点加载器 (Inspire)”,但用于加载文本编码器模型而非检查点。- 此节点同时充当
CLIPLoader、DualCLIPLoader和TripleCLIPLoader的统一节点。
- 此节点同时充当
Stable Cascade 检查点加载器 (Inspire): 此节点提供了一次性加载 Stable Cascade 的stage_b和stage_c检查点的功能,并可选地提供后端缓存功能。是否已缓存 (Inspire): 返回缓存是否存在。
条件处理 - 用于条件处理的节点
带倍数的条件拼接 (Inspire): 将任意数量的条件拼接在一起,同时为每个条件应用一个倍数。倍数依赖于comfy_PoP,因此必须安装 comfy_PoP。条件放大 (Inspire): 在图像放大时,根据放大倍数扩展条件区域。源自 ComfyUI_Dave_CustomNode。条件拉伸 (Inspire): 在图像放大时,通过指定原始分辨率和目标新分辨率来扩展条件区域。源自 ComfyUI_Dave_CustomNode。
模型 - 用于模型的节点
IPAdapter 模型助手 (Inspire): 提供预设,方便加载 IPAdapter 相关模型。但模型名称必须准确。- 您可以通过 ComfyUI-Manager 下载合适的模型。
列表 - 用于列表处理的节点
浮点范围 (Inspire): 创建一个从start到stop、每次增加step值的浮点列表。会生成一个接近最大限制的列表;当启用ensure_end时,列表的最后一个值将等于停止值。工作列表转项目列表 (Inspire): ComfyUI 中的列表可以重复执行子工作流。此节点将这些重复(即列表)分组为一个单独的 ITEM_LIST 输出。ITEM_LIST 随后可用于 ForeachList。▶Foreach List (Inspire): 从 ITEM_LIST 中逐项提取项目以执行迭代任务的起始节点。\n使用项目和中间输出作为输入生成新的中间_output,然后将其连接到 ForeachListEnd。\n注意:如果省略 initial_input,item_list 中的第一个项目将作为初始值,处理将从 item_list 的第二个项目开始。Foreach List◀ (Inspire): 从 ITEM_LIST 中逐项提取项目以执行迭代任务的结束节点。\n注意:直接将 ForeachListBegin 的输出连接到 'flow_control' 和 'remained_list'。丢弃列表 (Inspire): 从 ITEM_LIST 中移除所有项目。如果通过此节点生成的 ITEM_LIST 被传递给 ForeachListEnd,处理将立即终止。
工具 - 实用工具
转 IPAdapter 管道 (Inspire)、从 IPAdapter 管道 (Inspire): 这些节点有助于方便地使用捆绑的 ipadapter_model、clip_vision 以及应用 IPAdapter 所需的模型。列表计数器 (Inspire): 当列表中的每个项目经过此节点时,计数器会递增 1,生成一个整数值。RGB 十六进制转 HSV (Inspire): 将类似#FFD500的 RGB 十六进制字符串转换为 HSV:
致谢
ComfyUI/ComfyUI - 一个功能强大且模块化的稳定扩散图形界面。
ComfyUI/sd-webui-lora-block-weight - LoraBlockWeight 的最初灵感来源于此,并且其语法也基于该扩展。
jags111/efficiency-nodes-comfyui - Inspire Pack 提供的 XY Input 支持该节点的 XY Plot 功能。
Fannovel16/comfyui_controlnet_aux - Inspire Pack 中的 ControlNet 预处理程序封装依赖于这些节点。
Kosinkadink/ComfyUI-Advanced-Controlnet - 从目录加载图片 (Inspire) 的代码源自此处。
Trung0246/ComfyUI-0246 - 精妙的绕过技巧!
cubiq/ComfyUI_IPAdapter_plus - IPAdapter 相关节点依赖于该扩展。
Davemane42/ComfyUI_Dave_CustomNode - ConditioningStretch 和 ConditioningUpscale 的原作者。
BlenderNeko/ComfyUI_Noise - 用于噪声变化的 slerp 代码。
BadCafeCode/execution-inversion-demo-comfyui - ComfyUI 的参考循环实现。
常见问题
相似工具推荐
openclaw
OpenClaw 是一款专为个人打造的本地化 AI 助手,旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚,能够直接接入你日常使用的各类通讯渠道,包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息,OpenClaw 都能即时响应,甚至支持在 macOS、iOS 和 Android 设备上进行语音交互,并提供实时的画布渲染功能供你操控。 这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地,用户无需依赖云端服务即可享受快速、私密的智能辅助,真正实现了“你的数据,你做主”。其独特的技术亮点在于强大的网关架构,将控制平面与核心助手分离,确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者,以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力(支持 macOS、Linux 及 Windows WSL2),即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你
stable-diffusion-webui
stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。
opencode
OpenCode 是一款开源的 AI 编程助手(Coding Agent),旨在像一位智能搭档一样融入您的开发流程。它不仅仅是一个代码补全插件,而是一个能够理解项目上下文、自主规划任务并执行复杂编码操作的智能体。无论是生成全新功能、重构现有代码,还是排查难以定位的 Bug,OpenCode 都能通过自然语言交互高效完成,显著减少开发者在重复性劳动和上下文切换上的时间消耗。 这款工具专为软件开发者、工程师及技术研究人员设计,特别适合希望利用大模型能力来提升编码效率、加速原型开发或处理遗留代码维护的专业人群。其核心亮点在于完全开源的架构,这意味着用户可以审查代码逻辑、自定义行为策略,甚至私有化部署以保障数据安全,彻底打破了传统闭源 AI 助手的“黑盒”限制。 在技术体验上,OpenCode 提供了灵活的终端界面(Terminal UI)和正在测试中的桌面应用程序,支持 macOS、Windows 及 Linux 全平台。它兼容多种包管理工具,安装便捷,并能无缝集成到现有的开发环境中。无论您是追求极致控制权的资深极客,还是渴望提升产出的独立开发者,OpenCode 都提供了一个透明、可信
ComfyUI
ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。
gemini-cli
gemini-cli 是一款由谷歌推出的开源 AI 命令行工具,它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言,它提供了一条从输入提示词到获取模型响应的最短路径,无需切换窗口即可享受智能辅助。 这款工具主要解决了开发过程中频繁上下文切换的痛点,让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用,还是执行复杂的 Git 操作,gemini-cli 都能通过自然语言指令高效处理。 它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口,具备出色的逻辑推理能力;内置 Google 搜索、文件操作及 Shell 命令执行等实用工具;更独特的是,它支持 MCP(模型上下文协议),允许用户灵活扩展自定义集成,连接如图像生成等外部能力。此外,个人谷歌账号即可享受免费的额度支持,且项目基于 Apache 2.0 协议完全开源,是提升终端工作效率的理想助手。
markitdown
MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具,专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片(含 OCR)、音频(含语音转录)、HTML 乃至 YouTube 链接等多种格式的解析,能够精准提取文档中的标题、列表、表格和链接等关键结构信息。 在人工智能应用日益普及的今天,大语言模型(LLM)虽擅长处理文本,却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点,它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式,成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外,它还提供了 MCP(模型上下文协议)服务器,可无缝集成到 Claude Desktop 等 LLM 应用中。 这款工具特别适合开发者、数据科学家及 AI 研究人员使用,尤其是那些需要构建文档检索增强生成(RAG)系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性,但其核心优势在于为机器