stable-diffusion-prompt-reader

GitHub
1.3k 87 非常简单 1 次阅读 1周前MIT开发框架Agent图像
AI 解读 由 AI 自动生成,仅供参考

Stable Diffusion Prompt Reader 是一款轻量级的独立查看器,专为读取 Stable Diffusion 生成图片中隐藏的提示词(Prompt)而设计。在使用各类 AI 绘图工具时,生成的图片往往嵌入了详细的创作参数,但若不通过原始生成平台或复杂代码,普通用户很难直接查看这些信息。这款工具完美解决了这一痛点,让用户无需启动庞大的 WebUI 界面,即可轻松提取、编辑或移除图片内的元数据。

它非常适合设计师、AI 艺术爱好者以及需要整理素材的研究人员使用。无论是想学习优秀作品的咒语写法,还是批量管理本地图库,都能从中获益。其技术亮点在于广泛的兼容性,支持 Windows、macOS 和 Linux 全平台,并能识别 A1111 WebUI、NovelAI、InvokeAI 等多种主流生成工具的格式。操作极其简便,只需拖拽图片即可查看详情,支持一键复制提示词、导出文本文件,甚至反向将提示词写入图片。此外,它还提供了命令行接口(CLI)以满足开发者需求,并具备深色/浅色模式切换及按字母排序等贴心功能,是探索和管理 AI 绘画作品的高效助手。

使用场景

某数字艺术工作室的设计师在整理海量历史素材库时,需要从数千张由不同 AI 工具生成的图片中快速提取创作参数,以便复用优质风格或进行二次微调。

没有 stable-diffusion-prompt-reader 时

  • 依赖特定环境:必须启动庞大的 Stable Diffusion WebUI 才能查看图片元数据,为了读一个提示词而加载整个模型界面,耗时且占用显存。
  • 格式兼容困难:面对来自 NovelAI、InvokeAI 或旧版工具生成的图片,普通系统自带的图片查看器无法解析其中嵌入的非标准提示词信息。
  • 批量处理低效:无法一次性提取多个文件的参数,只能逐个打开图片复制粘贴,手动记录到文档中,极易出错且效率低下。
  • 信息清洗麻烦:若想去除图片中附带的敏感提示词信息再分享给客户,缺乏便捷的本地化工具进行无损擦除。

使用 stable-diffusion-prompt-reader 后

  • 独立轻量运行:直接拖拽图片到软件界面即可秒级显示完整提示词、负向提示词及生成参数,无需启动任何重型 WebUI 环境。
  • 全格式自动识别:自动检测并解析来自 A1111、NovelAI 等多种生成工具的元数据,统一以清晰的结构化视图呈现,打破格式壁垒。
  • 一键复制与导出:支持将提示词一键复制到剪贴板,或直接批量导出为文本文件,让素材整理和风格复用流程自动化。
  • 灵活编辑与清理:不仅能查看,还能直接在图中修改提示词或一键移除元数据,方便在不重绘的情况下净化图片素材。

stable-diffusion-prompt-reader 将原本繁琐的元数据提取工作转化为简单的拖拽操作,极大提升了 AI 绘图工作流中素材管理与复用的效率。

运行环境要求

操作系统
  • Windows
  • macOS
  • Linux
GPU

未说明

内存

未说明

依赖
notes该工具是一个独立的查看器,用于读取图像元数据,不涉及模型推理,因此无需 GPU。Linux 用户需确保安装 python3-tk 包。macOS 用户通过 Homebrew 安装时需添加 --no-quarantine 参数以避免签名问题。支持通过 pip、pipx 或直接运行源码安装。
python3.10+
tkinter (python3-tk)
stable-diffusion-prompt-reader hero image

快速开始

icon

Stable Diffusion 提示词阅读器

GitHub releases GitHub GitHub release (latest by date) PyPI Code style: black platform

简体中文 | English

一款简单的独立查看器,用于在 WebUI 外部读取 Stable Diffusion 生成图像中的提示词。

功能支持的格式下载使用方法命令行界面ComfyUI 节点常见问题解答致谢

[!TIP] SD 提示词阅读器现在已作为 ComfyUI 节点提供。请查看 ComfyUI 提示词阅读器节点 以获取更多信息。

功能

  • 支持 macOS、Windows 和 Linux。
  • 提供图形界面和命令行界面。
  • 简单的拖放交互。
  • 可将提示词复制到剪贴板。
  • 可从图像中移除提示词。
  • 可将提示词导出为文本文件。
  • 可编辑或导入提示词到图像中。
  • 垂直方向显示及按字母顺序排序。
  • 可检测生成工具。
  • 支持多种格式。
  • 支持深色和浅色模式。

支持的格式

PNG JPEG WEBP TXT*
A1111 的 webUI
Easy Diffusion
StableSwarmUI*
StableSwarmUI(0.5.8-alpha 之前版本)*
Fooocus-MRE*
NovelAI(stealth pnginfo)
NovelAI(旧版)
InvokeAI
InvokeAI(2.3.5-post.2 之前版本)
InvokeAI(1.15 之前版本)
ComfyUI*
Draw Things
Naifu(4chan)

* 存在限制。详情请参阅 格式限制

[!NOTE] 如果您使用的工具或格式未在此列表中,请通过在 Issues 中上传由您的工具生成的原始文件来帮助我支持该格式,谢谢。

[!TIP] 对于 ComfyUI 用户,SD 提示词阅读器现在已作为 ComfyUI 节点提供。
ComfyUI 提示词阅读器节点 是本项目的子项目,建议在您的工作流中将 Prompt Saver 节点 嵌入到 ComfyUI 提示词阅读器节点 中,以确保最大程度的兼容性。

下载

对于 Windows 用户

GitHub Releases 下载可执行文件。

对于 macOS 用户

GitHub Releases 下载可执行文件。

通过 Homebrew Cask 安装

您也可以通过 Homebrew cask 安装 SD 提示词阅读器。

brew install --no-quarantine receyuki/sd-prompt-reader/sd-prompt-reader

参数 --no-quarantine 是因为 SD 提示词阅读器目前尚未签名,正如我在 这里 所提到的。

对于 Linux 用户(未定期测试)

我相当确定 Linux 用户无需可执行文件也能自行解决。

  • Python 的最低要求版本是 3.10。
  • 确保您的 Python 已安装 tkinter 包。
    如果未安装,请使用包管理器安装 python3-tk 包。
    例如,对于基于 Debian 的发行版:sudo apt-get install python3-tk

您可以选择使用 pip 安装或手动运行。

使用 pip 或 pipx 安装

pip install sd-prompt-reader

或者

pipx install sd-prompt-reader

要启动图形界面,只需在终端输入 sd-prompt-reader
对于命令行界面,请使用 sd-prompt-reader-cli

手动运行源代码

  1. 克隆此仓库。
    git clone https://github.com/receyuki/stable-diffusion-prompt-reader.git
    
    或者下载仓库的 zip 文件。
  2. 进入目录并安装依赖项。
    cd stable-diffusion-prompt-reader  
    pip install -r requirements.txt
    
  3. 运行。
    python -m sd_prompt_reader.app
    

使用方法

读取提示词

  • 打开可执行文件(.exe 或 .app),然后将图片拖放到窗口中。

或者

  • 右键点击图片,选择“使用 SD 提示词阅读器打开”。

或者

  • 直接将图片拖放到可执行文件(.exe 或 .app)上。

将提示词导出为文本文件

  • 点击“导出”按钮,会在图片文件旁边生成一个 txt 文件。
  • 若要保存到其他位置,点击展开箭头并选择“选择目录”。
    导出

从图片中移除提示词

  • 点击“清除”按钮,会在原图片文件旁边生成一个带有 _data_removed 后缀的新图片文件。
  • 若要保存到其他位置,点击展开箭头并选择“选择目录”。
  • 若要覆盖原图片文件,点击展开箭头并选择“覆盖原图”。
    移除

编辑图片

[!注意] 编辑后的图片将以 A1111 格式保存,这意味着无论原始图片是什么格式,编辑后都会转换为 A1111 格式。

  • 点击“编辑”进入编辑模式。
  • 直接在文本框中编辑提示词,或导入 txt 格式的元数据文件。
  • 点击“保存”按钮,会在原图片文件旁边生成一个带有 _edited 后缀的编辑后图片文件。
  • 若要保存到其他位置,点击展开箭头并选择“选择目录”。
  • 若要覆盖原图片文件,点击展开箭头并选择“覆盖原图”。
    保存

复制为单行提示词

复制图片的提示词和设置,格式可被 来自文件或文本框的提示词 识别。支持以下参数:

设置 参数
种子 --seed
变异种子强度 --subseed_strength
种子缩放起始高度 --seed_resize_from_h
种子缩放起始宽度 --seed_resize_from_w
采样器 --sampler_name
步数 --steps
CFG 比例 --cfg_scale
尺寸 --width
尺寸 --height
人脸修复 --restore_faces
  • 点击展开箭头并选择“单行提示词”。
  • 将其粘贴到 webui 脚本“来自文件或文本框的提示词”下方的文本框中。
    单行提示词

ComfyUI SDXL 工作流

[!注意] SDXL 工作流不支持编辑。如有需要,请先从图片中移除提示词再进行编辑。

如果图片的工作流包含多组 SDXL 提示词,即 Clip G(text_g)、Clip L(text_l) 和 Refiner,SD 提示词阅读器会切换到多组提示词显示模式,如图所示。多组提示词显示模式有两种界面选项,可通过按钮切换。
comfyui_sdxl.png

命令行工具

提供了一个用于读取、修改和清除元数据的命令行工具。

平台

对于 Windows 用户

SD Prompt Reader CLI.exe 将作为单独的可执行文件包含在压缩包中。
示例: "SD Prompt Reader CLI.exe" -i example.png

对于 macOS 用户

可执行文件位于 SD Prompt Reader.app/Contents/MacOS/SD Prompt Reader
示例: /Applications/SD\ Prompt\ Reader.app/Contents/MacOS/SD\ Prompt\ Reader -i example.png

对于 pip 用户

示例: sd-prompt-reader-cli -i example.png

模式与选项

模式

  • 读取模式:通过 -r--read 标志激活。
  • 写入模式:通过 -w--write 标志激活。
  • 清除模式:通过 -c--clear 标志激活。

通用选项

  • -i, --input-path:输入图片文件或包含图片文件的目录路径,必填参数。
  • -o, --output-path:输出文件或目录路径,用于保存处理后的文件。
  • -l, --log-level:指定日志详细程度(例如 DEBUG、INFO、WARN、ERROR)。

读取选项

  • -f, --format-type:指定输出元数据的格式,可选“TXT”或“JSON”。默认格式为“TXT”。

写入选项

  • -m, --metadata:提供元数据文件以供写入。
  • -p, --positive:提供正面提示词字符串以供写入。
  • -n, --negative:提供负面提示词字符串以供写入。
  • -s, --setting:提供设置字符串以供写入。

基本使用

  • 如果未指定输出路径,修改后的图片将保存在当前目录,并在原文件名后添加后缀。
  • 若要覆盖源文件,需将输出路径设置为与输入路径相同。
  • 写入模式仅支持对单张图片的修改。

读取模式

  • 从图片中读取元数据。
  • 使用方法: sd-prompt-reader-cli [-r] -i <input_path> [--format-type <format>] [-o <output_path>]
  • 示例: sd-prompt-reader-cli -i example.png
    sd-prompt-reader-cli -i example.png -o metadata.txt
    sd-prompt-reader-cli -r -i example.png -f TXT -o output_folder/
    sd-prompt-reader-cli -r -i input_folder/ -f JSON -o output_folder/

写入模式

  • 向图片中写入元数据。
  • 使用方法: sd-prompt-reader-cli -w -i <input_path> -m <metadata_path> [-o <output_path>]
  • 示例: sd-prompt-reader-cli -w -i example.png -m new_metadata.txt
    sd-prompt-reader-cli -w -i example.png -m new_metadata.txt -o output.png
    sd-prompt-reader-cli -w -i example.png -m new_metadata.json -o output_folder/

清除模式

  • 从图片中移除所有元数据。
  • 使用方法: sd-prompt-reader-cli -c -i <input_path> [-o <output_path>]
  • 示例: sd-prompt-reader-cli -c -i example.png
    sd-prompt-reader-cli -c -i example.png -o output.png
    sd-prompt-reader-cli -c -i example.png -o output_folder/
    sd-prompt-reader-cli -c -i input_folder/ -o output_folder/

格式限制

TXT

  1. 仅在编辑模式下允许导入 txt 文件。
  2. 仅支持 A1111 格式的 txt 文件。您可以使用 A1111 webui 生成的 txt 文件,或使用 SD 提示词阅读器从 A1111 图片中导出 txt。

StableSwarmUI

[!重要] StableSwarmUI 仍处于 Alpha 测试阶段,其格式未来可能会发生变化。我将持续关注 StableSwarmUI 的后续更新。

ComfyUI

[!重要] 当使用自定义节点或工作流变得过于复杂时,元数据很可能无法被正确读取。 这是因为ComfyUI并不存储元数据,而只保存完整的工作流。SD Prompt Reader仅能处理基础的工作流。 建议在您的工作流中将Prompt Saver节点嵌入到ComfyUI Prompt Reader节点中,以确保最大的兼容性。

  1. 如果设置框中有多个数据集(seed、steps、CFG等),则表示流程图中存在多个KSampler节点。
  2. 由于ComfyUI的特性,工作流中的所有节点和流程图都会被存储在图像中,包括未使用的部分。此外,一个流程图可以有多个分支、输入和输出。 (例如:在一个流程图中同时输出高分辨率修复后的图像和原始图像) SD Prompt Reader会遍历所有流程图和分支,并显示具有完整输入和输出的最长分支。
  3. ComfyUI SDXL工作流

Easy Diffusion

默认情况下,Easy Diffusion不会将元数据写入图像。请将设置中的_元数据格式_更改为_embed_,以将元数据写入图像。

Fooocus-MRE

由于原始版本的Fooocus不支持将元数据写入图像文件, SD Prompt Reader仅支持由Fooocus MoonRide Edition生成的图像。

常见问题解答

恶意软件警告

[!警告] 部分杀毒软件报告的误报是由打包工具_pyinstaller_引起的,这是_pyinstaller_用户常见的问题。 我之前曾花费大量时间尝试解决Windows Defender的误报问题,但无法对所有杀毒软件都有效。 因此,您可以选择信任Windows Defender,或者按照针对Linux用户的说明来使用此应用。

“SD Prompt Reader.app”已损坏,无法打开。您应该将其移到废纸篓

[!重要] 这是macOS上运行未经签名的非App Store应用时非常常见的问题, 开发者需要每年向苹果支付99美元才能消除此问题。 您可以选择在安全性与隐私设置中启用允许任何来源的应用程序,但这可能存在风险。 我更倾向于移除隔离属性。

  1. 从“应用程序”文件夹中打开终端。

  2. 输入以下命令并按回车键。

    xattr -r -d com.apple.quarantine /path/to/app.app

    在我的例子中是:

    xattr -r -d com.apple.quarantine /Applications/SD\ Prompt\ Reader.app

如果仍然担心应用程序的安全性,可以参考针对Linux用户的说明来使用此应用。

待办事项

  • 批量图像处理工具
  • 图库/文件夹视图
  • 用户偏好设置

致谢

版本历史

v1.3.52024/05/21
v1.3.5-beta.22024/05/13
v1.3.5-beta.12024/04/30
v1.3.4-post.22024/01/25
v1.3.4-post.12023/12/11
v1.3.42023/10/25
v1.3.4-beta.22023/10/12
v1.3.4-beta.12023/09/27
v1.3.3-post.12023/09/05
v1.3.32023/09/03
v1.3.3-beta.22023/08/28
v1.3.3-beta.12023/08/23
v1.3.22023/07/13
v1.3.12023/06/05
v1.3.02023/05/25
v1.2.02023/04/24
v1.1.12023/04/09
v1.1.02023/04/04
v1.0.12023/03/31
v1.0.02023/03/30

常见问题

相似工具推荐

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。

162.1k|★★★☆☆|今天
开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上

139k|★★☆☆☆|今天
开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。

107.7k|★★☆☆☆|2天前
开发框架图像Agent

NextChat

NextChat 是一款轻量且极速的 AI 助手,旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性,以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发,NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。 这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言,它也提供了便捷的自托管方案,支持一键部署到 Vercel 或 Zeabur 等平台。 NextChat 的核心亮点在于其广泛的模型兼容性,原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型,让用户在一个界面即可自由切换不同 AI 能力。此外,它还率先支持 MCP(Model Context Protocol)协议,增强了上下文处理能力。针对企业用户,NextChat 提供专业版解决方案,具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能,满足公司对数据隐私和个性化管理的高标准要求。

87.6k|★★☆☆☆|今天
开发框架语言模型

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程,旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周,包含 26 节精炼课程和 52 道配套测验,内容涵盖从基础概念到实际应用的完整流程,有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。 无论是希望转型的开发者、需要补充算法背景的研究人员,还是对人工智能充满好奇的普通爱好者,都能从中受益。课程不仅提供了清晰的理论讲解,还强调动手实践,让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持,通过自动化机制提供了包括简体中文在内的 50 多种语言版本,极大地降低了全球不同背景用户的学习门槛。此外,项目采用开源协作模式,社区活跃且内容持续更新,确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路,ML-For-Beginners 将是理想的起点。

85k|★★☆☆☆|今天
图像数据工具视频

ragflow

RAGFlow 是一款领先的开源检索增强生成(RAG)引擎,旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体(Agent)能力相结合,不仅支持从各类文档中高效提取知识,还能让模型基于这些知识进行逻辑推理和任务执行。 在大模型应用中,幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构(如表格、图表及混合排版),显著提升了信息检索的准确度,从而有效减少模型“胡编乱造”的现象,确保回答既有据可依又具备时效性。其内置的智能体机制更进一步,使系统不仅能回答问题,还能自主规划步骤解决复杂问题。 这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统,还是致力于探索大模型在垂直领域落地的创新者,都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口,既降低了非算法背景用户的上手门槛,也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目,它正成为连接通用大模型与行业专有知识之间的重要桥梁。

77.1k|★★★☆☆|昨天
Agent图像开发框架