stable-diffusion-docker

749 132 中等 1 次阅读 3周前AGPL-3.0开发框架图像

AI 解读由 AI 自动生成，仅供参考

stable-diffusion-docker 是一个让官方 Stable Diffusion 模型在 Docker 容器中轻松运行的开源项目。它封装了文生图、图生图、深度引导生成、指令编辑（pix2pix）、图像超分放大及局部重绘等核心功能，用户只需通过简单的命令行脚本即可调用强大的 AI 绘画能力。

该项目主要解决了 AI 绘图环境配置复杂、依赖冲突多以及跨平台部署难的痛点。通过容器化技术，它将复杂的 GPU 加速环境、模型权重管理及依赖库打包在一起，确保在不同操作系统上都能获得一致且稳定的运行体验。即使没有高端显卡，它也提供了 CPU 推理和 ONNX 优化选项，降低了使用门槛。

这款工具非常适合开发者快速集成 AI 绘图能力，研究人员进行模型实验，以及希望在本机私有化部署绘图服务的设计师或技术爱好者。其独特亮点在于极简的交互设计：用户无需编写复杂的 Python 代码，仅需一个 build.sh 脚本配合 Hugging Face 令牌，就能通过一行命令完成从环境构建到生成“沙漠中吃意大利面的鹦鹉”等创意图像的全过程，极大地提升了工作流效率。

使用场景

一家独立游戏开发团队急需为原型演示快速生成大量风格统一的概念美术资产，但团队成员缺乏深度学习环境配置经验且硬件资源有限。

没有 stable-diffusion-docker 时

环境配置噩梦：开发者需手动安装 CUDA、PyTorch 及各类依赖库，常因版本冲突导致数小时甚至数天的调试浪费。
硬件门槛过高：本地电脑若无高端显卡则无法运行模型，强行使用 CPU 推理速度慢到几乎不可用，严重阻塞创作流程。
功能切换繁琐：想要尝试从“文生图”切换到“图生图”或“局部重绘”，需要修改复杂的 Python 脚本或切换不同的开源项目代码。
协作一致性差：不同成员生成的图像风格因环境参数微调而差异巨大，难以维持游戏美术风格的统一性。

使用 stable-diffusion-docker 后

一键启动环境：通过 ./build.sh 脚本即可在容器内自动部署所有依赖，屏蔽底层复杂性，让设计师几分钟内开始创作。
灵活适配算力：利用 Docker 的 GPU 加速特性高效生成图像，即便在配置较低的机器上也能通过 --device cpu 选项勉强运行，保障任务不中断。
全能指令集成：仅需更改命令行参数（如 --image 或 --model），即可在同一环境中无缝切换文生图、深度引导扩散及图像超分等六种核心功能。
标准化输出：容器化确保了所有成员使用完全一致的模型权重和运行参数，批量生成的素材风格高度统一，直接可用。

stable-diffusion-docker 将复杂的 AI 部署转化为简单的命令行操作，让创意团队能专注于内容生产而非环境运维。

运行环境要求

操作系统

Linux
macOS
Windows

GPU

需要支持 CUDA 的 GPU，显存 8GB+（默认）
低配 GPU 可通过参数调整或使用 CPU/ONNX 模式运行

内存

未说明

依赖

notes1. 必须安装 Docker 并配置 GPU 支持。2. 需要 Hugging Face 用户访问令牌（以 hf_ 开头），需保存为 token.txt 文件或通过命令行传入。3. 若无合适 GPU，可添加 --device cpu 和 --onnx 参数使用 CPU 推理。4. Windows 用户若使用 MSYS/MinGW/Git Bash 而非 WSL2，需在命令前加 MSYS_NO_PATHCONV=1。5. 模型文件会自动缓存到名为 huggingface 的 Docker 卷中。6. 可通过 --half、--attention-slicing 等参数优化显存占用。

python未说明

Docker

NVIDIA Container Toolkit (隐含)

xformers (可选)

快速开始

Docker 中的 Stable Diffusion

在 GPU 加速的 Docker 容器中运行 Hugging Face 上官方 Stable Diffusion 发布版本。

./build.sh run '沙漠中一只鹦鹉吃意大利面的印象派画作'

沙漠中一只鹦鹉吃意大利面的印象派画作 1 沙漠中一只鹦鹉吃意大利面的印象派画作 2

./build.sh run --image parakeet_eating_spaghetti.png --strength 0.6 '玫瑰花束'

玫瑰花束 1 玫瑰花束 2

开始之前

最低要求

默认情况下，该流程使用完整模型和权重，需要具备 8GB 以上显存的 CUDA 兼容 GPU。生成一张图像大约需要几秒钟。在性能较弱的 GPU 上，您可能需要调整一些选项；有关详细信息，请参阅示例部分。如果您没有合适的 GPU，可以改用 --device cpu 和 --onnx 选项。

Hugging Face 令牌

由于使用的是官方模型，您需要在您的 Hugging Face 账户中创建一个用户访问令牌。将用户访问令牌保存到名为 token.txt 的文件中，并确保在构建容器时该文件可用。令牌内容应以 hf_... 开头。

快速入门

该流程通过单个 build.sh 脚本进行管理。

使用 ./build.sh pull 拉取最新版本的 stable-diffusion-docker。在使用 ./build run 时，您需要使用 --token 选项指定有效的用户访问令牌。

或者，您也可以先在本地构建镜像，然后再运行。

构建

请确保您的用户访问令牌已保存到名为 token.txt 的文件中。

构建命令如下：

./build.sh build  # 或者直接 ./build.sh

运行

文本转图像 (`txt2img`)

根据文本提示生成图像。

运行命令如下：

./build.sh run '瓶中的仙女座星系'