[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-mcmonkeyprojects--SwarmUI":3,"tool-mcmonkeyprojects--SwarmUI":61},[4,18,26,36,44,53],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":17},4358,"openclaw","openclaw\u002Fopenclaw","OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。\n\n这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。\n\nOpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你",349277,3,"2026-04-06T06:32:30",[13,14,15,16],"Agent","开发框架","图像","数据工具","ready",{"id":19,"name":20,"github_repo":21,"description_zh":22,"stars":23,"difficulty_score":10,"last_commit_at":24,"category_tags":25,"status":17},3808,"stable-diffusion-webui","AUTOMATIC1111\u002Fstable-diffusion-webui","stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。\n\n无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。",162132,"2026-04-05T11:01:52",[14,15,13],{"id":27,"name":28,"github_repo":29,"description_zh":30,"stars":31,"difficulty_score":32,"last_commit_at":33,"category_tags":34,"status":17},1381,"everything-claude-code","affaan-m\u002Feverything-claude-code","everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。\n\n通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。\n\n这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上",142651,2,"2026-04-06T23:34:12",[14,13,35],"语言模型",{"id":37,"name":38,"github_repo":39,"description_zh":40,"stars":41,"difficulty_score":32,"last_commit_at":42,"category_tags":43,"status":17},2271,"ComfyUI","Comfy-Org\u002FComfyUI","ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。\n\n这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。\n\n无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。",107888,"2026-04-06T11:32:50",[14,15,13],{"id":45,"name":46,"github_repo":47,"description_zh":48,"stars":49,"difficulty_score":32,"last_commit_at":50,"category_tags":51,"status":17},4721,"markitdown","microsoft\u002Fmarkitdown","MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。\n\n在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。\n\n这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器",93400,"2026-04-06T19:52:38",[52,14],"插件",{"id":54,"name":55,"github_repo":56,"description_zh":57,"stars":58,"difficulty_score":10,"last_commit_at":59,"category_tags":60,"status":17},4487,"LLMs-from-scratch","rasbt\u002FLLMs-from-scratch","LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目，旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型（LLM）。它不仅是同名技术著作的官方代码库，更提供了一套完整的实践方案，涵盖模型开发、预训练及微调的全过程。\n\n该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型，却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码，用户能够透彻掌握 Transformer 架构、注意力机制等关键原理，从而真正理解大模型是如何“思考”的。此外，项目还包含了加载大型预训练权重进行微调的代码，帮助用户将理论知识延伸至实际应用。\n\nLLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API，而是渴望探究模型构建细节的技术人员而言，这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计：将复杂的系统工程拆解为清晰的步骤，配合详细的图表与示例，让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础，还是为未来研发更大规模的模型做准备",90106,"2026-04-06T11:19:32",[35,15,13,14],{"id":62,"github_repo":63,"name":64,"description_en":65,"description_zh":66,"ai_summary_zh":67,"readme_en":68,"readme_zh":69,"quickstart_zh":70,"use_case_zh":71,"hero_image_url":72,"owner_login":73,"owner_name":74,"owner_avatar_url":75,"owner_bio":76,"owner_company":77,"owner_location":77,"owner_email":78,"owner_twitter":77,"owner_website":79,"owner_url":80,"languages":81,"stars":117,"forks":118,"last_commit_at":119,"license":120,"difficulty_score":10,"env_os":121,"env_gpu":122,"env_ram":123,"env_deps":124,"category_tags":132,"github_topics":133,"view_count":32,"oss_zip_url":77,"oss_zip_packed_at":77,"status":17,"created_at":143,"updated_at":144,"faqs":145,"releases":175},4991,"mcmonkeyprojects\u002FSwarmUI","SwarmUI","SwarmUI (formerly StableSwarmUI), A Modular Stable Diffusion Web-User-Interface, with an emphasis on making powertools easily accessible, high performance, and extensibility.","SwarmUI（前身为 StableSwarmUI）是一款模块化的人工智能图像与视频生成网页界面，旨在让强大的创作工具变得触手可及。它支持包括 Stable Diffusion、Flux 在内的多种主流图像模型，以及 Wan、Hunyuan Video 等视频模型，并计划未来扩展至音频领域。\n\n针对当前 AI 绘图工具往往在“易用性”与“专业度”之间难以兼顾的痛点，SwarmUI 提供了双重体验：初学者可以通过直观的“生成”标签页轻松上手，快速产出高质量作品；而资深用户则能切换至\"Comfy 工作流”模式，获得无限制的底层节点编辑能力，同时还能享受网格生成器、自动工作流构建等高效辅助功能。其核心优势在于高性能架构与极高的可扩展性，既保证了运行流畅，又允许用户根据需求灵活定制。\n\n目前 SwarmUI 处于 Beta 阶段，非常适合设计师、AI 研究者、开发者以及希望深入探索生成式人工智能的普通用户。无论你是想简单尝试创意灵感，还是需要构建复杂的自动化生成流程，SwarmUI 都能提供理想的操作环境。作为一个永久免费且开源的项目，它正社区驱动下不断迭代，致力于成为连接创意与技术的最优桥梁","SwarmUI（前身为 StableSwarmUI）是一款模块化的人工智能图像与视频生成网页界面，旨在让强大的创作工具变得触手可及。它支持包括 Stable Diffusion、Flux 在内的多种主流图像模型，以及 Wan、Hunyuan Video 等视频模型，并计划未来扩展至音频领域。\n\n针对当前 AI 绘图工具往往在“易用性”与“专业度”之间难以兼顾的痛点，SwarmUI 提供了双重体验：初学者可以通过直观的“生成”标签页轻松上手，快速产出高质量作品；而资深用户则能切换至\"Comfy 工作流”模式，获得无限制的底层节点编辑能力，同时还能享受网格生成器、自动工作流构建等高效辅助功能。其核心优势在于高性能架构与极高的可扩展性，既保证了运行流畅，又允许用户根据需求灵活定制。\n\n目前 SwarmUI 处于 Beta 阶段，非常适合设计师、AI 研究者、开发者以及希望深入探索生成式人工智能的普通用户。无论你是想简单尝试创意灵感，还是需要构建复杂的自动化生成流程，SwarmUI 都能提供理想的操作环境。作为一个永久免费且开源的项目，它正社区驱动下不断迭代，致力于成为连接创意与技术的最优桥梁。","# SwarmUI\n\n**SwarmUI v0.9.8 Beta**.\n\n*Formerly known as StableSwarmUI.*\n\nA Modular AI Image Generation Web-User-Interface, with an emphasis on making powertools easily accessible, high performance, and extensibility. Supports AI image models (*Stable Diffusion, Z-Image, Flux, Qwen Image, etc.*), and AI video models (*Wan, Hunyuan Video, etc.*), with plans to support eg audio and more in the future.\n\n![ui-screenshot](.github\u002Fimages\u002Fswarmui.jpg)\n\n- **Discord Community**: Join the [Discord](https:\u002F\u002Fdiscord.gg\u002Fq2y38cqjNw) to discuss the project, get support, see announcements, etc.\n- **Announcements**: Follow the [Feature Announcements Thread](https:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fdiscussions\u002F1) for updates on new features.\n- **General documentation**: [\u002Fdocs folder](https:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fblob\u002Fmaster\u002Fdocs\u002FREADME.md)\n- **Website**: [SwarmUI.net](https:\u002F\u002Fswarmui.net\u002F)\n\n----\n\n# Status\n\nThis project is in **Beta** status. This means for most tasks, Swarm has excellent tooling available to you, but there is much more planned. Swarm is recommended as an ideal UI for most users, beginners and pros alike. There are still some things to be worked out.\n\nBeginner users will love Swarm's primary Generate tab interface, making it easy to generate anything with a variety of powerful features. Advanced users may favor the Comfy Workflow tab to get the unrestricted raw graph, but will still have reason to come back to the Generate tab for convenience features (image editor, auto-workflow-generation, etc) and powertools (eg Grid Generator).\n\nThose interested in helping push Swarm from Beta to a Full ready-for-anything perfected Release status are welcome to submit PRs (read the [Contributing](\u002FCONTRIBUTING.md) document first), and you can contact us here on GitHub or on [Discord](https:\u002F\u002Fdiscord.gg\u002Fq2y38cqjNw). I highly recommend reaching out to ask about plans for a feature before PRing it. There may already be specific plans or even a work in progress.\n\nKey feature targets not yet implemented:\n- Better mobile browser support\n- full detail \"Current Model\" display in UI, separate from the model selector (probably as a tab within the batch sidebar?)\n- LLM-assisted prompting (there's an extension for it, but LLM control should be natively supported)\n- convenient direct-distribution of Swarm as a program ([Tauri](https:\u002F\u002Ftauri.app\u002F), [Blazor Desktop](https:\u002F\u002Flearn.microsoft.com\u002Fen-us\u002Ftraining\u002Fmodules\u002Fbuild-blazor-hybrid\u002F), or an Electron app?)\n\n# Donate\n\nSwarmUI is 100% free and open source forever. If you want to help make sure it keeps pace with the best despite my refusal to paywall access or shove ads down your throat, [donate to SwarmUI](https:\u002F\u002Fpatreon.com\u002Fswarmui)!\n\n# Try It On Google Colab\n\n### Google Colab\n\n**WARNING**: Google Colab does not necessarily allow remote WebUIs, particularly for free accounts, use at your own risk.\n\nColab link if you want to try Swarm: https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fblob\u002Fmaster\u002Fcolab\u002Fcolab-notebook.ipynb\n\n# Run it on a Cloud GPU Provider\n\n### Runpod\n\nRunpod template (note: maintained by third party contributor [nerdylive123](https:\u002F\u002Fgithub.com\u002Fnerdylive123)): https:\u002F\u002Fget.runpod.io\u002Fswarmui\n\n### Vast.ai\n\nVast.ai template ([readme](https:\u002F\u002Fcloud.vast.ai\u002Ftemplate\u002Freadme\u002F8e5e6ab1fceb9db3f813e815907b3390)): https:\u002F\u002Fcloud.vast.ai\u002F?ref_id=62897&creator_id=62897&name=SwarmUI\n\nNote it may take several minutes to start up the first time. Check the container logs to see setup progress. Check the template `?` info for hints on how to use.\n\n# Installing on Windows\n\nNote: if you're on Windows 10, you may need to manually install [git](https:\u002F\u002Fgit-scm.com\u002Fdownload\u002Fwin) and [DotNET 8 SDK](https:\u002F\u002Fdotnet.microsoft.com\u002Fen-us\u002Fdownload\u002Fdotnet\u002F8.0) first. (Windows 11 this is automated).\n\n- Download [The Install-Windows.bat file](https:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Freleases\u002Fdownload\u002F0.9.8-Beta\u002Finstall-windows.bat), store it somewhere you want to install at (not `Program Files`), and run it.\n    - It should open a command prompt and install itself.\n    - If it closes without going further, try running it again, it sometimes needs to run twice. (TODO: Fix that)\n    - It will place an icon on your desktop that you can use to re-launch the server at any time.\n    - When the installer completes, it will automatically launch the SwarmUI server, and open a browser window to the install page.\n    - Follow the install instructions on the page.\n    - After you submit, be patient, some of the install processing take a few minutes (downloading models and etc).\n\n(TODO): Even easier self-contained pre-installer, a `.msi` or `.exe` that provides a general install screen and lets you pick folder and all.\n\n# Alternate Manual Windows Install\n\n- Install git from https:\u002F\u002Fgit-scm.com\u002Fdownload\u002Fwin\n- Install DotNET 8 SDK from https:\u002F\u002Fdotnet.microsoft.com\u002Fen-us\u002Fdownload\u002Fdotnet\u002F8.0 (Make sure to get the SDK x64 for Windows)\n- open a terminal to the folder you want swarm in and run `git clone https:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI`\n- open the folder and run `launch-windows.bat`\n\n# Installing on Linux\n\n### Prereqs\n\n- Install `git` and `python3` via your OS package manager if they are not already installed (make sure to include `pip` and `venv` on distros that do not include them in python directly)\n    - For example, on some Ubuntu (desktop) versions, `sudo apt install git python3-pip python3-venv`, or you may need \u003Chttps:\u002F\u002Flaunchpad.net\u002F~deadsnakes\u002F+archive\u002Fubuntu\u002Fppa>\n    - For Debian or Ubuntu Server, `sudo apt install git python3-full`\n    - You'll want Python 3.11 or 3.12. Things should also work fine with 3.10. Do not use 3.13.\n    - Make sure `python3.11 -m pip --version` returns a valid package\n\n### Linux Easy Install\n\n- Download [the install-linux.sh file](https:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Freleases\u002Fdownload\u002F0.6.5-Beta\u002Finstall-linux.sh), store it somewhere you want to install at, and run it\n    - If you like terminals, you can open a terminal to the folder and run the following commands: (Yes this link is still current):\n        - `wget https:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Freleases\u002Fdownload\u002F0.6.5-Beta\u002Finstall-linux.sh -O install-linux.sh`\n        - `chmod +x install-linux.sh`\n- Run the `.\u002Finstall-linux.sh` script, it will install everything for you and eventually open the webpage in your browser.\n- Follow the install instructions on-page.\n\n### Linux Manual Install\n\n- Install DotNET 8 using the instructions at https:\u002F\u002Fdotnet.microsoft.com\u002Fen-us\u002Fdownload\u002Fdotnet\u002F8.0 (you need `dotnet-sdk-8.0`, as that includes all relevant sub-packages)\n- Open a shell terminal and `cd` to a directory you want to install into\n- Run shell commands:\n    - `git clone https:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI`\n    - cd `SwarmUI`\n    - `.\u002Flaunch-linux.sh`\n    - or if running on a headless server, `.\u002Flaunch-linux.sh --launch_mode none --host 0.0.0.0` and\u002For swap host for [cloudflared](\u002Fdocs\u002FAdvanced%20Usage.md)\n- open `http:\u002F\u002Flocalhost:7801\u002FInstall` (if it doesn't launch itself)\n- Follow the install instructions on-page.\n\n### Linux Install Notes\n\n- You can at any time in the future run the `launch-linux.sh` script to re-launch Swarm.\n- If the page doesn't open itself, you can manually open `http:\u002F\u002Flocalhost:7801`\n\n(TODO): Maybe outlink a dedicated document with per-distro details and whatever. Maybe also make a one-click installer for Linux? Can we remove the global python install prereq?\n\n# Installing on Mac\n\n> **Note**: You can only run SwarmUI on Mac computers with M-Series Apple silicon processors (eg M1, M2, ...).\n\n- Open Terminal.\n- Ensure your `brew` packages are updated with `brew update`.\n- Verify your `brew` installation with `brew doctor`. You should not see any error in the command output.\n- Install .NET for macOS: `brew install dotnet`.\n- If you don't have Python, install it: `brew install python@3.11` and `brew install virtualenv`\n    - Python 3.11, 3.12, 3.10 are all fine. 3.13 is not, do not use 3.13.\n- Change the directory (`cd`) to the folder where you want to install SwarmUI.\n- Clone the SwarmUI GitHub repository: `git clone https:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI`.\n- `cd SwarmUI` and run the installation script: `.\u002Flaunch-macos.sh`.\n- Wait for the web browser to open, and follow the install instructions on-page.\n\n# Installing With Docker\n\nSee [Docs\u002FDocker.md](\u002Fdocs\u002FDocker.md) for detailed instructions on using SwarmUI in Docker.\n\n# Documentation\n\nSee [the documentation folder](\u002Fdocs\u002FREADME.md).\n\n# Motivations\n\nThe \"Swarm\" name is in reference to the original key function of the UI: enabling a 'swarm' of GPUs to all generate images for the same user at once (especially for large grid generations). This is just the feature that inspired the name and not the end all of what Swarm is.\n\nThe overall goal of SwarmUI is to a be full-featured one-stop-shop for all things Stable Diffusion.\n\nSee [the motivations document](\u002Fdocs\u002FMotivations.md) for motivations on technical choices.\n\n# Legal\n\nThis project:\n- embeds a copy of [7-zip](https:\u002F\u002F7-zip.org\u002Fdownload.html) (LGPL).\n- has the ability to auto-install [ComfyUI](https:\u002F\u002Fgithub.com\u002Fcomfyanonymous\u002FComfyUI) (GPL).\n- has the option to use as a backend [AUTOMATIC1111\u002Fstable-diffusion-webui](https:\u002F\u002Fgithub.com\u002FAUTOMATIC1111\u002Fstable-diffusion-webui) (AGPL).\n- can automatically install [christophschuhmann\u002Fimproved-aesthetic-predictor](https:\u002F\u002Fgithub.com\u002Fchristophschuhmann\u002Fimproved-aesthetic-predictor) (Apache2) and [yuvalkirstain\u002FPickScore](https:\u002F\u002Fgithub.com\u002Fyuvalkirstain\u002FPickScore) (MIT).\n- can automatically install [git-for-windows](https:\u002F\u002Fgit-scm.com\u002Fdownload\u002Fwin) (GPLv2).\n- can automatically install MIT\u002FBSD\u002FApache2\u002FPythonSoftwareFoundation pip packages: [spandrel](https:\u002F\u002Fpypi.org\u002Fproject\u002Fspandrel\u002F), [dill](https:\u002F\u002Fpypi.org\u002Fproject\u002Fdill\u002F), [imageio-ffmpeg](https:\u002F\u002Fpypi.org\u002Fproject\u002Fimageio-ffmpeg\u002F), [opencv-python-headless](https:\u002F\u002Fpypi.org\u002Fproject\u002Fopencv-python-headless\u002F), [matplotlib](https:\u002F\u002Fpypi.org\u002Fproject\u002Fmatplotlib\u002F), [rembg](https:\u002F\u002Fpypi.org\u002Fproject\u002Frembg\u002F), [kornia](https:\u002F\u002Fpypi.org\u002Fproject\u002Fkornia\u002F), [Cython](https:\u002F\u002Fpypi.org\u002Fproject\u002FCython\u002F)\n- can automatically install [ultralytics](https:\u002F\u002Fgithub.com\u002Fultralytics\u002Fultralytics) (AGPL) for `YOLOv8` face detection (ie `SwarmYoloDetection` node or `\u003Csegment:yolo-...>` syntax usage may become subject to AGPL terms),\n- can automatically install [insightface](https:\u002F\u002Fgithub.com\u002Fdeepinsight\u002Finsightface) (MIT) for `IP Adapter - Face` support\n- uses [JSON.NET](https:\u002F\u002Fgithub.com\u002FJamesNK\u002FNewtonsoft.Json) (MIT), [FreneticUtilities](https:\u002F\u002Fgithub.com\u002FFreneticLLC\u002FFreneticUtilities) (MIT), [LiteDB](https:\u002F\u002Fgithub.com\u002Fmbdavid\u002FLiteDB) (MIT), [ImageSharp](https:\u002F\u002Fgithub.com\u002FSixLabors\u002FImageSharp\u002F) (Apache2 under open-source Split License)\n- embeds copies of web assets from [BootStrap](https:\u002F\u002Fgetbootstrap.com\u002F) (MIT), [Select2](https:\u002F\u002Fselect2.org\u002F) (MIT), [JQuery](https:\u002F\u002Fjquery.com\u002F) (MIT), [exif-reader](https:\u002F\u002Fgithub.com\u002Fmattiasw\u002FExifReader) (MPL-2.0).\n- contains some icons from [Cristian Munoz](https:\u002F\u002Fwww.figma.com\u002Fcommunity\u002Ffile\u002F1311159026125960259\u002F7000-free-ui-icons) (CC-BY-4.0), the font [inter by rsms](https:\u002F\u002Fgithub.com\u002Frsms\u002Finter) (OFL), [Unifont by GNU](https:\u002F\u002Funifoundry.com\u002Funifont\u002F) (OFL), [Material Symbols Outlined by Google](https:\u002F\u002Ffonts.google.com\u002Ficons) (Apache2).\n- can be used to install some custom node packs, which have individual license notices for any non-pure-FOSS licenses before install.\n- supports user-built extensions which may have their own licenses or legal conditions.\n\nSwarmUI itself is under the MIT license, however some usages may be affected by the GPL variant licenses of connected projects list above, and note that any models used have their own licenses.\n\n### Previous License\n\n(For updates prior to June 2024)\n\nThe MIT License (MIT)\nCopyright (c) 2024 Stability AI\n\n### License\n\nThe MIT License (MIT)\n\nCopyright (c) 2024-2026 Alex \"mcmonkey\" Goodwin\n\nPermission is hereby granted, free of charge, to any person obtaining a copy\nof this software and associated documentation files (the \"Software\"), to deal\nin the Software without restriction, including without limitation the rights\nto use, copy, modify, merge, publish, distribute, sublicense, and\u002For sell\ncopies of the Software, and to permit persons to whom the Software is\nfurnished to do so, subject to the following conditions:\n\nThe above copyright notice and this permission notice shall be included in all\ncopies or substantial portions of the Software.\n\nTHE SOFTWARE IS PROVIDED \"AS IS\", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR\nIMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,\nFITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE\nAUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER\nLIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,\nOUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE\nSOFTWARE.\n","# SwarmUI\n\n**SwarmUI v0.9.8 Beta**。\n\n* 前身为 StableSwarmUI。*\n\n一个模块化的AI图像生成Web用户界面，专注于让强大工具易于访问、高性能且可扩展。支持AI图像模型（*Stable Diffusion、Z-Image、Flux、Qwen Image等*）和AI视频模型（*Wan、Hunyuan Video等*），未来还计划支持音频等领域。\n\n![ui-screenshot](.github\u002Fimages\u002Fswarmui.jpg)\n\n- **Discord社区**：加入[Discord](https:\u002F\u002Fdiscord.gg\u002Fq2y38cqjNw)，讨论项目、获取支持、查看公告等。\n- **公告**：关注[功能公告帖](https:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fdiscussions\u002F1)，了解新功能更新。\n- **通用文档**：[\u002Fdocs文件夹](https:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fblob\u002Fmaster\u002Fdocs\u002FREADME.md)\n- **官网**：[SwarmUI.net](https:\u002F\u002Fswarmui.net\u002F)\n\n----\n\n# 状态\n\n该项目目前处于**Beta**阶段。这意味着对于大多数任务，Swarm已经提供了非常优秀的工具支持，但仍有许多功能正在规划中。Swarm被推荐作为大多数用户的理想UI，无论是初学者还是专业人士。不过，仍有一些细节需要进一步完善。\n\n初学者会喜欢Swarm的“生成”主标签页界面，它通过多种强大的功能让用户轻松生成任何内容。而高级用户可能会更倾向于使用“Comfy工作流”标签页来获得完全自由的原始图谱，但他们仍然会因为便利的功能（如图像编辑器、自动工作流生成等）以及一些强大工具（例如网格生成器）而回到“生成”标签页。\n\n如果您有兴趣帮助Swarm从Beta版本迈向全面完善的正式发布版，欢迎提交PR（请先阅读[贡献指南](\u002FCONTRIBUTING.md)），您也可以通过GitHub或[Discord](https:\u002F\u002Fdiscord.gg\u002Fq2y38cqjNw)与我们联系。强烈建议在提交PR之前先咨询相关功能的开发计划，因为可能已经有具体的规划，甚至已经在开发中了。\n\n尚未实现的关键功能目标：\n- 更好的移动浏览器支持\n- 在UI中以更详细的“当前模型”显示，与模型选择器分开（可能作为批处理侧边栏中的一个标签页）\n- LLM辅助提示（目前已有相关扩展，但LLM控制应原生支持）\n- 便捷地将Swarm直接打包为应用程序分发（例如使用[Tauri](https:\u002F\u002Ftauri.app\u002F)、[Blazor Desktop](https:\u002F\u002Flearn.microsoft.com\u002Fen-us\u002Ftraining\u002Fmodules\u002Fbuild-blazor-hybrid\u002F)或Electron应用？）\n\n# 捐赠\n\nSwarmUI始终是100%免费且开源的。如果您希望帮助它在不设置付费墙或强制投放广告的情况下持续保持行业领先水平，请[捐赠给SwarmUI](https:\u002F\u002Fpatreon.com\u002Fswarmui)！\n\n# 在Google Colab上试用\n\n### Google Colab\n\n**警告**：Google Colab并不一定允许运行远程WebUI，尤其是免费账户，使用需自担风险。\n\n如果您想尝试Swarm，可以使用以下Colab链接：https:\u002F\u002Fcolab.research.google.com\u002Fgithub\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fblob\u002Fmaster\u002Fcolab\u002Fcolab-notebook.ipynb\n\n# 在云端GPU服务商上运行\n\n### Runpod\n\nRunpod模板（注：由第三方贡献者[nerdylive123](https:\u002F\u002Fgithub.com\u002Fnerdylive123)维护）：https:\u002F\u002Fget.runpod.io\u002Fswarmui\n\n### Vast.ai\n\nVast.ai模板（[说明文档](https:\u002F\u002Fcloud.vast.ai\u002Ftemplate\u002Freadme\u002F8e5e6ab1fceb9db3f813e815907b3390)）：https:\u002F\u002Fcloud.vast.ai\u002F?ref_id=62897&creator_id=62897&name=SwarmUI\n\n请注意，首次启动可能需要几分钟时间。请查看容器日志以了解安装进度。有关使用方法的提示，请参阅模板的“?”信息。\n\n# Windows系统安装\n\n注意：如果您使用的是Windows 10，可能需要手动安装[git](https:\u002F\u002Fgit-scm.com\u002Fdownload\u002Fwin)和[DotNET 8 SDK](https:\u002F\u002Fdotnet.microsoft.com\u002Fen-us\u002Fdownload\u002Fdotnet\u002F8.0)。（Windows 11则会自动完成这些步骤）\n\n- 下载[Install-Windows.bat脚本](https:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Freleases\u002Fdownload\u002F0.9.8-Beta\u002Finstall-windows.bat)，将其保存到您希望安装的位置（不要放在`Program Files`目录下），然后运行它。\n    - 脚本会打开命令提示符并自行安装。\n    - 如果脚本关闭而未继续执行，请尝试再次运行，有时需要运行两次。（待解决）\n    - 安装完成后，会在桌面上创建一个图标，您可以随时通过该图标重新启动服务器。\n    - 安装程序完成后，会自动启动SwarmUI服务器，并在浏览器中打开安装页面。\n    - 请按照页面上的安装说明进行操作。\n    - 提交后请耐心等待，部分安装过程（如下载模型等）可能需要几分钟时间。\n\n（待办事项）：开发一个更加简便的自包含预安装程序，例如`.msi`或`.exe`文件，提供统一的安装界面，允许用户选择安装目录等。\n\n# Windows系统的另一种手动安装方式\n\n- 从https:\u002F\u002Fgit-scm.com\u002Fdownload\u002Fwin下载并安装Git。\n- 从https:\u002F\u002Fdotnet.microsoft.com\u002Fen-us\u002Fdownload\u002Fdotnet\u002F8.0下载并安装DotNET 8 SDK（确保下载适用于Windows的x64版本SDK）。\n- 打开您希望安装Swarm的文件夹终端，运行`git clone https:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI`。\n- 进入该文件夹并运行`launch-windows.bat`。\n\n# Linux系统安装\n\n### 先决条件\n\n- 如果您的系统尚未安装`git`和`python3`，请通过操作系统包管理器进行安装（确保在那些默认不包含`pip`和`venv`的发行版中也一并安装它们）。\n    - 例如，在某些Ubuntu桌面版中，可以运行`sudo apt install git python3-pip python3-venv`，或者您可能需要使用\u003Chttps:\u002F\u002Flaunchpad.net\u002F~deadsnakes\u002F+archive\u002Fubuntu\u002Fppa>。\n    - 对于Debian或Ubuntu Server，可以运行`sudo apt install git python3-full`。\n    - 建议使用Python 3.11或3.12版本。3.10版本也能正常工作，但请勿使用3.13版本。\n    - 请确保运行`python3.11 -m pip --version`时返回有效的软件包信息。\n\n### Linux简易安装\n\n- 下载[install-linux.sh脚本](https:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Freleases\u002Fdownload\u002F0.6.5-Beta\u002Finstall-linux.sh)，将其保存到您希望安装的位置，然后运行它。\n    - 如果您熟悉终端操作，可以直接在文件夹中打开终端并运行以下命令：（此链接目前仍然有效）\n        - `wget https:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Freleases\u002Fdownload\u002F0.6.5-Beta\u002Finstall-linux.sh -O install-linux.sh`\n        - `chmod +x install-linux.sh`\n- 运行`.\u002Finstall-linux.sh`脚本，它将为您完成所有安装步骤，并最终在浏览器中打开网页。\n- 请按照页面上的安装说明进行操作。\n\n### Linux 手动安装\n\n- 使用 https:\u002F\u002Fdotnet.microsoft.com\u002Fen-us\u002Fdownload\u002Fdotnet\u002F8.0 上的说明安装 .NET 8（你需要 `dotnet-sdk-8.0`，因为它包含了所有相关子包）。\n- 打开终端并切换到你希望安装的目录：`cd`。\n- 运行以下命令：\n  - `git clone https:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI`\n  - `cd SwarmUI`\n  - `.\u002Flaunch-linux.sh`\n  - 或者，如果在无头服务器上运行，可以使用 `.\u002Flaunch-linux.sh --launch_mode none --host 0.0.0.0`，并将主机替换为 [cloudflared](\u002Fdocs\u002FAdvanced%20Usage.md)。\n- 打开 `http:\u002F\u002Flocalhost:7801\u002FInstall`（如果未自动打开）。\n- 按照页面上的安装说明进行操作。\n\n### Linux 安装注意事项\n\n- 你可以在任何时候运行 `launch-linux.sh` 脚本来重新启动 Swarm。\n- 如果页面没有自动打开，你可以手动访问 `http:\u002F\u002Flocalhost:7801`。\n\n(TODO): 或许可以链接一个专门的文档，其中包含针对不同发行版的详细信息等。是否也可以为 Linux 制作一键安装程序？我们能否移除全局 Python 安装这一先决条件？\n\n# 在 Mac 上安装\n\n> **注意**：SwarmUI 只能在搭载 M 系列 Apple 芯片的 Mac 计算机上运行（例如 M1、M2 等）。\n\n- 打开终端。\n- 确保你的 Homebrew 包是最新的：`brew update`。\n- 使用 `brew doctor` 验证 Homebrew 的安装情况。命令输出中不应有任何错误。\n- 安装适用于 macOS 的 .NET：`brew install dotnet`。\n- 如果尚未安装 Python，请执行以下命令：`brew install python@3.11` 和 `brew install virtualenv`。\n  - Python 3.11、3.12 或 3.10 均可。请勿使用 3.13。\n- 将当前目录切换到你希望安装 SwarmUI 的文件夹：`cd`。\n- 克隆 SwarmUI 的 GitHub 仓库：`git clone https:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI`。\n- 进入 `SwarmUI` 目录并运行安装脚本：`.\u002Flaunch-macos.sh`。\n- 等待网页浏览器自动打开，并按照页面上的说明完成安装。\n\n# 使用 Docker 安装\n\n有关如何在 Docker 中使用 SwarmUI 的详细说明，请参阅 [Docs\u002FDocker.md](\u002Fdocs\u002FDocker.md)。\n\n# 文档\n\n请参阅 [文档文件夹](\u002Fdocs\u002FREADME.md)。\n\n# 设计动机\n\n“Swarm”这个名字源自该界面的核心功能：允许多个 GPU 同时为同一用户生成图像（尤其适用于大规模网格生成）。这正是命名的灵感来源，但并非 Swarm 的全部功能。\n\nSwarmUI 的总体目标是成为一个功能齐全、一站式的 Stable Diffusion 综合平台。\n\n有关技术选择背后的动机，请参阅 [动机文档](\u002Fdocs\u002FMotivations.md)。\n\n# 法律声明\n\n本项目：\n- 嵌入了 [7-zip](https:\u002F\u002F7-zip.org\u002Fdownload.html) 的副本（LGPL）。\n- 具备自动安装 [ComfyUI](https:\u002F\u002Fgithub.com\u002Fcomfyanonymous\u002FComfyUI) 的能力（GPL）。\n- 可以选择将 [AUTOMATIC1111\u002Fstable-diffusion-webui](https:\u002F\u002Fgithub.com\u002FAUTOMATIC1111\u002Fstable-diffusion-webui) 作为后端（AGPL）。\n- 可以自动安装 [christophschuhmann\u002Fimproved-aesthetic-predictor](https:\u002F\u002Fgithub.com\u002Fchristophschuhmann\u002Fimproved-aesthetic-predictor)（Apache2）和 [yuvalkirstain\u002FPickScore](https:\u002F\u002Fgithub.com\u002Fyuvalkirstain\u002FPickScore)（MIT）。\n- 可以自动安装 [git-for-windows](https:\u002F\u002Fgit-scm.com\u002Fdownload\u002Fwin)（GPLv2）。\n- 可以自动安装 MIT\u002FBSD\u002FApache2\u002FPython Software Foundation 提供的 pip 包：[spandrel](https:\u002F\u002Fpypi.org\u002Fproject\u002Fspandrel\u002F)、[dill](https:\u002F\u002Fpypi.org\u002Fproject\u002Fdill\u002F)、[imageio-ffmpeg](https:\u002F\u002Fpypi.org\u002Fproject\u002Fimageio-ffmpeg\u002F)、[opencv-python-headless](https:\u002F\u002Fpypi.org\u002Fproject\u002Fopencv-python-headless\u002F)、[matplotlib](https:\u002F\u002Fpypi.org\u002Fproject\u002Fmatplotlib\u002F)、[rembg](https:\u002F\u002Fpypi.org\u002Fproject\u002Frembg\u002F)、[kornia](https:\u002F\u002Fpypi.org\u002Fproject\u002Fkornia\u002F)、[Cython](https:\u002F\u002Fpypi.org\u002Fproject\u002FCython\u002F)。\n- 可以自动安装 [ultralytics](https:\u002F\u002Fgithub.com\u002Fultralytics\u002Fultralytics)（AGPL），用于 `YOLOv8` 人脸检测（即 `SwarmYoloDetection` 节点或 `\u003Csegment:yolo-...>` 语法的使用可能会受到 AGPL 条款的约束）。\n- 可以自动安装 [insightface](https:\u002F\u002Fgithub.com\u002Fdeepinsight\u002Finsightface)（MIT），以支持 `IP Adapter - Face` 功能。\n- 使用了 [JSON.NET](https:\u002F\u002Fgithub.com\u002FJamesNK\u002FNewtonsoft.Json)（MIT）、[FreneticUtilities](https:\u002F\u002Fgithub.com\u002FFreneticLLC\u002FFreneticUtilities)（MIT）、[LiteDB](https:\u002F\u002Fgithub.com\u002Fmbdavid\u002FLiteDB)（MIT）、[ImageSharp](https:\u002F\u002Fgithub.com\u002FSixLabors\u002FImageSharp\u002F)（Apache2，采用开源 Split License）。\n- 嵌入了来自 [BootStrap](https:\u002F\u002Fgetbootstrap.com\u002F)（MIT）、[Select2](https:\u002F\u002Fselect2.org\u002F)（MIT）、[JQuery](https:\u002F\u002Fjquery.com\u002F)（MIT）、[exif-reader](https:\u002F\u002Fgithub.com\u002Fmattiasw\u002FExifReader)（MPL-2.0）的 Web 资源副本。\n- 包含部分图标来自 [Cristian Munoz](https:\u002F\u002Fwww.figma.com\u002Fcommunity\u002Ffile\u002F1311159026125960259\u002F7000-free-ui-icons)（CC-BY-4.0）、字体 [inter by rsms](https:\u002F\u002Fgithub.com\u002Frsms\u002Finter)（OFL）、[Unifont by GNU](https:\u002F\u002Funifoundry.com\u002Funifont\u002F)（OFL）、[Material Symbols Outlined by Google](https:\u002F\u002Ffonts.google.com\u002Ficons)（Apache2）。\n- 支持安装一些自定义节点包，这些包在安装前会针对非纯开源许可证单独列出许可说明。\n- 支持用户构建的扩展插件，这些插件可能具有各自的许可证或法律条款。\n\nSwarmUI 本身采用 MIT 许可证，然而某些用法可能会受到上述关联项目 GPL 类许可证的影响，并且请注意，所使用的任何模型均具有各自的许可证。\n\n### 之前的许可证\n\n（适用于 2024 年 6 月之前的更新）\n\nMIT 许可证（MIT）\n版权所有 © 2024 Stability AI\n\n### 许可证\n\nMIT 许可证（MIT）\n\n版权所有 © 2024–2026 Alex \"mcmonkey\" Goodwin\n\n特此授予任何人免费获取本软件及其相关文档文件（以下简称“软件”）副本的权利，允许其在不受限制的情况下处理软件，包括但不限于使用、复制、修改、合并、发布、分发、再许可和\u002F或销售软件副本的权利；同时，允许向任何接收软件的人提供软件，但须遵守以下条件：\n\n上述版权声明及本许可声明应包含在软件的所有副本或实质性部分中。\n\n软件按“原样”提供，不提供任何形式的保证，无论是明示还是默示，包括但不限于适销性、特定用途适用性和非侵权性。在任何情况下，作者或版权所有者均不对因合同、侵权或其他原因引起的任何索赔、损害赔偿或其他责任负责，无论此类责任源于软件本身、软件的使用或其他与软件相关的事项。","# SwarmUI 快速上手指南\n\nSwarmUI（原名 StableSwarmUI）是一款模块化 AI 图像与视频生成 Web 界面，强调高性能、易用性及强大的扩展能力。支持 Stable Diffusion、Flux、Wan 视频模型等多种主流模型。\n\n## 环境准备\n\n### 系统要求\n- **操作系统**：Windows 10\u002F11、Linux (Ubuntu\u002FDebian 等)、macOS (仅限 M 系列芯片)\n- **Python 版本**：推荐 3.11 或 3.12（**严禁使用 3.13**），需包含 `pip` 和 `venv`\n- **.NET 版本**：必须安装 .NET 8 SDK\n\n### 前置依赖安装\n\n**Windows 用户：**\n- Windows 10 需手动安装 [Git](https:\u002F\u002Fgit-scm.com\u002Fdownload\u002Fwin) 和 [.NET 8 SDK](https:\u002F\u002Fdotnet.microsoft.com\u002Fen-us\u002Fdownload\u002Fdotnet\u002F8.0)。\n- Windows 11 通常可自动处理部分依赖，但建议确保上述两项已安装。\n\n**Linux 用户：**\n```bash\n# Ubuntu\u002FDebian 示例\nsudo apt update\nsudo apt install git python3-pip python3-venv python3-full\n# 确保 Python 版本为 3.10 - 3.12\npython3 --version \n```\n随后请参照微软官方文档安装 .NET 8 SDK (`dotnet-sdk-8.0`)。\n\n**macOS 用户 (仅限 M1\u002FM2\u002FM3 等 Apple Silicon)：**\n```bash\nbrew update\nbrew doctor\nbrew install dotnet\nbrew install python@3.11 virtualenv\n```\n\n---\n\n## 安装步骤\n\n请选择对应系统的安装方式。国内用户若下载 GitHub 资源较慢，可配置 Git 代理或使用镜像源加速。\n\n### 方案 A：Windows 一键安装（推荐）\n\n1. 下载 [install-windows.bat](https:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Freleases\u002Fdownload\u002F0.9.8-Beta\u002Finstall-windows.bat) 到非 `Program Files` 的目录（如 `D:\\AI\\SwarmUI`）。\n2. 双击运行该文件。\n   - 若窗口闪退，请再次运行一次。\n   - 安装完成后会自动启动服务并打开浏览器至安装页面。\n   - 桌面会生成启动图标。\n\n### 方案 B：Linux\u002FmacOS 脚本安装\n\n**Linux:**\n```bash\n# 下载安装脚本\nwget https:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Freleases\u002Fdownload\u002F0.6.5-Beta\u002Finstall-linux.sh -O install-linux.sh\nchmod +x install-linux.sh\n# 执行安装\n.\u002Finstall-linux.sh\n```\n\n**macOS:**\n```bash\n# 进入目标目录\ncd \u002Fpath\u002Fto\u002Fyour\u002Finstall\u002Ffolder\n# 克隆仓库\ngit clone https:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\ncd SwarmUI\n# 运行启动脚本（首次运行会自动完成环境配置）\n.\u002Flaunch-macos.sh\n```\n\n### 方案 C：手动通用安装 (Git Clone)\n\n适用于所有平台的高级用户：\n\n```bash\n# 1. 克隆仓库\ngit clone https:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\ncd SwarmUI\n\n# 2. 根据系统运行启动脚本\n# Windows:\nlaunch-windows.bat\n# Linux:\n.\u002Flaunch-linux.sh\n# macOS:\n.\u002Flaunch-macos.sh\n\n# 3. 若无头服务器 (Headless Linux)，使用以下命令暴露端口：\n# .\u002Flaunch-linux.sh --launch_mode none --host 0.0.0.0\n```\n\n启动后，在浏览器访问 `http:\u002F\u002Flocalhost:7801\u002FInstall` 跟随网页指引完成后续模型后端（如 ComfyUI）的配置。\n\n---\n\n## 基本使用\n\n安装完成后，浏览器将自动打开 SwarmUI 主界面。\n\n### 1. 初始配置\n- 首次访问会进入 **Install** 页面。\n- 选择后端类型（推荐默认安装 **ComfyUI** 以获得最佳兼容性和性能）。\n- 等待模型下载与环境初始化完成（视网络情况可能需要几分钟）。\n\n### 2. 生成第一张图片 (Generate 标签页)\n适合新手及快速出图：\n- 点击顶部导航栏的 **Generate**。\n- **Prompt**: 输入正向提示词（例如：`a cute cat, cyberpunk style, high quality`）。\n- **Negative Prompt**: 输入反向提示词（例如：`blurry, low quality`）。\n- **Model**: 在下拉菜单中选择已下载的模型（如 SDXL 或 Flux）。\n- 点击右侧 **Generate** 按钮开始生成。\n\n### 3. 高级工作流 (Comfy Workflow 标签页)\n适合专业用户：\n- 点击 **Comfy Workflow** 标签。\n- 此处提供完整的节点式编辑器，可加载自定义 ComfyUI 工作流 JSON。\n- 利用左侧工具栏进行精细控制、网格生成 (Grid Generator) 或图像编辑。\n\n### 4. 多 GPU 集群 (Swarm 特性)\n- 若拥有多张显卡或多台机器，可在设置中配置多个后端实例，SwarmUI 将自动分配任务以实现并行生成，大幅提升大图或网格图的产出速度。","一位独立游戏开发者需要为即将上线的奇幻 RPG 项目快速生成数百张风格统一的角色概念图与宣传素材。\n\n### 没有 SwarmUI 时\n- **工作流割裂**：尝试不同模型（如 Stable Diffusion 与 Flux）需频繁切换多个软件界面，导致操作中断且难以统一管理输出结果。\n- **批量测试低效**：想要对比不同提示词或参数对画质的影响时，只能手动重复执行生成任务，缺乏内置的网格生成器（Grid Generator）进行自动化批处理。\n- **高阶功能门槛高**：若需精细控制图像结构，必须深入 ComfyUI 编写复杂的节点连线图，初学者极易因逻辑繁琐而放弃调整。\n- **资源调度困难**：在多显卡环境下无法智能分配渲染任务，常出现显存溢出或硬件闲置并存的资源浪费现象。\n\n### 使用 SwarmUI 后\n- **一站式多模态支持**：在同一界面下无缝切换并调用 Stable Diffusion、Flux 及 Wan 视频模型，所有生成历史与资产集中管理，工作流丝滑连贯。\n- **智能批量对比**：利用内置的 Grid Generator 一键自动遍历多种参数组合，瞬间产出对比图表，快速锁定最佳视觉效果。\n- **灵活的双模式操作**：新手可通过直观的\"Generate\"标签页快速出图，专家则能随时切换至\"Comfy Workflow\"编辑底层节点，兼顾易用性与极致控制权。\n- **高性能扩展架构**：模块化设计自动优化多卡负载，显著提升高分辨率图像与视频生成的渲染速度，最大化硬件利用率。\n\nSwarmUI 通过模块化架构将专业级 AI 创作工具变得触手可及，让开发者从繁琐的技术调试中解放，专注于创意落地。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fmcmonkeyprojects_SwarmUI_ae6ae5f6.jpg","mcmonkeyprojects","mcmonkey's public projects","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002Fmcmonkeyprojects_d7c5ad48.png","Public projects released by @mcmonkey4eva (to avoid mixing public projects with the mess on my account repository list).",null,"agoodwin@freneticllc.com","https:\u002F\u002Falexgoodwin.media","https:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects",[82,86,90,94,98,102,106,110,113],{"name":83,"color":84,"percentage":85},"C#","#178600",54.9,{"name":87,"color":88,"percentage":89},"JavaScript","#f1e05a",31.8,{"name":91,"color":92,"percentage":93},"HTML","#e34c26",4.8,{"name":95,"color":96,"percentage":97},"Python","#3572A5",4,{"name":99,"color":100,"percentage":101},"CSS","#663399",3.9,{"name":103,"color":104,"percentage":105},"Shell","#89e051",0.4,{"name":107,"color":108,"percentage":109},"Batchfile","#C1F12E",0.1,{"name":111,"color":112,"percentage":109},"Jupyter Notebook","#DA5B0B",{"name":114,"color":115,"percentage":116},"PowerShell","#012456",0,3936,388,"2026-04-07T02:31:43","MIT","Windows, Linux, macOS","未明确说明具体型号，但支持多 GPU 集群（Swarm）；Mac 端仅限 M 系列芯片 (M1, M2 等)；云端支持 Google Colab, Runpod, Vast.ai","未说明",{"notes":125,"python":126,"dependencies":127},"1. macOS 用户必须使用搭载 M 系列芯片的设备。2. Windows 10 用户需手动安装 Git 和 .NET 8 SDK，Windows 11 可自动安装。3. Linux 安装需确保 Python 包含 pip 和 venv 模块。4. 首次运行可能需要几分钟下载模型和配置环境。5. 该项目为模块化界面，后端可自动安装 ComfyUI 或连接 AUTOMATIC1111。","3.10, 3.11, 3.12 (明确禁止使用 3.13)",[128,129,130,131],".NET 8 SDK","git","python3-pip","python3-venv",[13,14,15],[134,135,136,137,138,139,140,141,142],"ai","csharp","image-generation","javascript","machine-learning","ml","python","stable-diffusion","comfyui","2026-03-27T02:49:30.150509","2026-04-07T18:35:47.839565",[146,151,156,161,166,171],{"id":147,"question_zh":148,"answer_zh":149,"source_url":150},22676,"为什么在 Chromium 浏览器中点击 Comfy Workflow 标签页时一直显示加载圆圈而无法加载？","这通常是由于浏览器缓存或扩展冲突导致的。建议尝试以下操作：1. 强制刷新页面（Ctrl+F5 或 Cmd+Shift+R）；2. 清除浏览器缓存；3. 尝试在无扩展模式下打开浏览器测试；4. 如果问题依旧，检查后端日志确认是否有扩展初始化失败。维护者指出某些版本更新后可能需要完全重启后端服务才能解决加载卡死问题。","https:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fissues\u002F169",{"id":152,"question_zh":153,"answer_zh":154,"source_url":155},22677,"使用 Conda 安装时卡在'选择安装路径'界面且'下一步'按钮不可用怎么办？","这是安装程序 UI 的一个边缘情况 Bug。解决方法是：更新 SwarmUI 到最新版本，然后在浏览器中按 Ctrl+F5 强制刷新页面。维护者确认该问题已在后续修复中解决，刷新后安装流程将恢复正常。如果仍然无效，请尝试不使用 Conda 环境或使用系统原生 Python 进行安装。","https:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fissues\u002F628",{"id":157,"question_zh":158,"answer_zh":159,"source_url":160},22678,"较新的 YOLO 模型（如 v12）能运行但最终图像合并失败产生黑屏怎么办？","该问题通常由 ultralytics 依赖库的内存损坏或版本不兼容引起。解决方案是更新 ultralytics 库到最新版本。SwarmUI 会自动安装该依赖，但有时需要手动更新。可以尝试在环境中运行：pip install --upgrade ultralytics。维护者确认更新依赖后问题已解决，因为新版本的底层代码重构修复了模型加载和内存管理问题。","https:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fissues\u002F999",{"id":162,"question_zh":163,"answer_zh":164,"source_url":165},22679,"如何正确设置 GPU 功耗限制以避免 MSI Afterburner 在 SwarmUI 中失效？","MSI Afterburner 在某些情况下可能被 SwarmUI 的后端行为绕过。推荐使用 NVIDIA 官方命令行工具设置功耗限制，更加稳定可靠。使用方法：nvidia-smi -pl \u003C瓦数>（例如：nvidia-smi -pl 450）。维护者指出这不是 SwarmUI 的直接 Bug，而是第三方超频软件与深度学习框架交互的常见问题，使用 nvidia-smi 命令可以确保功耗限制始终生效。","https:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fissues\u002F880",{"id":167,"question_zh":168,"answer_zh":169,"source_url":170},22680,"Comfy Workflow 标签页加载时白屏刺眼且左上角小部件遮挡工作区如何解决？","目前可以通过以下方式缓解：1. 加载工作流前最小化浏览器窗口或使用快捷键隐藏界面；2. 手动点击左上角小部件将其最小化以腾出空间。关于自动最小化和深色背景的功能请求已被记录，但尚未作为默认行为实现。用户可以通过自定义 CSS 或等待未来版本添加相关设置选项来解决此问题。","https:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fissues\u002F1023",{"id":172,"question_zh":173,"answer_zh":174,"source_url":170},22681,"Docker 容器中自定义节点（Custom Nodes）不随容器更新而更新怎么办？","这是预期行为，容器更新只更新核心软件，不包含自定义节点以保持稳定性。如果需要更新特定节点，建议：1. 在后端标签页的服务器部分重启 ComfyUI 来触发更新；2. 或者进入容器手动更新节点；3. 对于需要精细控制的用户，可以固定特定节点版本以避免兼容性问题。维护者强调不应自动更新所有节点，因为这可能导致扩展与节点版本不匹配而崩溃。",[176,181,186,191,196,201,206,211,216,221],{"id":177,"version":178,"summary_zh":179,"released_at":180},136390,"0.9.8-Beta","此版本的 Reddit 帖子：https:\u002F\u002Fwww.reddit.com\u002Fr\u002FStableDiffusion\u002Fcomments\u002F1qxmzo0\u002Fswarmui_098_release\u002F\n\n自 0.9.7 版本发布以来，已经过去了 6 个月，期间累计了近 600 次提交……变化非常多，以下仅列出其中最值得关注的部分：\n\n# 主要更新\n\n- Flux.2 支持！\u003Chttps:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fblob\u002Fmaster\u002Fdocs\u002FModel%20Support.md#flux-2>\n    - 包括 Flux.2-Dev 以及 Flux.2-Klein 的 4B 和 9B 版本，适用于文生图和图像编辑任务。\n- Z-Image 支持！\u003Chttps:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fblob\u002Fmaster\u002Fdocs\u002FModel%20Support.md#z-image>\n    - 新安装默认已包含 Z-Image Turbo 模型。\n- Anima 模型支持！\u003Chttps:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fblob\u002Fmaster\u002Fdocs\u002FModel%20Support.md#anima>\n- Hunyuan Image 2.1 支持！\u003Chttps:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fblob\u002Fmaster\u002Fdocs\u002FModel%20Support.md#hunyuan-image-21>\n- Hunyuan Video 1.5 支持！\u003Chttps:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fblob\u002Fmaster\u002Fdocs\u002FVideo%20Model%20Support.md#hunyuan-video-15>\n- Qwen Image Edit Plus 支持！\u003Chttps:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fblob\u002Fmaster\u002Fdocs\u002FModel%20Support.md#qwen-image-edit>\n- LTX-2 支持！\u003Chttps:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fblob\u002Fmaster\u002Fdocs\u002FVideo%20Model%20Support.md#lightricks-ltx-video-2>\n    - 首个性能尚可的开源视频模型，能够生成高质量音频！\n- 针对集群部署的高级“自动扩展后端”功能初步实现——目前仍处于实验阶段，请谨慎使用。\u003Chttps:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fblob\u002Fmaster\u002Fdocs\u002FFeatures\u002FAutoScalingBackend.md>\n- Comfy 的输入输出文件夹现已同步显示在图像历史视图中。\n- Swarm 现已开通 Patreon 支持！\u003Chttps:\u002F\u002Fpatreon.com\u002Fswarmui>\n- 音频和视频现已成为 SwarmUI 中的一等公民。它们拥有完善的界面、在历史标签页中的全面支持，并且可以作为输入参数直接使用，甚至包括带有音频的视频文件。\n- Windows 平台上的 AMD 显卡现原生支持 ROCm-PyTorch-Windows！\n- 若启用了用户账号功能，新增“模拟用户”按钮，既可用于从其他用户的视角测试界面，也可用于搭建不同的个人工作环境。\n- 对专用音频模型的支持工作已启动。\n\n# 其他小更新\n\n- SeedVR 新插件备受关注，它能以比大多数方法更快、更智能的方式对图像进行超分辨率处理。\n- 新增选项，允许公开共享的 Swarm 实例接受新用户注册（默认关闭）。\n- 添加 EasyCache 参数。EasyCache 是 Comfy 内置节点，类似于 TeaCache 等“步骤缓存”技术，但由于它是 Comfy 原生支持的，因此无需繁琐的安装即可与各类节点无缝配合。\n- 新增 Qwen ControlNet 支持。\n- 为不稳定的网络环境下下载失败的情况增加了自动恢复功能，适用于安装包及模型下载。\n- 触发短语现配备复制按钮。\n- 优化了通配符编辑界面。\n- 改进了模型类别检测机制。\n- 新增 TCFG 参数（感谢 @green-s）。\n- 推出全新“猫爪拿铁”主题（t","2026-02-06T16:54:03",{"id":182,"version":183,"summary_zh":184,"released_at":185},136391,"0.9.7-Beta","此版本的 Reddit 帖子：https:\u002F\u002Fwww.reddit.com\u002Fr\u002FStableDiffusion\u002Fcomments\u002F1mzsc62\u002Fswarmui_097_release\u002F\n\n自 0.9.6 版本发布以来，已经过去了 4 个月，期间累计了近 500 次提交……变化很多，以下是一些最值得关注的内容：\n\n# 主要更新\n\n- 新增对 HiDream-i1 图像模型的支持 \u003Chttps:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fblob\u002Fmaster\u002Fdocs\u002FModel%20Support.md#hidream-i1>（Full、Dev、Fast、Edit）\n- 完整的新手视频生成指南 \u003Chttps:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fdiscussions\u002F716>\n- 新增对 Chroma 的支持 \u003Chttps:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fblob\u002Fmaster\u002Fdocs\u002FModel%20Support.md#chroma>\n- Swarm 现在引入了参数子组功能，以便更好地组织冗长的参数列表。首个应用是 Refiner 组新增了一个用于基础参数覆盖的子组，Segments 组也有类似调整。\n- 初步实验性地支持部分移动端界面。现在在移动设备上打开 Swarm 大体上可以正常使用，不过仍有许多工作要做。你可以在“用户设置”→“生成选项卡布局”中配置使用移动端\u002F桌面端\u002F自动检测模式。\n- 新增对 Flux Kontext 的支持 \u003Chttps:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fblob\u002Fmaster\u002Fdocs\u002FModel%20Support.md#flux1-tools>\n- 新增对 OmniGen 2 的支持 \u003Chttps:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fblob\u002Fmaster\u002Fdocs\u002FModel%20Support.md#omnigen-2>\n- 使用 Lightning LoRA 是当前生成视频的最佳方式，相关文档见 \u003Chttps:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fblob\u002Fmaster\u002Fdocs\u002FVideo%20Model%20Support.md#wan-causvid---high-speed-14b>\n- 新增对 Wan Phantom 的支持 \u003Chttps:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fblob\u002Fmaster\u002Fdocs\u002FVideo%20Model%20Support.md#wan-phantom>\n- 新增对 Wan 2.2 的支持 \u003Chttps:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fblob\u002Fmaster\u002Fdocs\u002FVideo%20Model%20Support.md#wan-22>\n- 新增对 Qwen Image 和 Qwen Image Edit 的支持 \u003Chttps:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fblob\u002Fmaster\u002Fdocs\u002FModel%20Support.md#qwen-image>\n\n# 次要更新\n\n- 现在可以右键点击某个参数并将其“加星”，使其显示在顶部。\n- 分辨率设置中新增了“边长”参数，方便更轻松地自定义尺寸。\n- 改进了服务器信息页的更新器界面。\n- 图像编辑批处理工具中新增了“将文件名追加到提示词”复选框。\n- 增加了对 Wan FLF2V 模型变体的支持（视频结束帧参数）。\n- 新增 `RestartOnGpuCriticalError` 服务器设置，并加入了相关的 NVIDIA GPU 故障检测功能。\n- 新增 `ImageQuality` 用户设置，用于动态调整 JPG\u002FWebP 格式图片保存的质量，感谢 @Hugs288 的贡献。\n- 现在可以通过输入 `\u003Cwildcard:名称:` 并在末尾加上冒号，来调出通配符行的自动补全下拉列表，从而快速选取通配符中的内容。\n- 对响应速度进行了全面优化，使点击“生成”后图像能更快显示出来。\n- Wan Vace 增加了参考图支持。\n- 为 Refiner 添加了用于覆盖采样器和调度器的参数。\n- 新增批量处理 UI 设置“分隔批次”。\n- 新增高级参数“SegmentTargetResolution”，同时 Segments Refining 现在被单独归入一个子组。\n- 新增高级参数“OverrideOutpathF”。","2025-08-25T14:42:03",{"id":187,"version":188,"summary_zh":189,"released_at":190},136392,"0.9.6-Beta","此版本的 Reddit 主题帖：https:\u002F\u002Fwww.reddit.com\u002Fr\u002FStableDiffusion\u002Fcomments\u002F1jztcuu\u002Fswarmui_096_release\u002F\n\n# 重大更新\n\n- 新增对 Wan 2.1 视频模型的支持 \u003Chttps:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fblob\u002Fmaster\u002Fdocs\u002FVideo%20Model%20Support.md#wan-21>\n- 新增对 Lumina 2 图像模型的支持 \u003Chttps:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fblob\u002Fmaster\u002Fdocs\u002FModel%20Support.md#lumina-2>\n- 新增对 SkyReels 视频模型的支持 \u003Chttps:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fblob\u002Fmaster\u002Fdocs\u002FVideo%20Model%20Support.md#skyreels-text2video>\n- 新增对 Hunyuan Image2Video 模型及其 “v2\u002Ffixed” 变体的支持 \u003Chttps:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fblob\u002Fmaster\u002Fdocs\u002FVideo%20Model%20Support.md#hunyuan-video>\n- 提示词语法升级：\n    - 新增 `\u003Cextend:...>` 语法，用于使用 image2video 模型自动扩展视频\n    - 新增 `\u003Crefiner>` 语法，可在精修\u002F超分环节添加自定义提示词或 LoRA\n    - `\u003Cregion:...>` 块现在可以包含 `\u003Clora:...>`\n- 记录了如何在 Windows 上使用 Triton、Torch.Compile 和 SageAttention： \u003Chttps:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fblob\u002Fmaster\u002Fdocs\u002FAdvanced%20Usage.md#triton-torchcompile-sageattention-on-windows>\n- Swarm 现已拥有可链接的官方网站 \u003Chttps:\u002F\u002Fswarmui.net\u002F>\n- 多用户账号系统预览 \u003Chttps:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fblob\u002Fmaster\u002Fdocs\u002FSharing%20Your%20Swarm.md>\n    - 拥有编程或网络安全经验吗？请查看面向安全研究人员的公开招募： https:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fdiscussions\u002F679\n- 新增对 Nunchaku SVDQuant 的支持 \u003Chttps:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fblob\u002Fmaster\u002Fdocs\u002FModel%20Support.md#nunchaku-mit-han-lab>\n\n# 小幅更新\n\n- 移除了旧的手动更新批处理\u002FShell 脚本，推荐使用服务器选项卡中的 UI 按钮，或在服务器配置中启用自动更新。如果您仍然喜欢脚本文件，也可以自行编写 `git pull` 脚本。\n- Comfy 节点的自动更新现由 ComfyUI 自动更新的独立后端设置管理。\n- Swarm 的新安装默认将在后端使用 Python 3.12。\n- YOLO 分割现支持类别 ID 和 SegmentSortOrder 参数。\n- 在 Lumina 2 的高级采样选项中新增了 `Renorm CFG`。\n- 新增了 `Color Correction Behavior` 高级参数，旨在改善 Flux 的图像修复效果，并感谢 @willhsmit 在实现过程中提供的帮助。\n- 新增了 `AccessControlAllowOrigin` 服务器设置。\n- 初步支持 RTX 50 系列显卡，但全面支持仍需等待 PyTorch 正式发布。\n- 视频功能更新：新增 `gif-hd` 和 `h265-mp4` 导出格式；动画 WebP 现可用于初始化图像，以进行批量生成或文本转视频；为文本转视频增加了帧插值参数；新增了 `GIMM-VFI` 支持；此外还进行了多项小幅改进，以提升 Swarm 处理视频的能力。\n- 在图像转视频选项中新增了 `Video2Video Creativity` 参数，允许您直接使用 i2v 模型对视频进行精修。\n- 新增了 `Trim Video Start\u002FEnd Frames` 参数，用于裁剪 Wan 和…等模型中容易出现问题的边缘帧。","2025-04-15T14:31:55",{"id":192,"version":193,"summary_zh":194,"released_at":195},136393,"0.9.5-Beta","此版本的 Reddit 帖子：https:\u002F\u002Fwww.reddit.com\u002Fr\u002FStableDiffusion\u002Fcomments\u002F1ieh81r\u002Fswarmui_095_release\u002F\n\n# 主要更新\n\n- 新增对 Hunyuan Video 的支持 \u003Chttps:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fblob\u002Fmaster\u002Fdocs\u002FVideo%20Model%20Support.md#hunyuan-video>\n- 新增对 Nvidia Sana 1600M 快速图像生成模型的支持 \u003Chttps:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fblob\u002Fmaster\u002Fdocs\u002FModel%20Support.md#nvidia-sana>\n- 大幅完善了 Docker 支持及相关文档 \u003Chttps:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fblob\u002Fmaster\u002Fdocs\u002FDocker.md>\n- 新增对 Nvidia Cosmos 视频模型的支持 \u003Chttps:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fblob\u002Fmaster\u002Fdocs\u002FVideo%20Model%20Support.md#nvidia-cosmos>\n- 发布了一份待办的小功能列表，方便有兴趣参与项目贡献的开发者快速上手 \u003Chttps:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fissues\u002F550>\n- 添加了“收藏”模型的按钮，方便用户将常用模型置顶 \u003Chttps:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fdiscussions\u002F1#discussioncomment-11955149>\n- 生成选项卡布局自定义！可以自由调整子选项卡的位置！ \u003Chttps:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fdiscussions\u002F1#discussioncomment-12004159>\n\n# 次要更新\n\n- 新增 `Rescale CFG Multiplier` 参数，用于在 ComfyUI 中使用原生的 RCfg 实现，而非动态阈值版本（两者略有差异）\n- Swarm 生成的视频现在能在图像历史和批量视图中正确显示动画预览（可在服务器配置中关闭动画预览功能）\n- 初始化图像新增一个一键复制分辨率的按钮\n- 文件浏览器（图像历史、模型等）新增“详细列表”视图模式选项\n- 新增 `UnrestrictedMaxT2iSimultaneous` 服务器设置，以提供更灵活的后端排序控制\n- 新增时序平铺参数\n- 新增服务器配置选项 `ClearStrayModelData`，使“编辑元数据”功能能够清理来自其他 UI 或旧版 Swarm（`.swarm.json` 文件启用前）的残留文件\n- 新增服务器配置选项 `EditMetadataAcrossAllDups`，适用于模型存在本地与 NAS 等多份冗余存储的情况，可保持各存储位置的元数据同步\n- 新增服务器配置选项 `DownloaderAlwaysResave`，便于频繁使用下载器的用户保持模型文件夹整洁\n- 模型界面新增“删除模型”按钮，并配套服务器配置选项 `RecycleDeletedModels`\n- 模型界面新增“重命名模型”按钮\n- 服务器配置新增自动重启工具，归类于“维护”模块\n- 新增服务器启动\u002F停止 Webhook\n- 图像生成 Webhook 现在可以将图片直接上传至 Discord，详情请参见 \u003Chttps:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fblob\u002Fmaster\u002Fdocs\u002FFeatures\u002FWebhooks.md#direct-image-on-discord>\n- 在高级采样中新增 TeaCache 功能（会在一定程度上牺牲画质以提升生成速度，在低阈值情况下通常值得开启）\n- 新增 `Init Image Noise` 参数及对应的 `SwarmImageNoise` ComfyUI 节点，允许直接向图像（而非潜在空间）添加高斯噪声\n- 新增用户设置 `ParameterMemoryDurationHours`，用于配置…","2025-01-31T15:25:38",{"id":197,"version":198,"summary_zh":199,"released_at":200},136394,"0.9.4.0-Beta","关于此事的 Reddit 帖子：https:\u002F\u002Fnew.reddit.com\u002Fr\u002FStableDiffusion\u002Fcomments\u002F1h81y4c\u002Fswarmui_094_release\u002F\n\n# 主要更新\n\n- 新增对阿里妈妈 Flux Inpaint ControlNet 的支持 —— 详情参见：https:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fdiscussions\u002F1#discussioncomment-10928398\n- 新增对 BFL 的 Flux 工具（Redux、Canny、Depth、Fill）的支持 —— 详情参见：https:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fblob\u002Fmaster\u002Fdocs\u002FModel%20Support.md#flux1-tools\n- 新增对 Genmo Mochi 1 文本转视频模型的支持 —— 详情参见：https:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fdiscussions\u002F1#discussioncomment-11158473\n- 现已支持 SD 3.5 Large、Large Turbo 以及 Medium 模型，包括 Large ControlNet —— 详情参见：https:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fblob\u002Fmaster\u002Fdocs\u002FModel%20Support.md#stable-diffusion-35-large\n- 新增对 Lightricks LTX-Video 文本转视频及图片转视频模型的支持 —— 详情参见：https:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fblob\u002Fmaster\u002Fdocs\u002FModel%20Support.md#lightricks-ltx-video\n- UI 功能：新增“提示词添加按钮”，便于使用 Segment 或 Region 等高级提示词语法 —— https:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fdiscussions\u002F1#discussioncomment-11468608\n\n# 次要更新\n\n- 用户设置中新增“悬停延迟弹出框”选项，供不喜欢即时弹出或问号提示框的用户选择。\n- 完善了故障排除文档 \u003Chttps:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fblob\u002Fmaster\u002Fdocs\u002FTroubleshooting.md>。\n- 增强了特殊错误的检测与处理机制（例如，Swarm 现在可以在日志中明确指出崩溃是否由内存问题引起，并提供相应的解决方法）。\n- 自动下载模型的功能得到改进，甚至可以在需要时自动下载 Flux\u002FSD3.5 的 VAE 文件。\n- 新增参数“VAE 平铺重叠”，用于控制平铺式 VAE 的生成质量。\n- 改进了图像元数据格式并进行了文档化 \u003Chttps:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fblob\u002Fmaster\u002Fdocs\u002FImage%20Metadata%20Format.md>。\n- 服务器端新增选项，可在图像元数据中启用模型哈希值。\n- 图像界面新增“复制原始元数据”按钮。\n- “提示词语法”文档现配有大量示意图，以演示各项功能 \u003Chttps:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fblob\u002Fmaster\u002Fdocs\u002FFeatures\u002FPrompt%20Syntax.md>。\n- “模型支持”文档现增加了对比图，方便用户比较不同模型 \u003Chttps:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fblob\u002Fmaster\u002Fdocs\u002FModel%20Support.md>。\n- 批量生成时的视图更加美观，加入了模型图标占位符、模糊效果、加载动画等元素（可通过批量视图上方的齿轮菜单切换是否显示加载动画）。\n- 新增高级参数“Segment Mask 超大尺寸”，以实现对分割行为更精细的控制。\n- 新增用户设置“最大提示词行数”，用于配置提示词输入框的视觉滚动限制。\n- 预设选择现在会在页面刷新后保持不变，与其他参数同步。\n- 现在可以卸载扩展插件。\n- 现在可以通过将非标准 IPAdapter 模型保存到 IPAdapter 模型文件夹中来使用它们。\n- 此外，还进行了许多小的优化和改进。","2024-12-06T13:59:32",{"id":202,"version":203,"summary_zh":204,"released_at":205},136395,"0.9.3-Beta","距离上一个版本发布已经过去两个月了，这段时间我一直在忙ComfyUI的相关工作，还突然去了一趟东京，不过现在我已经全身心回归了。\n\n本次发布的Reddit公告：https:\u002F\u002Fnew.reddit.com\u002Fr\u002FStableDiffusion\u002Fcomments\u002F1g2n9ya\u002Fswarmui_093_beta_release\u002F\n\n# 主要更新\n\n- 现在支持并使用全新的现代Comfy前端！\n- 所有Swarm-Comfy节点都添加了工具提示。\n- 增加了对GGUF模型的原生支持，详情请参阅：\u003Chttps:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fblob\u002Fmaster\u002Fdocs\u002FModel%20Support.md#gguf-quantized-models>\n- 新增了一个批量CivitAI元数据查询工具：\u003Chttps:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fdiscussions\u002F1#discussioncomment-10803637>\n- Comfy后端设置中新增了一个选项，用于指定在Comfy工作流标签页中应使用哪个版本的Comfy前端。\n- 自动补全用户设置得到了升级，增加了许多由众多“御宅族”请求的实用新配置选项。\n- 在“服务器”选项卡下新增了扩展管理器：\u003Chttps:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fdiscussions\u002F1#discussioncomment-10920910>\n- Swarm现在可以直接构建为可执行文件，而不再依赖`dotnet`来启动进程。所有功能保持不变，如果你有自定义脚本，旧的.dll启动方式仍然可用。不过，这样会让Windows弹出“是否允许此应用访问网络？”的提示框。\n\n# 次要更新\n\n- 为多GPU用户新增了`GenerateForeverQueueSize`配置项，方便他们滥用“无限生成”功能——该功能由@wottso提交的PR引入。\n- 改进了WebUI图像元数据的自动导入功能。\n- Comfy后端的`gpu_id`现在可以使用CUDA语法，以配合某人制作的Comfy多GPU节点包（我不推荐这样做，但如果你想用的话也可以）。\n- 增加了对NF4模型的原生支持。\n- 在“服务器”->“日志”中新增了一个按钮，可快速将最近的调试日志上传至Pastebin服务，方便你在遇到问题寻求帮助时，轻松分享清晰完整的日志。\n- 模型下载器现在支持文件夹选择。\n- 新增了名为“Solarized Light”的主题，适合喜欢明亮但不刺眼界面的用户——感谢@yoinked-h。\n- 新增了`setvar`和`var`两种提示词语法，允许在提示词中动态地即时复用变量——感谢@Targren。\n- 新增了`SwarmMaskGrow`Comfy节点。\n- 在“初始图像”设置中新增了“蒙版扩张”高级选项，可自动扩大蒙版范围，在某些情况下非常有用。\n- 远程后端的高级设置得到了改进（包括headers和认证相关配置）。\n- 将`unet`文件夹更名为`diffusion_models`，因为实际上并没有人会把UNet模型放在这里。\n- 开始整理扩展列表：\u003Chttps:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fblob\u002Fmaster\u002Fdocs\u002FExtensions.md>，也可参阅Discord上的扩展频道。\n- Swarm内部新增了16位PNG文件输出选项（虽然高精度数据可能并不常用）。\n- 构建了一个相对健壮且文档完善的Webhook触发引擎：\u003Chttps:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fblob\u002Fmaster\u002Fdocs\u002FFeatures\u002FWebhooks.md>\n- 在编辑提示词时点击通配符","2024-10-13T11:09:42",{"id":207,"version":208,"summary_zh":209,"released_at":210},136396,"0.9.2-Beta","本次发布的 Reddit 帖子：https:\u002F\u002Fnew.reddit.com\u002Fr\u002FStableDiffusion\u002Fcomments\u002F1eosnug\u002Fswarmui_092_beta_release\u002F\n\n# 主要更新\n\n- 下拉参数现在使用更友好的名称，而非原始 ID，更多信息请参见：https:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fdiscussions\u002F1#discussioncomment-10199321\n- 原生支持 Flux！https:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fdiscussions\u002F1#discussioncomment-10216583\n- 图像编辑器新增 SAM2 自动分割器 https:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fdiscussions\u002F1#discussioncomment-10296989\n\n# 次要更新\n\n- 新增扩展使用文档 https:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fblob\u002Fmaster\u002Fdocs\u002FExtensions.md，其中介绍了由 Quaggles 发布的 ReActor 扩展。\n- 在高级 -> 区域提示下新增参数 `Mask Composite Unthresholded`，可能使 `\u003Csegment:>` 的使用在细化时更加平滑（但内容替换效果会较差）。\n- 新增服务器设置 `XLDefaultAsXL1`，作为应对 XL 模型元数据被作者破坏时的一种临时解决方案。\n- 新增服务器设置 `EditMetadataWriteJSON`，改为以 JSON 格式写入元数据，而非直接编辑模型元数据，对硬盘速度较慢的情况较为实用。\n- 现在为 IP 适配器启停添加了高级参数。\n- 新增提示语法简写，例如 `\u003Cwc:my\u002Fwildcard\u002Fname>`。\n- 新增对 AuraFlow v0.1 的支持（目前仍需手动选择架构，AuraFlow 团队计划在不久的将来添加完善的模型元数据）。\n- 新增近似参数 `[FreeU] Version`，用于选择 FreeU Version 2。\n- 现在可以在 `\u003Csegment:` 中使用负阈值来反转掩码。\n- 新增日志设置 `RepeatTimestampAfterMinutes`，适用于长时间运行且日志中存在较大间隔的 Swarm 服务器，以便在时间戳上更加清晰。\n- 新增高级参数 `ControlNet Union Type`，供使用 ControlNet Union 时手动指定子类型。\n- 在高级采样中新增 `Perturbed Attention Guidance`。\n- 新增 `IP-Adapter Weight Type` 参数，用于选择“提示更重要”或“风格迁移”类型的 IP 适配器设置。\n- Booru 标签的自动补全现在会显示标签数量。\n- 安装流程得到改进，尤其是针对 AMD 显卡（AMD 仍然存在问题，但目前已有所改善）。\n- 此外，还包含许多小的优化和错误修复等常规更新。\n\n","2024-08-10T12:52:47",{"id":212,"version":213,"summary_zh":214,"released_at":215},136397,"0.9.1-Beta","本次发布的 Reddit 帖子：https:\u002F\u002Fnew.reddit.com\u002Fr\u002FStableDiffusion\u002Fcomments\u002F1dy9rzr\u002Fswarmui_091beta_release\u002F\n\n# 主要更新\n\n- 新增对 PixArt Sigma MS XL 2 的支持 \u003Chttps:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fblob\u002Fmaster\u002Fdocs\u002FModel%20Support.md#pixart-sigma>\n- 迁移到完全独立的仓库（也就是这个仓库）\n- 现已全面支持 SD3 的控制网（InstantX）\u003Chttps:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fdiscussions\u002F1#discussioncomment-9909001>\n- 开始编写问题排查文档 \u003Chttps:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fblob\u002Fmaster\u002Fdocs\u002FTroubleshooting.md>，并在 Discord 上开设了求助频道\n- 在“编辑图像”界面中新增了对带有动态笔压值的数位板的支持，目前仅限于笔刷大小的动态调节。如果你是使用数位板绘图的艺术家，并希望进一步扩展此功能，请在 [Swarm Discord](https:\u002F\u002Fdiscord.gg\u002Fq2y38cqjNw) 中 @ 我。\n\n# 次要更新\n\n- 移除了旧版 Stability API 后端\n- Civitai 现已在用户设置中增加了 API Key 选项，用于自动下载仅需认证的文件，感谢 @maedtb 的贡献\n- ~~新增了通过采样器 `euler_cfg_pp_regular` 实现的初始 CFG++ 支持~~，现已由 ComfyUI 原生支持\n- 远程 Swarm 后端现在可以添加 “Authorization” 请求头（因为部分远程服务器需要该头信息）\n- 此处的 GitHub 问题页面现已提供问题模板\n- 使“refiner”分组的用途更加明确（它同时也具备超分辨率等功能），并补充了一些参数分组说明文档\n- 标签页标题现在会实时显示当前待处理的生成任务数量，即使切换到其他标签页也能随时了解进度\n- 新增用户设置 `AutoCompleteSuffix`，可让自动补全功能自动追加逗号等符号\n- Segment YOLO 现在按从左到右的顺序排列，以便更精确地单独选择字符\n- 控制网现在能够仅根据文件名提示自动检测 Canny、深度、姿态、涂鸦等类型，而无需依赖元数据（即无需手动指定预处理方式）\n- 新增用户设置 `ButtonsUnderMainImages`，用于自定义打开图片时显示哪些按钮，以及哪些按钮会被移至“更多”菜单\n- 大幅升级了模型下载工具，详情请参阅 \u003Chttps:\u002F\u002Fgithub.com\u002Fmcmonkeyprojects\u002FSwarmUI\u002Fissues\u002F44>\n- 新增服务器设置 `RecycleDeletedImages`，可将删除的图片移至回收站而非彻底清空文件\n- 在“采样”选项下新增了 `Zero Negative` 参数，有时可提升 SD3 的生成质量\n- 此外还有许多小改进和错误修复等常规更新。\n\n","2024-07-08T13:54:45",{"id":217,"version":218,"summary_zh":219,"released_at":220},136398,"0.9.0-Beta","SwarmUI 独立版，版本 0.9.0 Beta。\n\n这是作为独立代码仓库的首个版本标识。","2024-06-21T23:18:01",{"id":222,"version":223,"summary_zh":224,"released_at":225},136399,"0.6.5-Beta","这是 SwarmUI 独立之前，Stability 版本 Swarm 的最终文件。","2024-06-21T22:54:41"]