sd-dynamic-prompts
sd-dynamic-prompts 是一款专为 AUTOMATIC1111 Stable Diffusion WebUI 设计的扩展插件,旨在通过引入灵活的模板语言,实现提示词(Prompt)的随机化与组合式生成。它有效解决了用户在创作中难以快速探索海量风格组合、手动编写大量变体提示词效率低下的痛点,让单次输入即可衍生出无数种创意可能。
无论是希望激发灵感的设计师、需要批量测试模型效果的研究人员,还是想要轻松尝试不同艺术风格的普通爱好者,都能从中受益。其核心亮点在于简洁直观的语法:用户只需使用花括号 {选项 A|选项 B} 即可定义随机选择,或利用 __文件名__ 调用外部通配符库(如艺术家名单、季节词汇等),甚至支持从深层目录结构中递归读取资源。此外,它还具备“组合生成模式”,能系统性地将所有选项排列组合并批量出图,极大提升了实验效率。配合内置的通配符管理器和丰富的在线资源社区,sd-dynamic-prompts 让提示词工程变得更加简单有趣,是挖掘 Stable Diffusion 潜能的得力助手。
使用场景
一位独立游戏开发者正在为奇幻 RPG 项目批量生成数百张风格各异的“季节与建筑”概念图,以丰富游戏场景库。
没有 sd-dynamic-prompts 时
- 手动组合效率极低:开发者需反复手动修改提示词中的“房屋类型”和“季节”,如将"house"改为"cottage"、"summer"改为"winter",耗时且枯燥。
- 创意覆盖范围狭窄:受限于人工操作的耐心,只能测试寥寥几种固定搭配,难以发现“秋季小屋配特定画家风格”等意外惊艳的组合。
- 外部资源调用繁琐:若想从本地文本文件随机读取大量艺术家名字或材质描述,必须编写额外的 Python 脚本或手动复制粘贴,无法在 WebUI 内直接完成。
- 批次生成缺乏变化:一次性生成多张图片时,若不开启复杂设置,往往得到的是完全相同的提示词结果,失去了随机探索的意义。
使用 sd-dynamic-prompts 后
- 模板化自动排列组合:只需输入
A {house|cottage|lodge} in {__seasons__} by {2$$artist},sd-dynamic-prompts 即可自动穷举或随机生成成千上万种不重复的提示词组合。 - 深度挖掘创意空间:通过通配符语法轻松调用本地
seasons.txt或预置艺术家库,让 AI 自动尝试人类难以想到的冷门风格混搭,激发设计灵感。 - 原生支持文件随机读取:直接在提示词中使用
__filename__语法即可动态加载外部文本内容,无需任何额外编程,工作流无缝集成在 AUTOMATIC1111 界面中。 - 高效批量生产变体:配合组合模式(Combinatorial Mode),一次点击即可基于单一模板生成涵盖所有变量组合的图像批次,极大提升了素材产出速度。
sd-dynamic-prompts 将原本机械重复的提示词编写工作转化为高效的自动化创意实验,让开发者能专注于筛选最佳视觉方案而非陷入文字堆砌。
运行环境要求
- 未说明
未说明
未说明

快速开始
Stable Diffusion 动态提示词扩展
这是一个为 AUTOMATIC1111/stable-diffusion-webui 开发的自定义扩展,它实现了一种功能强大的模板语言,用于随机或组合式提示词生成,并支持深度通配符目录结构。
正在寻找 ComfyUI 节点?请在此处查找:comfyui-dynamicprompts。
目录
- 基本用法
- 在线资源
- 安装
- 配置
- 故障排除
- 兼容脚本
- 模板语法
- 组合生成
- 固定种子
- 魔法提示词
- 让我来决定
- 吸引注意力
- 将提示词写入文件
- Jinja2 模板
- WILDCARD_DIR
- 集合
- 动态提示词与随机种子
基本用法
使用此脚本,提示词:
A {house|apartment|lodge|cottage} in {summer|winter|autumn|spring} by {2$$artist1|artist2|artist3}
将会生成以下任意一种提示词:
- 夏天里的房子,由artist1、artist2创作
- 秋天里的小屋,由artist3、artist1创作
- 冬天里的别墅,由artist2、artist3创作
- ...
这在您寻找有趣的艺术家和风格组合时尤其有用。
您还可以从文件中随机选取一个字符串。假设您在 WILDCARD_DIR 中有 seasons.txt 文件(见下文),那么:
__seasons__ is coming
可能会生成如下内容:
- 冬天来了
- 春天来了
- ...
您也可以两次使用同一个通配符:
I love __seasons__ better than __seasons__
- 我更喜欢冬天而不是夏天
- 我更喜欢春天而不是春天
更多完整的文档可以在这里找到:[docs/SYNTAX.md]。
想要教程吗?点击这里
需要通配符库?我们已经为您准备好了集合。
在线资源
您可以在这里找到教程和通配符包的列表:[docs/resources.md]
安装
该扩展可以直接从 Webui 的 Extensions 选项卡中安装。

您也可以手动安装,只需在 webui 目录下运行以下命令:
git clone https://github.com/adieyal/sd-dynamic-prompts/ extensions/sd-dynamic-prompts
您可以在 extensions/sd-dynamic-prompts/wildcards 中创建通配符文件,或者利用预装的集合,通过 Web UI 中的“Wildcards Manager”选项卡来使用。
配置
您可以在 Dynamic Prompts 部分的 Settings 选项卡中找到各种设置,以调整动态提示词的行为。
更改语法
如果与其他扩展发生语法冲突,Dynamic Prompts 允许您更改变体开始和结束的符号。默认情况下,它们分别设置为 { 和 },例如 {red|green|blue}。在设置选项卡中,您可以将这两个符号更改为任何字符串,比如 <red|green|blue> 或者 ::red|green|blue::。
默认情况下,通配符以双下划线 __ 开始并以 __ 结束。您可以在设置选项卡中的 wildcard wrap 部分进行更改。
通配符设置
Dynamic Prompts 会在使用通配符文件之前自动去重并排序。如果您希望禁用此功能,可以在设置选项卡中取消勾选相关复选框。
<img src="https://oss.gittoolsai.com/images/adieyal_sd-dynamic-prompts_readme_4d7882be46ab.png>
勾选“shuffle wildcards”复选框会随机化通配符的顺序,从而确保每次运行组合模型时都会生成不同的图像。
将模板保存到元数据
默认行为是将所有通配符解析为可用的提示词,然后将该提示词存储在 PNG 信息或 txt 文件中(例如 I love Winter better than Summer)。如果您还想保留包含通配符的原始模板,可以开启此选项,这样就会保存:
我更喜欢冬天而不是夏天
模板:I love __seasons__ better than __seasons__
注意:这个额外的“Template”部分不会显示在生成页面上,但会在 PNG Info(或如果您安装了相应扩展的图片浏览器)中可见。
故障排除
如果您在使用 Dynamic Prompts 时遇到问题,请按照以下步骤进行排查和解决:
确保您已安装最新版本的 Dynamic Prompts 扩展和库。要检查已安装的版本,可在 txt2image 的 Dynamic Prompts 部分打开 Need Help? 折叠面板。扩展的最新版本号可在此处查看:扩展,库的最新版本号可在此处查看:库。
如果版本不匹配,请在 Extensions(扩展)选项卡中更新扩展,并重启 WebUI。扩展应会自动更新库。
如果上述步骤无效,您可能需要手动运行以下命令来更新库:
python -m pip install -U dynamicprompts[attentiongrabber,magicprompt]
- 重启 WebUI 并再次检查。如果 WebUI 使用的是不同的 Python 解释器,请找到正确的 Python 路径并运行:
/path/to/python/binary/python -m pip install -U dynamicprompts[attentiongrabber,magicprompt]
如果 Wildcard UI 没有显示,可能是由于库版本过旧所致。请检查终端中的错误信息,并按照第 3 步所述更新库。
如果出现“未找到通配符 some/wildcard 的值”的错误提示,请确保文件 wildcard.txt 位于 extensions/sd-dynamic-prompts/wildcards/some/ 目录下。必须提供完整路径,因为当前不支持相对路径。
如果问题仍然存在,请在 GitHub 的 问题页面 和 讨论区 中查找解决方案。如果找不到解决方案,请创建一个新的问题,并为其起一个描述性的标题,例如“通配符值在提示模板中被忽略”。同时提供必要的上下文信息,包括 Dynamic Prompts 扩展和库的版本号,以及所使用的操作系统或 Colab 环境。如果终端中有错误信息,请复制粘贴全部内容或截屏。
最后,务必测试并应用我们发布的任何修复方案。您的反馈非常宝贵,因为在我们的环境中可以正常工作的问题,在您的环境中可能无法解决。
兼容脚本
Dynamic Prompts 与 X/Y Plot 结合使用效果尤为出色——将 Dynamic Prompts 设置为 组合模式 同时使用 X/Y Plot,可以让您同时全面测试提示和参数的各种变化。
模板语法
文档可在 这里 找到。
模糊匹配与递归通配符文件/目录匹配
除了标准的通配符标记(如 __times__ -> times.txt),您还可以使用 glob 匹配一次匹配多个文件。
例如:
__colors*__将匹配以下文件:
- WILDCARD_DIR/colors.txt
- WILDCARD_DIR/colors1.txt
- WILDCARD_DIR/nested/folder/colors1.txt
__light/**/*__将匹配:
- WILDCARD_DIR/nested/folder/light/a.txt
- WILDCARD_DIR/nested/folder/light/b.txt
但不会匹配:
- WILDCARD_DIR/nested/folder/dark/a.txt
- WILDCARD_DIR/a.txt
您还可以使用字符范围 [0-9] 和 [a-z],以及单个通配符 ?。更多示例请参阅 这篇文章。
WILDCARD_DIR 默认为 extensions/sd-dynamic-prompts/wildcards。
组合生成
与从模板中随机生成提示不同,组合生成会根据给定的字符串生成所有可能的提示。例如:
I {love|hate} {New York|Chicago} in {June|July|August}
将生成:
- I love New York in June
- I love New York in July
- I love New York in August
- I love Chicago in June
- I love Chicago in July
- I love Chicago in August
- I hate New York in June
- I hate New York in July
- I hate New York in August
- I hate Chicago in June
- I hate Chicago in July
- I hate Chicago in August
如果提供了 __wildcard__,则会为通配符文件中的每个值生成一个新的提示。例如:
My favourite season is __seasons__
将生成:
- My favourite season is Summer
- My favourite season is August
- My favourite season is Winter
- My favourite season is Sprint
您还可以在通配符中嵌套组合,或在组合中嵌套通配符。
组合生成在您希望为文件中的每位艺术家都生成一张图像时非常有用。可以通过勾选界面中的 Combinatorial generation 复选框来启用此功能。为防止意外生成数千张图片,您可以使用 Max Generations 滑块限制生成的提示总数。默认值为 0,表示不限制。
组合批次
组合批次滑块允许您使用不同的种子重复同一组提示多次。默认批次数为 1。
增加最大生成数量
默认情况下,automatic1111 的 Batch count 滑块的最大值为 100。这可能会限制使用组合生成时的最大生成数量。您可以通过编辑 ui-config.json 文件来更改此滑块的最大值,将:
txt2img/Batch count/maximum": 100
修改为更大的数值,例如:
txt2img/Batch count/maximum": 1000
固定种子
如果您希望为每张生成的图片使用相同的种子,请选择此项。如果没有通配符,所有图片都将完全相同。这在您想要测试特定修饰符的效果时非常有用。例如:
A beautiful day at the beach medium/photography/filmtypes
这样您就可以单独分析每种胶片类型对特定场景的影响。以下是部分结果:

Magic Prompt
使用多种提示生成模型之一来丰富您的提示内容。
借助 Gustavosta 的 MagicPrompt 模型,该模型基于来自 Lexica.art 的 80,000 条提示进行训练,可以帮助您针对特定主题生成有趣的新提示。以下是关于“狗踢足球”的一些自动生成变体:
狗踢足球,在日本小镇的夜晚街道上,人们惊奇地围观,吉卜力工作室和新海诚风格,高度精细的数字艺术,ArtStation 上热门作品
狗踢足球,背景是一场核爆炸。照片级真实感。高清。超写实。4K。获奖作品。
狗踢足球,背景是一场核爆炸。写实主义。4K 宽画幅。电影级。虚幻引擎。Artgerm。Marc Simonetti。JC Leyendecker
此功能与上述通配符语法兼容。
其他模型
- daspartho/prompt-extend (~500mb)
- succinctly/text2image-prompt-generator (~600mb) - 基于Midjourney提示词训练
- microsoft/Promptist (~500mb) - 论文链接:here
- AUTOMATIC/promptgen-lexart (~300mb) - 使用lexica.art上的134,819条提示词微调
- AUTOMATIC/promptgen-majinai-safe (~300mb) - 来自majinai.art的1,654条提示词
- AUTOMATIC/promptgen-majinai-unsafe (~300mb) - 来自majinai.art的825条提示词(含NSFW内容)
- Gustavosta/MagicPrompt-Dalle
- kmewhort/stable-diffusion-prompt-bolster (~500mb),
- Ar4ikov/gpt2-650k-stable-diffusion-prompt-generator (~500mb),
- Ar4ikov/gpt2-medium-650k-stable-diffusion-prompt-generator (~1.4gb),
- crumb/bloom-560m-RLHF-SD2-prompter-aesthetic (~1.1gb),
- Meli/GPT2-Prompt (~500mb),
- DrishtiSharma/StableDiffusion-Prompt-Generator-GPT-Neo-125M (~550mb)
首次使用某个模型时,它会被下载。该模型大约500MB,因此下载时间取决于您的网络速度。首次激活时,由于模型需要加载到内存中,也会花费几秒钟。请注意,如果您的显存不足,可能会出现CUDA错误。我的显卡使用不到8GB显存,但具体情况因人而异。
您可以通过__最大魔法提示长度__滑块来控制提示的最大长度。__魔法提示创意度__可以调整生成的提示,但您可能需要多次尝试以找到合适的设置。
使用__魔法提示黑名单正则表达式__来过滤掉某些关键词。例如,如果您想避免包含Greg Rutkowski的提示,只需将他的名字添加到此字段中。
如果您正在使用魔法提示生成大量提示,那么增加__魔法提示批次大小__可以显著提高提示生成速度。不过,这种提升只有在您不同时生成图像时才会明显,因为图像生成的速度远慢于提示生成。
我很幸运
使用lexica.art API来创建随机提示。这在您需要灵感或懒得自己思考提示时非常有用。当选择此选项时,主提示框中的内容将被用作搜索字符串。例如,提示“机械战士”可能会返回:
- 由Greg Rutkowski、Sung Choi、Mitchell Mohrhauser、Maciej Kuciara、Johnson Ting、Maxim Verehin、Peter Konig创作的一座位于森林中央的巨大机器人石像,风格为最终幻想,8K超写实,电影级灯光,高清,细节丰富,氛围感十足。
- 一幅精美的肖像画,描绘了一位身着赛博朋克装甲的人物,由simon stalenhag、pascal blanche、alphonse mucha和nekro共同创作,采用数字艺术风格。色彩鲜艳的漫画风,黑色电影般的对称构图,笔触细腻,色彩跃动,细节极其丰富。Octane渲染。在ArtStation上备受关注。
- 对称!一位机器人宇航员的肖像,繁花似锦!出自《地平线零之曙光》中的机械设计,复杂精致、优雅且高度细节化,数字绘画,来自ArtStation的概念艺术作品,画面流畅,焦点清晰,插画风格,由artgerm、greg rutkowski和alphonse mucha等艺术家创作,8K分辨率。
如果提示框留空,则会返回完全随机选择的提示列表。
引人注目
此选项会随机选择您提示中的一个关键词,并为其添加不同程度的强调。以下是其对提示的影响示例:
一幅拟人化的熊猫法师施法的肖像,身穿法师长袍,背景是风景,可爱,DND角色艺术肖像,由Jason Felix和Peter Mohrbacher创作,电影级灯光。
勾选__高级选项__下的__固定种子__复选框,即可查看强调如何改变您的图像,而不会改变种子。
将提示保存到文件
勾选“将提示保存到文件”复选框,即可创建一个包含所有生成提示的文件。生成的文件是以提示内容为基础生成的URL友好字符串,可与生成的图片存放在同一目录下,例如:outputs/txt2img-images。

Jinja2模板
Jinja2模板是一项实验性功能,允许您以编程方式定义提示。这是一项高级功能,仅推荐给熟悉脚本编写的用户。
要启用,请打开“高级”折叠面板并选择“启用Jinja2模板”。

您可以点击这里了解更多详细信息。
WILDCARD_DIR
该扩展会在WILDCARD_DIR目录中查找通配符文件。默认路径为/path/to/stable-diffusion-webui/extensions/sd-dynamic-prompts/wildcards。您也可以在WebUI的主配置文件config.json中手动指定wildcard_dir。如有疑问,可在WebUI扩展的帮助文本中找到WILDCARD_DIR的完整路径。
资源库
collections 目录包含修饰符库,您可以直接使用,也可以在此基础上构建自己的资源库。要开始使用,您可以通过“通配符管理器”选项卡将一个或多个资源库复制到您的 wildcards 文件夹中,或者手动复制文件。动态提示扩展程序自带三个资源库。
jumbo 这是一个非常庞大的通配符资源库,涵盖了美学、外观、艺术家、媒介、风格和时间等多个类别。该资源库仍在不断完善中,旨在全面覆盖各类修饰符类别。
parrotzone 这是一个规模较小、更易于管理的资源库,内容来源于 https://proximacentaurib.notion.site/e28a4f8d97724f14a784a538b8589e7d?v=42948fd8f45c4d47a0edfc4b78937474。
devilkkw Devilkkw 更侧重于角色塑造、服饰、手势、食物等内容。
如果您使用的是 Unix/Linux 操作系统,并且不打算修改相关资源库,可以直接创建指向相应资源库的符号链接,而无需将其复制过去。例如:
ln -sr collections/parrotzone wildcards/
您还可以通过在扩展程序的根目录(即 extensions/sd-dynamic-prompts/)下运行 python _tools/download_collections.py 来下载其他扩展资源库。
动态提示与随机种子
随机种子在控制生成结果的随机性方面起着重要作用。下面我们来探讨在不同场景下,动态提示如何与随机种子协同工作。
未启用动态提示时
- 如果种子设置为 -1:系统会随机选择一个种子。该种子用于生成第一张图像,随后每张图像都会在前一张图像的种子基础上加 1 来生成,以此类推。
- 如果种子设置为大于 -1 的具体数值:过程与上述类似,但会从用户指定的种子开始。
- 如果定义了变化种子,但变化强度为零:过程与前两点相同。
- 如果变化种子设置为大于 0 的数值:每张图像都使用相同的初始种子(随机选择或用户指定)。变化种子可以是随机的(当设置为 -1 时)或由用户指定的值。第一张图像使用变化种子生成,第二张则使用变化种子 + 1,依此类推。
启用动态提示并使用随机/标准模式时
- 如果种子设置为 -1:过程与上一节的第一点相似。不过,此时提示也会根据相同的种子进行选择(如果使用随机提示生成器)。
- 如果种子设置为大于 -1 的数值:过程与上一节的第二点相似。区别在于,此时也会根据选定的种子生成随机提示(如果使用提示生成器)。
- 如果勾选了固定种子复选框:所有图像和提示都将使用同一个种子。这意味着会反复生成同一张图像(这在组合式生成中很有用)。
- 如果同时勾选了固定种子和取消提示与种子关联的复选框:提示将使用随机种子,但所有图像仍会使用同一个种子。如果您想了解不同的提示对同一张图像生成效果的影响,这种设置可能会有所帮助。
带有动态提示的变化种子
- 变化强度设置为 0:变化将被忽略。
- 变化种子设置为大于 0 的数值:每张图像都会分配一个变化种子,每次递增 1。然而,由于您希望得到同一张图像的不同变体,因此只会生成 1 张提示。
变化强度大于 0 的组合模式
在这种情况下,系统只会为您生成第一张图像,这可能并不是您想要的结果。为了获得理想的效果,您可能需要调整设置或改用其他模式。
常见问题
相似工具推荐
openclaw
OpenClaw 是一款专为个人打造的本地化 AI 助手,旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚,能够直接接入你日常使用的各类通讯渠道,包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息,OpenClaw 都能即时响应,甚至支持在 macOS、iOS 和 Android 设备上进行语音交互,并提供实时的画布渲染功能供你操控。 这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地,用户无需依赖云端服务即可享受快速、私密的智能辅助,真正实现了“你的数据,你做主”。其独特的技术亮点在于强大的网关架构,将控制平面与核心助手分离,确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者,以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力(支持 macOS、Linux 及 Windows WSL2),即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你
stable-diffusion-webui
stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。
ComfyUI
ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。
markitdown
MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具,专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片(含 OCR)、音频(含语音转录)、HTML 乃至 YouTube 链接等多种格式的解析,能够精准提取文档中的标题、列表、表格和链接等关键结构信息。 在人工智能应用日益普及的今天,大语言模型(LLM)虽擅长处理文本,却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点,它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式,成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外,它还提供了 MCP(模型上下文协议)服务器,可无缝集成到 Claude Desktop 等 LLM 应用中。 这款工具特别适合开发者、数据科学家及 AI 研究人员使用,尤其是那些需要构建文档检索增强生成(RAG)系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性,但其核心优势在于为机器
LLMs-from-scratch
LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目,旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型(LLM)。它不仅是同名技术著作的官方代码库,更提供了一套完整的实践方案,涵盖模型开发、预训练及微调的全过程。 该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型,却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码,用户能够透彻掌握 Transformer 架构、注意力机制等关键原理,从而真正理解大模型是如何“思考”的。此外,项目还包含了加载大型预训练权重进行微调的代码,帮助用户将理论知识延伸至实际应用。 LLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API,而是渴望探究模型构建细节的技术人员而言,这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计:将复杂的系统工程拆解为清晰的步骤,配合详细的图表与示例,让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础,还是为未来研发更大规模的模型做准备
Deep-Live-Cam
Deep-Live-Cam 是一款专注于实时换脸与视频生成的开源工具,用户仅需一张静态照片,即可通过“一键操作”实现摄像头画面的即时变脸或制作深度伪造视频。它有效解决了传统换脸技术流程繁琐、对硬件配置要求极高以及难以实时预览的痛点,让高质量的数字内容创作变得触手可及。 这款工具不仅适合开发者和技术研究人员探索算法边界,更因其极简的操作逻辑(仅需三步:选脸、选摄像头、启动),广泛适用于普通用户、内容创作者、设计师及直播主播。无论是为了动画角色定制、服装展示模特替换,还是制作趣味短视频和直播互动,Deep-Live-Cam 都能提供流畅的支持。 其核心技术亮点在于强大的实时处理能力,支持口型遮罩(Mouth Mask)以保留使用者原始的嘴部动作,确保表情自然精准;同时具备“人脸映射”功能,可同时对画面中的多个主体应用不同面孔。此外,项目内置了严格的内容安全过滤机制,自动拦截涉及裸露、暴力等不当素材,并倡导用户在获得授权及明确标注的前提下合规使用,体现了技术发展与伦理责任的平衡。


