zeroshot
zeroshot 是一款开源的命令行工具,旨在打造你的“自主工程团队”。它不仅仅是一个代码生成器,而是一个能够独立完成任务规划、代码实现、测试验证及迭代修复的多智能体编排系统。用户只需指向一个任务(如 GitHub Issue、本地文件或一段文字描述),zeroshot 便会自动在隔离环境中运行,直到产出经过严格验证的生产级代码,或在失败时提供可复现的具体原因。
传统 AI 编程助手往往缺乏自我验证能力,容易陷入“盲目自信”的误区。zeroshot 通过引入独立的“规划者”、“执行者”和“验证者”角色,解决了这一痛点。它内置了盲测机制,会循环执行“计划 - 实施 - 验证”流程,确保代码不仅被写出,更能通过自动化测试并符合验收标准,特别适用于对正确性要求高于速度的复杂场景。
这款工具非常适合注重代码质量与可复现性的高级工程师、希望自动化 PR 工作流的开发团队,以及需要处理大量遗留问题的开源维护者。其独特亮点在于支持多种主流 AI 模型(如 Claude Code、OpenAI Codex、Gemini 等)作为后端,并兼容 GitHub、GitLab、Jira 等多个任务管理平台。此外,它还具备崩溃恢复功能,能持久化保存状态,确保长耗时任务的安全执行。
使用场景
某电商平台的后端团队正面临一个棘手的任务:需要在用户下单流程中紧急引入“乐观锁”机制,以解决高并发下的库存超卖问题,同时必须确保代码能正确处理复杂的版本冲突(如 ABA 问题)。
没有 zeroshot 时
- 人工实现风险高:资深工程师需手动编写复杂的重试逻辑和版本比对代码,极易因疏忽遗漏边缘情况,导致生产环境出现数据不一致。
- 验证过程繁琐:开发者需反复手动运行单元测试和集成测试,难以模拟真实的高并发竞争条件,往往依赖直觉而非数据确认修复效果。
- 迭代效率低下:一旦发现测试失败,需重新分析日志、修改代码并再次提交,整个“编码 - 测试 - 修复”循环耗时数小时甚至数天。
- 缺乏独立审查:单人开发模式缺乏独立的“第二双眼睛”进行盲测验证,代码质量高度依赖个人状态,难以保证生产级稳定性。
使用 zeroshot 后
- 自主闭环开发:只需输入“添加带指数退避的乐观锁”指令,zeroshot 自动调度规划器拆解任务,并由实现器在隔离环境中完成编码,精准处理 ABA 问题。
- 自动化盲测验证:内置的独立验证器自动运行压力测试和边界检查,不依赖开发者主观判断,直到所有测试通过才停止迭代,确保逻辑严密。
- 无限循环直至达标:若首次提交未通过验证,zeroshot 会自动分析失败原因并重新修改代码,无需人工干预,直到生成可合并的生产级代码。
- 可复现的交付成果:整个过程的状态持久化保存,即使意外中断也能恢复,最终交付的代码附带明确的验证报告,让团队放心合并。
zeroshot 将原本需要数天的人工试错过程,转化为一个自动运行、自我修正且结果可验证的闭环工程流,让正确性不再依赖运气。
运行环境要求
- Linux
- macOS
未说明
未说明

快速开始
零样本 CLI
🎉 v5.4 新特性: 现已支持 OpenCode CLI!您可以选择 Claude、Codex、Gemini 或 OpenCode 作为 AI 提供商。同时支持 GitHub、GitLab、Jira 和 Azure DevOps 作为问题后端。详情请参阅 提供商 和 多平台问题支持。
npm install -g @covibes/zeroshot
演示(100倍速,90分钟运行,5轮迭代直至批准)
Zeroshot 是一个开源的 AI 编码代理编排 CLI,它运行多代理工作流,以自主方式实现、审查、测试和验证代码变更。
它在隔离环境中运行一个 规划器、一个 实施者 和独立的 验证者,循环执行直到变更被 验证 或因可操作且可复现的失败而被 拒绝。
专为那些正确性比速度更重要的任务而设计。
工作原理
- 规划:将任务转化为具体的验收标准
- 实施:在隔离的工作区(本地、工作树或 Docker)中进行更改
- 验证:由独立的验证者运行自动化检查
- 迭代:重复执行,直到验证通过,或返回可操作的失败信息
- 恢复:崩溃安全的状态会被持久化以便恢复
快速开始
zeroshot run 123 # GitHub 问题编号
zeroshot run feature.md # Markdown 文件
zeroshot run "添加暗模式" # 内联文本
或者直接描述一个复杂任务:
zeroshot run "添加带有自动重试的乐观锁:更新用户时,使用指数退避策略最多重试 3 次,合并不冲突的字段更改,并详细提示冲突。处理版本从 A 变为 B 再变回 A 的 ABA 问题。"
为什么不能只用一个 AI 代理?
| 方法 | 编写代码 | 运行测试 | 盲目验证 | 迭代直至验证 |
|---|---|---|---|---|
| 基于聊天的助手 | ✅ | ⚠️ | ❌ | ❌ |
| 单一编码代理 | ✅ | ⚠️ | ❌ | ⚠️ |
| Zeroshot(多代理) | ✅ | ✅ | ✅ | ✅ |
使用场景
- 自主 AI 代码重构
- AI 驱动的拉取请求自动化
- 带有验证的自动化 bug 修复
- 软件工程中的多代理代码生成
- 带有盲验证的代理式编码工作流
适合人群
- 关注正确性和可重复性的高级工程师
- 自动化 PR 流程和代码审查关卡的团队
- 标准化代理式工作流的基础架构/平台团队
- 处理问题积压的开源维护者
- 希望获得验证而非“感觉”的 AI 高级用户
安装与要求
平台:Linux、macOS。Windows(原生/WSL)暂未支持,因为我们正在强化可靠性和多提供商的正确性。
npm install -g @covibes/zeroshot
要求:Node 18+,至少一个提供商 CLI(Claude Code、Codex、Gemini、Opencode)。
# 安装一个或多个提供商
npm i -g @anthropic-ai/claude-code
npm i -g @openai/codex
npm i -g @google/gemini-cli
# Opencode:详见 https://opencode.ai
# 使用提供商 CLI 进行认证
claude login # Claude
codex login # Codex
gemini auth login # Gemini
opencode auth login # Opencode
# GitHub 认证(用于问题编号)
gh auth login
提供商
Zeroshot 会调用各个提供商的 CLI。您可以选择默认提供商,也可以在每次运行时覆盖:
zeroshot providers
zeroshot providers set-default codex
zeroshot run 123 --provider gemini
有关设置、模型级别和 Docker 挂载,请参阅 docs/providers.md。
为什么需要多个代理?
单代理会话容易失效。上下文会在数千个 token 中被淹没。模型更倾向于“完成”而不是“正确”。
Zeroshot 通过隔离的代理来解决这个问题,这些代理会相互检查彼此的工作。验证者无法对未编写的代码撒谎。如果检查失败?就修复并重试,直到真正有效为止。
区别于其他工具之处
- 盲验证:验证者永远不会看到工作者的上下文或代码历史
- 可重复的工作流:任务复杂度决定了代理数量和模型选择
- 接受/拒绝循环:拒绝结果包含可操作的发现,而非含糊的抱怨
- 崩溃恢复:所有状态都会持久化到 SQLite 数据库中;随时可以恢复
- 隔离模式:无隔离、git 工作树或 Docker 容器
- 成本控制:模型上限可防止 API 费用失控
何时使用 Zeroshot
Zeroshot 在任务具有明确的验收标准时表现最佳。
| 场景 | 使用 | 为什么 |
|---|---|---|
| 添加限流(滑动窗口,按 IP 限制,429 错误) | 是 | 要求清晰 |
| 将认证重构为 JWT | 是 | 定义了最终状态 |
| 修复登录 bug | 是 | 成功与否可衡量 |
| 修复 2410 个 Lint 违规 | 是 | 完成标准明确 |
| 让应用更快 | 否 | 需要先探索 |
| 改善代码库 | 否 | 无验收标准 |
| 查明不稳定测试 | 否 | 探索性任务 |
经验法则:如果您无法描述“完成”意味着什么,那么验证者就无法对其进行验证。
命令概览
# 运行
zeroshot run 123 # GitHub 问题
zeroshot run feature.md # Markdown 文件
zeroshot run "添加暗模式" # 内联文本
# 隔离
zeroshot run 123 --worktree # git 工作树
zeroshot run 123 --docker # 容器
# 自动化(--ship 表示 --pr 表示 --worktree)
zeroshot run 123 --pr # 工作树 + 创建 PR
zeroshot run 123 --ship # PR + 批准时自动合并
# 后台模式
zeroshot run 123 -d
zeroshot run 123 --ship -d
# 控制
zeroshot list
zeroshot status <id>
zeroshot logs <id> -f
zeroshot resume <id>
zeroshot stop <id>
zeroshot kill <id>
zeroshot watch
# 提供商
zeroshot 提供商
zeroshot 提供商 设置默认 codex
# 代理库
zeroshot 代理 列表
zeroshot 代理 显示 <名称>
# 维护
zeroshot 清理
zeroshot 清除
多平台问题支持
Zeroshot 支持 GitHub、GitLab、Jira 和 Azure DevOps。只需粘贴问题的 URL 或编号即可。 在 Git 仓库中工作时,zeroshot 会自动从你的 Git 远程 URL 中检测问题提供商,无需任何配置!
# GitHub
zeroshot 运行 123
zeroshot 运行 https://github.com/org/repo/issues/123
# GitLab(云和自托管)
zeroshot 运行 https://gitlab.com/org/repo/-/issues/456
zeroshot 运行 https://gitlab.mycompany.com/org/repo/-/issues/789
# Jira
zeroshot 运行 PROJ-789
zeroshot 运行 https://company.atlassian.net/browse/PROJ-789
# Azure DevOps
zeroshot 运行 https://dev.azure.com/org/project/_workitems/edit/999
要求:根据你使用的平台,需要相应的 CLI 工具(gh、glab、jira 或 az)。有关设置及自托管实例,请参阅 issue-providers README。
--pr 模式注意事项:请从目标仓库目录运行 zeroshot。拉取请求将在你当前目录的 Git 远程仓库上创建。如果你从其他仓库运行,zeroshot 会发出警告并跳过“Closes #X”引用(拉取请求仍会被创建,但不会自动关闭问题)。
架构
Zeroshot 是一个基于消息驱动的协调层,具有智能默认配置。
- 调度器会根据任务的复杂性和类型对任务进行分类。
- 工作流模板会选择代理和验证者。
- 代理会将结果发布到 SQLite 账本中。
- 验证者会根据具体发现批准或拒绝。
- 被拒绝的任务会返回给执行者进行修复。
┌─────────────────┐
│ 任务 │
└────────┬────────┘
│
▼
┌────────────────────────────────────────────┐
│ 调度器 │
│ 复杂度 × 任务类型 → 工作流 │
└────────────────────────┬───────────────────┘
│
┌─────────────────────────────┼─────────────────────────────┐
│ │ │
▼ ▼ ▼
┌───────────┐ ┌───────────┐ ┌───────────┐
│ 简单任务 │ │ 简单任务 │ │ 标准及以上任务 │
│ 1 个代理 │──────────▶ │ 执行者 │ │ 计划者 │
│ (初级) │ 完成 │ + 1 个验证者│ │ + 执行者 │
│ 无验证者 │ └─────┬─────┘ │ + 3-5 个验证者│
└───────────┘ │ └─────┬─────┘
▼ │
┌─────────────┐ ▼
┌──▶│ 执行者 │ ┌─────────────┐
│ └──────┬──────┘ │ 计划者 │
│ │ └──────┬──────┘
│ ▼ │
│ ┌─────────────────────┐ ▼
│ │ ✓ 验证者 │ ┌─────────────┐
│ │ (通用检查) │ ┌──▶│ 执行者 │
│ └──────────┬──────────┘ │ └──────┬──────┘
│ 拒绝 │ 全部通过 │ │
└──────────────┘ │ │ ▼
│ │ ┌──────────────────────┐
│ │ │ ✓ 要求 │
│ │ │ ✓ 代码(标准及以上) │
│ │ │ ✓ 安全性(关键) │
│ │ │ ✓ 测试员(关键) │
│ │ │ ✓ 对抗测试 │
│ │ │ (实际执行) │
│ │ │ (实际执行) │
│ │ └──────────┬───────────┘
│ │ 拒绝 │ 全部通过
│ └──────────────┘ │
▼ ▼
┌─────────────────────────────────────────────────────────────────────────────┐
│ 完成 │
└─────────────────────────────────────────────────────────────────────────────┘
复杂度模型
| 任务 | 复杂度 | 代理数量 | 验证者 |
|---|---|---|---|
| 修复 README 中的错别字 | 简单 | 1 | 无 |
| 添加暗黑模式切换按钮 | 简单 | 2 | 通用验证者 |
| 重构认证系统 | 标准 | 4 | 需求验证、代码验证 |
| 实现支付流程 | 关键 | 7 | 需求验证、代码验证、安全性验证、测试员验证、对抗测试 |
按复杂度选择模型
| 复杂度 | 计划者 | 工作者 | 验证者 |
|---|---|---|---|
| 极简 | - | level1 | - |
| 简单 | - | level2 | 1 (level2) |
| 标准 | level2 | level2 | 2 (level2) |
| 关键 | level3 | level2 | 5 (level2) |
等级对应于特定提供商的模型。可通过 zeroshot providers setup <provider> 或 settings.providerSettings 进行配置。(旧版 maxModel 仅适用于 Claude。)
自定义工作流(框架模式)
Zeroshot 是基于消息驱动的,因此您可以定义任意代理拓扑结构。
- 专家小组:并行的专家 -> 聚合器 -> 决策
- 分阶段审核:顺序验证者,每个都有否决权
- 层次化:主管动态生成工作者
- 动态调整:指挥官在执行过程中添加代理
协调原语:
- 消息总线(发布/订阅主题)
- 触发器(条件触发唤醒代理)
- 账本(SQLite,崩溃恢复)
- 动态生成(CLUSTER_OPERATIONS)
使用提供商 CLI 创建自定义集群
启动您的提供商 CLI 并描述您的集群:
为安全关键功能创建一个 zeroshot 集群配置:
1. 实现代理(level2)负责实现该功能
2. 四个并行验证者:
- 安全验证者:OWASP 检查、SQL 注入、XSS、CSRF
- 性能验证者:避免 N+1 查询、正确索引
- 隐私验证者:GDPR 合规、数据最小化
- 代码审查员:整体代码质量
3. 所有验证者必须批准后才能合并
4. 如果任何验证者拒绝,实现代理需修复并重新提交
5. 安全验证者使用 level3(风险最高)
请参考 cluster-templates/base-templates/full-workflow.json,并创建类似的集群,保存为 cluster-templates/security-review.json
内置验证会检查缺失的触发器、死锁以及无效的类型连接,在运行前确保无误。
有关集群模式和示例,请参阅 CLAUDE.md。
崩溃恢复
所有状态都持久化在 SQLite 账本中。您可以在任何时候恢复:
zeroshot resume cluster-bold-panther
隔离模式
Git 工作树(默认用于 --pr/--ship)
zeroshot run 123 --worktree
使用 git 工作树进行轻量级隔离。它会创建一个独立的工作目录和分支。当使用 --pr 和 --ship 时会自动启用。
Docker 容器
zeroshot run 123 --docker
在一个全新的容器中实现完全隔离。您的工作区将保持不变。适合进行高风险实验或并行运行。
何时使用哪种模式
| 场景 | 推荐方式 |
|---|---|
| 快速任务,自行审查更改 | 无隔离(默认) |
| PR 流程,代码审查 | --worktree 或 --pr |
| 高风险实验,可能破坏环境 | --docker |
| 并行运行多个任务 | --docker |
| 完全自动,无需审查 | --ship |
默认行为: 代理仅修改文件,不会提交或推送,除非使用明确允许此操作的隔离模式。
Docker 凭证挂载
使用 --docker 时,zeroshot 会挂载凭证目录,以便代理可以访问提供商 CLI 和 AWS、Azure、kubectl 等工具。
默认挂载: gh, git, ssh(GitHub CLI、git 配置、SSH 密钥)
可用预设: gh, git, ssh, aws, azure, kube, terraform, gcloud, claude, codex, gemini
# 通过设置配置(持久化)
zeroshot settings set dockerMounts '["gh", "git", "ssh", "aws", "azure"]'
# 查看当前配置
zeroshot settings get dockerMounts
# 每次运行覆盖
zeroshot run 123 --docker --mount ~/.aws:/root/.aws:ro
# 提供商凭证
zeroshot run 123 --docker --mount ~/.config/codex:/home/node/.config/codex:ro
zeroshot run 123 --docker --mount ~/.config/gemini:/home/node/.config/gemini:ro
# 禁用所有挂载
zeroshot run 123 --docker --no-mounts
# CI:环境变量覆盖
ZEROSHOT_DOCKER_MOUNTS='["aws","azure"]' zeroshot run 123 --docker
有关提供商 CLI 设置和挂载详情,请参阅 docs/providers.md。
自定义挂载(混合预设与显式路径):
zeroshot settings set dockerMounts '[
"gh",
"git",
{"host": "~/.myconfig", "container": "$HOME/.myconfig", "readonly": true}
]'
容器主目录:预设使用 $HOME 占位符。默认:/root。可通过以下方式覆盖:
zeroshot settings set dockerContainerHome '/home/node'
# 或每次运行:
zeroshot run 123 --docker --container-home /home/node
环境变量传递:预设会自动传递相关环境变量(例如,aws -> AWS_REGION、AWS_PROFILE)。可添加自定义:
zeroshot settings set dockerEnvPassthrough '["MY_API_KEY", "TF_VAR_*"]'
资源
- CLAUDE.md - 架构、集群配置模式、代理原语
docs/providers.md- 提供商设置、模型等级和 Docker 挂载docs/context-management.md- 上下文选择、上下文包和状态快照- Discord - 支持与社区
zeroshot export <id>- 将对话导出为 Markdownsqlite3 ~/.zeroshot/*.db- 直接访问账本以进行调试
故障排除
| 问题 | 解决方法 |
|---|---|
claude: command not found |
npm i -g @anthropic-ai/claude-code && claude auth login |
codex: command not found |
npm i -g @openai/codex && codex login |
gemini: command not found |
npm i -g @google/gemini-cli && gemini auth login |
gh: command not found |
安装 GitHub CLI |
--docker 失败 |
Docker 必须正在运行:使用 docker ps 验证 |
| 集群卡住 | 使用 zeroshot resume <id> 继续 |
| 代理持续失败 | 检查 zeroshot logs <id> 以查看实际错误 |
zeroshot: command not found |
npm install -g @covibes/zeroshot |
| 代理行为异常 | 在 Claude Code 中使用 /analyze-cluster-postmortem <id>(如果修复方案具有通用性则会创建问题) |
贡献
请参阅 CONTRIBUTING.md,了解开发环境搭建及贡献指南。
请在参与之前阅读 CODE_OF_CONDUCT.md。
如遇安全相关问题,请参阅 SECURITY.md。
TUI
Ratatui(Rust 实现)是目前唯一支持的 TUI。入口点如下:
zeroshot(TTY 环境,无需参数)zeroshot tuizeroshot watch
TUI 开发
Rust 版本的 TUI 会通过标准输入输出启动一个 Node 后端。迭代时请同时运行这两部分。
单命令开发循环(自动构建并重启):
cargo install cargo-watch
npm run dev:tui
安装依赖
npm ci以监听模式构建 TUI 后端
npm run build:tui-backend -- --watch # 或者 npx tsc -p tsconfig.tui-backend.json -w运行 Rust 版本的 TUI(在另一个终端中)
cd tui-rs cargo run -p zeroshot-tui -- --ui disruptive
从本仓库本地运行 CLI
若希望全局使用开发分支中的 zeroshot 命令:
npm run dev:link
一条命令即可完成链接并启动 TUI 开发循环:
npm run dev:bootstrap
CLI 集成流程
使用 Node CLI 启动本地的 Rust 二进制文件:
cd tui-rs
cargo build -p zeroshot-tui
cd ..
ZEROSHOT_TUI_BINARY_PATH="$PWD/tui-rs/target/debug/zeroshot-tui" node cli/index.js tui
TUI 自定义配置
ZEROSHOT_TUI_BACKEND_PATH可指向特定的lib/tui-backend/server.jsZEROSHOT_TUI_BINARY_PATH可指向本地的 Rust 二进制文件ZEROSHOT_TUI_UI=classic|disruptive可强制指定 UI 风格
MIT 许可证 - Covibes
基于 Anthropic 的 Claude Code 构建。
版本历史
v5.5.02026/02/19v5.4.02026/01/18v5.3.02026/01/12v5.2.12026/01/07v5.2.02026/01/07v5.1.02026/01/07v5.0.02026/01/07v4.2.02026/01/06v4.1.42026/01/06v4.1.32026/01/06v4.1.22026/01/05v4.1.12026/01/05v4.1.02026/01/05v4.0.02026/01/04v3.1.02026/01/03v3.0.02025/12/29v2.1.02025/12/29v2.0.02025/12/29v1.5.02025/12/28v1.4.02025/12/28常见问题
相似工具推荐
openclaw
OpenClaw 是一款专为个人打造的本地化 AI 助手,旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚,能够直接接入你日常使用的各类通讯渠道,包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息,OpenClaw 都能即时响应,甚至支持在 macOS、iOS 和 Android 设备上进行语音交互,并提供实时的画布渲染功能供你操控。 这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地,用户无需依赖云端服务即可享受快速、私密的智能辅助,真正实现了“你的数据,你做主”。其独特的技术亮点在于强大的网关架构,将控制平面与核心助手分离,确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者,以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力(支持 macOS、Linux 及 Windows WSL2),即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你
stable-diffusion-webui
stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。
everything-claude-code
everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上
ComfyUI
ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。
LLMs-from-scratch
LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目,旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型(LLM)。它不仅是同名技术著作的官方代码库,更提供了一套完整的实践方案,涵盖模型开发、预训练及微调的全过程。 该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型,却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码,用户能够透彻掌握 Transformer 架构、注意力机制等关键原理,从而真正理解大模型是如何“思考”的。此外,项目还包含了加载大型预训练权重进行微调的代码,帮助用户将理论知识延伸至实际应用。 LLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API,而是渴望探究模型构建细节的技术人员而言,这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计:将复杂的系统工程拆解为清晰的步骤,配合详细的图表与示例,让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础,还是为未来研发更大规模的模型做准备
Deep-Live-Cam
Deep-Live-Cam 是一款专注于实时换脸与视频生成的开源工具,用户仅需一张静态照片,即可通过“一键操作”实现摄像头画面的即时变脸或制作深度伪造视频。它有效解决了传统换脸技术流程繁琐、对硬件配置要求极高以及难以实时预览的痛点,让高质量的数字内容创作变得触手可及。 这款工具不仅适合开发者和技术研究人员探索算法边界,更因其极简的操作逻辑(仅需三步:选脸、选摄像头、启动),广泛适用于普通用户、内容创作者、设计师及直播主播。无论是为了动画角色定制、服装展示模特替换,还是制作趣味短视频和直播互动,Deep-Live-Cam 都能提供流畅的支持。 其核心技术亮点在于强大的实时处理能力,支持口型遮罩(Mouth Mask)以保留使用者原始的嘴部动作,确保表情自然精准;同时具备“人脸映射”功能,可同时对画面中的多个主体应用不同面孔。此外,项目内置了严格的内容安全过滤机制,自动拦截涉及裸露、暴力等不当素材,并倡导用户在获得授权及明确标注的前提下合规使用,体现了技术发展与伦理责任的平衡。