adversarial-spec

519 43 简单 2 次阅读今天MIT语言模型插件Agent开发框架

AI 解读由 AI 自动生成，仅供参考

adversarial-spec通过多模型协作的方式优化产品需求文档。当用户输入产品概念后，工具会调用多个大模型并行进行辩论式审核，不断修正文档中的漏洞和假设偏差，最终生成经过严格验证的版本。这种机制能有效避免单一模型的盲区，发现潜在的边缘场景，特别适合需要高可靠性的技术文档场景。开发者和产品经理可借此提升需求文档的严谨性，研究人员能验证方案的全面性，而普通用户则能获得更清晰的产品说明。工具支持接入多种大模型服务，通过持续迭代的对抗性审查，确保输出结果经得起多角度推敲。

使用场景

某中型软件公司需开发实时协作的在线文档编辑工具，产品经理需撰写PRD。团队曾依赖单一AI生成需求文档，但多次因遗漏关键细节导致开发返工。

没有 adversarial-spec 时

单一模型生成的文档常忽略安全机制，如未考虑用户权限动态调整场景
团队成员对需求理解存在偏差，如实时同步的延迟容忍度定义模糊
未覆盖边缘情况，例如网络中断时的文档状态保存策略缺失
文档迭代依赖人工多轮沟通，需求变更跟踪效率低下

使用 adversarial-spec 后

多模型辩论暴露安全盲点，如未提及的跨站脚本攻击防护方案
不同模型对需求的补充使协作逻辑更完备，明确分段加载与冲突解决优先级
边缘案例被系统性挖掘，如断网后自动切换本地缓存的恢复流程
自动化迭代减少人工协调，需求文档版本更新效率提升60%

通过多模型对抗性评审，adversarial-spec将产品需求文档的完整性与可执行性提升至行业领先水平。

运行环境要求

操作系统

Linux
macOS

GPU

未说明

内存

未说明

依赖

notes需要配置至少一个大模型API密钥，部分模型可能需要额外下载

python3.10+

litellm

快速开始

对抗性规格说明书

一个 Claude 代码插件，通过多模型辩论迭代优化产品规格说明书，直到达成共识。

核心洞察： 单一的 LLM 审查规格说明书时会遗漏一些内容。而多个 LLM 对规格说明书进行辩论，则能够发现漏洞、挑战假设，并揭示任何单一模型都可能忽视的边缘情况。最终生成的文档经过了严格的对抗性审查。

Claude 是积极参与者，而不仅仅是协调者。Claude 会提供独立的批评意见，挑战对手模型，并与外部模型一起提出实质性的改进建议。

快速入门

# 1. 添加市场并安装插件
claude plugin marketplace add zscole/adversarial-spec
claude plugin install adversarial-spec

# 2. 设置至少一个 API 密钥
export OPENAI_API_KEY="sk-..."
# 或使用 OpenRouter，只需一个密钥即可访问多家供应商
export OPENROUTER_API_KEY="sk-or-..."

# 3. 运行它
/adversarial-spec "构建一个基于 Redis 后端的限流服务"

工作原理

您描述产品 --> Claude 起草规格说明书 --> 多个 LLM 并行评审
        |                                              |
        |                                              v
        |                              Claude 综合各方意见并加入自己的评论
        |                                              |
        |                                              v
        |                              修改并重复，直到所有模型一致同意
        |                                              |
        +--------------------------------------------->|
                                                       v
                                            用户审阅期
                                                       |
                                                       v
                                            最终文档输出

描述您的产品概念或提供现有文档。
（可选）从深入访谈开始，以捕捉需求。
Claude 起草初始文档（PRD 或技术规格说明书）。
文档被发送给对手模型（GPT、Gemini、Grok 等）进行并行评审。
Claude 在对手反馈的基础上提供独立的评论。
Claude 综合所有反馈并进行修订。
循环持续，直到所有模型和 Claude 都达成一致。
用户审阅期：请求修改或再运行几轮。
最终收敛的文档会被输出。

系统要求

Python 3.10+
litellm 包：pip install litellm
至少一家 LLM 提供商的 API 密钥。

支持的模型

供应商	环境变量	示例模型
OpenAI	`OPENAI_API_KEY`	`gpt-4o`, `gpt-4-turbo`, `o1`
Anthropic	`ANTHROPIC_API_KEY`	`claude-sonnet-4-20250514`, `claude-opus-4-20250514`
Google	`GEMINI_API_KEY`	`gemini/gemini-2.0-flash`, `gemini/gemini-pro`
xAI	`XAI_API_KEY`	`xai/grok-3`, `xai/grok-beta`
Mistral	`MISTRAL_API_KEY`	`mistral/mistral-large`, `mistral/codestral`
Groq	`GROQ_API_KEY`	`groq/llama-3.3-70b-versatile`
OpenRouter	`OPENROUTER_API_KEY`	`openrouter/openai/gpt-4o`, `openrouter/anthropic/claude-3.5-sonnet`
Codex CLI	ChatGPT 订阅	`codex/gpt-5.2-codex`, `codex/gpt-5.1-codex-max`
Gemini CLI	Google 账户	`gemini-cli/gemini-3-pro-preview`, `gemini-cli/gemini-3-flash-preview`
Deepseek	`DEEPSEEK_API_KEY`	`deepseek/deepseek-chat`
Zhipu	`ZHIPUAI_API_KEY`	`zhipu/glm-4`, `zhipu/glm-4-plus`

检查已配置的密钥：

python3 "$(find ~/.claude -name debate.py -path '*adversarial-spec*' 2>/dev/null | head -1)" providers

AWS Bedrock 支持

对于需要将所有模型调用路由到 AWS Bedrock 的企业用户（例如出于安全合规或推理网关的要求）：

# 启用 Bedrock 模式
python3 "$(find ~/.claude -name debate.py -path '*adversarial-spec*' 2>/dev/null | head -1)" bedrock enable --region us-east-1

# 添加您在 Bedrock 账户中启用的模型
python3 "$(find ~/.claude -name debate.py -path '*adversarial-spec*' 2>/dev/null | head -1)" bedrock add-model claude-3-sonnet
python3 "$(find ~/.claude -name debate.py -path '*adversarial-spec*' 2>/dev/null | head -1)" bedrock add-model claude-3-haiku

# 检查配置
python3 "$(find ~/.claude -name debate.py -path '*adversarial-spec*' 2>/dev/null | head -1)" bedrock status

# 禁用 Bedrock 模式
python3 "$(find ~/.claude -name debate.py -path '*adversarial-spec*' 2>/dev/null | head -1)" bedrock disable

当 Bedrock 启用时，所有模型调用都会通过 Bedrock 路由——不会直接进行 API 调用。您可以使用友好的名称，如 claude-3-sonnet，这些名称会自动映射到 Bedrock 的模型 ID。

配置存储在 ~/.claude/adversarial-spec/config.json 中。

OpenRouter 支持

OpenRouter 提供了一个统一的 API，可以访问多家 LLM 提供商的服务。这对于以下情况非常有用：

使用一个 API 密钥即可访问多家提供商的模型。
比较不同提供商的模型。
自动回退和负载均衡。
在不同提供商之间优化成本。

设置：

# 从 https://openrouter.ai/keys 获取您的 API 密钥
export OPENROUTER_API_KEY="sk-or-..."

# 使用 OpenRouter 模型（前缀为 openrouter/）
python3 debate.py critique --models openrouter/openai/gpt-4o,openrouter/anthropic/claude-3.5-sonnet < spec.md

流行的 OpenRouter 模型：

openrouter/openai/gpt-4o —— 通过 OpenRouter 使用 GPT-4o。
openrouter/anthropic/claude-3.5-sonnet —— Claude 3.5 Sonnet。
openrouter/google/gemini-2.0-flash —— Gemini 2.0 Flash。
openrouter/meta-llama/llama-3.3-70b-instruct —— Llama 3.3 70B。
openrouter/qwen/qwen-2.5-72b-instruct —— Qwen 2.5 72B。

完整的模型列表请参见 openrouter.ai/models。

Codex CLI 支持

Codex CLI 允许 ChatGPT Pro 订阅者无需单独的 API 积分即可使用 OpenAI 的模型。前缀为 codex/ 的模型会通过 Codex CLI 路由。

设置：

# 安装 Codex CLI（需要 ChatGPT Pro 订阅）
npm install -g @openai/codex

# 使用 Codex 模型（前缀为 codex/）
python3 debate.py critique --models codex/gpt-5.2-codex,gemini/gemini-2.0-flash < spec.md

推理时间控制：

通过 --codex-reasoning 参数来控制模型使用的思考时间：

python3 debate.py critique --models codex/gpt-5.2-codex,gemini/gemini-2.0-flash --codex-reasoning=high < spec.md

可用级别：低、中、高、超高（默认：超高）

python3 debate.py critique --models codex/gpt-5.2-codex --codex-reasoning high < spec.md


更高的推理力度会产生更全面的分析，但会消耗更多的 token。

**可用的 Codex 模型：**
- `codex/gpt-5.2-codex` - 通过 Codex CLI 的 GPT-5.2
- `codex/gpt-5.1-codex-max` - 通过 Codex CLI 的 GPT-5.1 Max

检查 Codex CLI 的安装状态：

```bash
python3 "$(find ~/.claude -name debate.py -path '*adversarial-spec*' 2>/dev/null | head -1)" providers

Gemini CLI 支持

Gemini CLI 允许 Google 账户持有人在无需单独 API 额度的情况下使用 Gemini 模型。前缀为 gemini-cli/ 的模型将通过 Gemini CLI 路由。

设置：

# 安装 Gemini CLI
npm install -g @google/gemini-cli && gemini auth

# 使用 Gemini CLI 模型（需加 gemini-cli/ 前缀）
python3 debate.py critique --models gemini-cli/gemini-3-pro-preview < spec.md

可用的 Gemini CLI 模型：

gemini-cli/gemini-3-pro-preview - 通过 CLI 的 Gemini 3 Pro
gemini-cli/gemini-3-flash-preview - 通过 CLI 的 Gemini 3 Flash

检查 Gemini CLI 的安装状态：

python3 "$(find ~/.claude -name debate.py -path '*adversarial-spec*' 2>/dev/null | head -1)" providers

OpenAI 兼容端点

对于暴露 OpenAI 兼容 API 的模型（本地 LLM、自托管模型、替代提供商），请设置 OPENAI_API_BASE：

# 指向自定义端点
export OPENAI_API_KEY="your-key"
export OPENAI_API_BASE="https://your-endpoint.com/v1"

# 与任何模型名称一起使用
python3 debate.py critique --models gpt-4o < spec.md

这适用于：

本地 LLM 服务器（Ollama、vLLM、text-generation-webui）
OpenAI 兼容提供商
自托管推理端点

使用方法

从头开始：

/adversarial-spec "构建一个基于 Redis 后端的限流服务"

完善现有文档：

/adversarial-spec ./docs/my-spec.md

系统将提示您提供以下信息：

文档类型：PRD（面向业务/产品）或技术规格书（面向工程）
访谈模式：可选的深入需求收集环节
对手模型：逗号分隔的列表（例如：gpt-4o,gemini/gemini-2.0-flash,xai/grok-3）

模型越多，视角越丰富，收敛标准也越严格。

文档类型

PRD（产品需求文档）

适用于利益相关者、产品经理和设计师。

章节： 执行摘要、问题陈述、目标用户/角色、用户故事、功能需求、非功能需求、成功指标、范围（包含/排除）、依赖关系、风险

批评重点： 清晰的问题定义、明确的角色定位、可衡量的成功标准、清晰的范围界定、不包含技术实现细节

技术规格书

适用于开发人员和架构师。

章节： 概述、目标/非目标、系统架构、组件设计、API 设计（完整模式）、数据模型、基础设施、安全、错误处理、性能/SLA、可观性、测试策略、部署策略

批评重点： 完整的 API 合同、数据模型覆盖、安全威胁缓解、错误处理机制、具体性能目标、避免对工程师造成歧义

核心功能

访谈模式

在辩论开始前，可以选择进入深度访谈环节，以提前捕捉需求。

内容： 问题背景、用户/利益相关者、功能需求、技术限制、UI/UX、权衡取舍、风险、成功标准

访谈会通过深入追问来挑战假设。完成后，Claude 会将回答综合成一份完整的规格书，再开始对抗式辩论。

Claude 的积极参与

每一轮，Claude 都会：

检查对手的批评是否有效
提供独立的批评（对手遗漏了什么？）
表明对特定观点的同意或不同意
将所有反馈综合为修订内容

显示格式如下：

--- 第 N 轮 ---
对手模型：
- [GPT-4o]：批评——缺少限流配置
- [Gemini]：同意

Claude 的批评：
安全部分缺乏输入验证策略。建议加入 OWASP 十大漏洞防护。

综合意见：
- 接受来自 GPT-4o 的建议：限流配置
- Claude 添加：输入验证、OWASP 防护
- 拒绝：无

早期一致性验证

如果某个模型在前两轮内就表示同意，Claude 会持怀疑态度。该模型会被要求：

确认已阅读全文
列出具体审查过的章节
解释为何同意
指出仍存在的顾虑

这样可以防止那些未经仔细审查就盲目认可的模型产生虚假的一致性。

用户审核期

当所有模型达成一致后，您将进入审核期，有三种选择：

按原样接受：文档已完成
请求修改：Claude 更新规格书，您无需进行完整辩论周期即可迭代
再运行一轮：将更新后的规格书再次送入对抗式辩论

多轮审核

您可以采用不同策略运行多轮辩论：

第一轮使用快速模型（gpt-4o），第二轮使用更强的模型（o1）
第一轮关注结构完整性，第二轮聚焦安全性
在用户提出修改后，获取新的视角

PRD 到技术规格书的流程

当 PRD 达到共识时，您将被提供直接基于 PRD 继续撰写技术规格书的选项。这样可以在一次会话中完成一整套文档。

进阶功能

批评焦点模式

引导模型优先关注特定问题：

--focus security      # 认证、输入验证、加密、漏洞
--focus scalability   # 水平扩展、分片、缓存、容量
--focus performance   # 延迟目标、吞吐量、查询优化
--focus ux            # 用户旅程、错误状态、无障碍访问
--focus reliability   # 故障模式、断路器、灾难恢复
--focus cost          # 基础设施成本、资源效率

模型角色

让模型从特定职业角度进行批评：

--persona security-engineer      # 以攻击者的思维思考
--persona oncall-engineer        # 关注凌晨三点的调试
--persona junior-developer       # 指出模糊性和经验性知识
--persona qa-engineer            # 测试场景缺失
--persona site-reliability       # 部署、监控、突发事件
--persona product-manager        # 用户价值、成功指标
--persona data-engineer          # 数据模型、ETL 影响
--persona mobile-developer       # 针对移动端的 API 设计
--persona accessibility-specialist  # WCAG、屏幕阅读器
--persona legal-compliance       # GDPR、CCPA、监管要求

自定义角色同样适用：--persona "金融科技合规官"

上下文注入

包含现有文档供模型参考：

--context ./existing-api.md --context ./schema.sql

使用场景：

新规范必须集成的现有 API 文档
规范必须兼容的数据库模式
用于保持一致性的设计文档或先前规范
合规性要求文档

会话持久化与恢复

长时间的讨论可能会崩溃或需要暂停。会话会自动保存状态：

# 启动一个命名会话
echo "spec" | python3 debate.py critique --models gpt-4o --session my-feature-spec

# 从上次中断处恢复
python3 debate.py critique --resume my-feature-spec

# 列出所有会话
python3 debate.py sessions

会话保存的内容包括：

当前规范的状态
轮次编号
所有配置（模型、焦点、角色等）
历史轮次的记录

会话存储在 ~/.config/adversarial-spec/sessions/ 目录中。

自动检查点

使用会话时，每一轮的规范都会保存到 .adversarial-spec-checkpoints/ 目录中：

.adversarial-spec-checkpoints/
├── my-feature-spec-round-1.md
├── my-feature-spec-round-2.md
└── my-feature-spec-round-3.md

如果某次修订使情况变得更糟，可以使用这些检查点进行回滚。

保留意图模式

当模型将“不寻常”解释为“错误”时，收敛可能会抹去新颖的想法。--preserve-intent 标志会使移除操作变得代价高昂：

--preserve-intent

启用后，模型必须：

精确引用他们想要移除或大幅更改的内容
说明其危害——不仅仅是“不必要的”，还要指出它会造成哪些具体问题
区分错误与偏好——只移除那些事实错误、自相矛盾或存在风险的内容
在移除之前询问那些不寻常但功能正常的选项：“这是有意为之吗？”

这会将默认行为从“抹去任何不寻常之处”转变为“增加保护性细节，同时保留独特的选择”。

适用场景：

您的规范包含有意为之的非常规选择
您希望模型挑战您的想法，而不是将其同质化
前几轮移除了您原本想保留的内容

成本跟踪

每一轮评论都会显示令牌使用量和预估成本：

=== 成本摘要 ===
总令牌数：输入 12,543 / 输出 3,221
总成本：$0.0847

按模型：
  gpt-4o：$0.0523（输入 8,234 / 输出 2,100）
  gemini/gemini-2.0-flash：$0.0324（输入 4,309 / 输出 1,121）

保存的配置文件

保存常用配置：

# 创建一个配置文件
python3 debate.py save-profile strict-security \
  --models gpt-4o,gemini/gemini-2.0-flash \
  --focus security \
  --doc-type tech

# 使用配置文件
python3 debate.py critique --profile strict-security < spec.md

# 列出配置文件
python3 debate.py profiles

配置文件存储在 ~/.config/adversarial-spec/profiles/ 目录中。

轮次之间的差异比较

查看规范版本之间的确切变化：

python3 debate.py diff --previous round1.md --current round2.md

导出为任务列表

从最终确定的规范中提取可执行的任务：

cat spec-output.md | python3 debate.py export-tasks --models gpt-4o --doc-type prd

输出内容包括标题、类型、优先级、描述以及验收标准。

使用 --json 可以获得适合导入问题跟踪系统的结构化输出。

Telegram 集成（可选）

在手机上接收通知，并在讨论过程中注入反馈。

设置步骤：

在 Telegram 中联系 @BotFather，发送 /newbot 并按照提示操作
复制机器人令牌
运行：python3 "$(find ~/.claude -name telegram_bot.py -path '*adversarial-spec*' 2>/dev/null | head -1)" setup
向您的机器人发送消息，再次运行设置流程以获取聊天 ID
设置环境变量：

export TELEGRAM_BOT_TOKEN="..."
export TELEGRAM_CHAT_ID="..."

功能：

轮次完成后异步通知（包含成本信息）
60 秒内回复反馈的时间窗口（反馈将被纳入下一轮）
讨论结束后将最终文档发送至 Telegram

输出

最终文档具备以下特点：

完整，遵循相应文档类型的完整结构
经所有模型审核直至达成一致意见
可直接交付给相关方，无需进一步编辑

输出位置：

打印到终端
写入 spec-output.md（PRD）或 tech-spec-output.md（技术规范）
发送至 Telegram（如已启用）

辩论总结包括已完成的轮次、运行的周期、参与的模型、Claude 的贡献、成本以及所做的关键改进。

CLI 参考

# 核心命令
debate.py critique --models MODEL_LIST --doc-type TYPE [OPTIONS] < spec.md
debate.py critique --resume SESSION_ID
debate.py diff --previous OLD.md --current NEW.md
debate.py export-tasks --models MODEL --doc-type TYPE [--json] < spec.md

# 信息命令
debate.py providers      # 列出提供商及 API 密钥状态
debate.py focus-areas    # 列出重点领域
debate.py personas       # 列出角色
debate.py profiles       # 列出已保存的配置文件
debate.py sessions       # 列出已保存的会话

# 配置文件管理
debate.py save-profile NAME --models ... [--focus ...] [--persona ...]

# Bedrock 管理
debate.py bedrock status                      # 显示 Bedrock 配置
debate.py bedrock enable --region REGION      # 启用 Bedrock 模式
debate.py bedrock disable                     # 关闭 Bedrock 模式
debate.py bedrock add-model MODEL             # 将模型添加到可用列表
debate.py bedrock remove-model MODEL          # 从列表中移除模型
debate.py bedrock list-models                 # 列出内置模型映射

选项：

--models, -m - 逗号分隔的模型列表（若未指定，则会根据可用的 API 密钥自动检测）
--doc-type, -d - prd 或 tech
--codex-reasoning - Codex 模型的推理力度（low、medium、high、xhigh；默认：xhigh）
--focus, -f - 重点领域（security、scalability、performance、ux、reliability、cost）
--persona - 专业角色
--context, -c - 上下文文件（可重复使用）
--profile - 加载已保存的配置文件
--preserve-intent - 要求对移除操作提供理由
--session, -s - 会话 ID，用于持久化和检查点
--resume - 恢复之前的会话
--press, -p - 防止拖延检查
--telegram, -t - 启用 Telegram
--json, -j - JSON 输出

文件结构

adversarial-spec/
├── .claude-plugin/
│   └── plugin.json           # 插件元数据
├── README.md
├── LICENSE
└── skills/
    └── adversarial-spec/
        ├── SKILL.md          # 技能定义和流程
        └── scripts/
            ├── debate.py     # 多模型辩论编排
            └── telegram_bot.py   # Telegram 通知

许可证

MIT

adversarial-spec 快速上手指南

环境准备

系统要求

Python 3.10+
支持类 Unix 系统（Linux/macOS）

前置依赖

安装 Python 3.10+（建议使用 pyenv 管理版本）

安装 litellm 包（支持多模型调用）

pip install litellm

推荐使用国内镜像加速

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple litellm

API 密钥准备
需配置至少一个 LLM 提供商的 API 密钥（如 OpenAI、OpenRouter 等）

export OPENAI_API_KEY="sk-..."
# 或使用 OpenRouter 统一接入
export OPENROUTER_API_KEY="sk-or-..."

安装步骤

添加插件市场源

claude plugin marketplace add zscole/adversarial-spec

安装 adversarial-spec 插件
```
claude plugin install adversarial-spec
```

验证安装（可选）

python3 "$(find ~/.claude -name debate.py -path '*adversarial-spec*' 2>/dev/null | head -1)" providers

基本使用

场景 1：从零构建需求文档

/adversarial-spec "Build a rate limiter service with Redis backend"

场景 2：迭代优化现有文档

/adversarial-spec ./docs/my-spec.md

运行后需回答

文档类型：PRD（产品需求文档）或 tech spec（技术规格书）
是否启用深度访谈（可选）
指定对抗模型列表（如 gpt-4o,gemini/gemini-2.0-flash）

输出结果
经过多模型辩论收敛后的最终文档，支持后续迭代优化。

常见问题

SKILL.md 中的脚本路径与市场安装位置不匹配如何解决？

如何添加 OpenRouter API 支持？

使用 OpenAI O 系列模型时温度参数报错如何解决？

如何解决 Codex CLI 的 git 仓库检查问题？

Opencode 支持是否可行？

Pydantic 序列化警告如何处理？

相似工具推荐

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|今天

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 139k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 107.7k|★★☆☆☆|2天前

开发框架图像Agent

NextChat

NextChat 是一款轻量且极速的 AI 助手，旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性，以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发，NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言，它也提供了便捷的自托管方案，支持一键部署到 Vercel 或 Zeabur 等平台。 NextChat 的核心亮点在于其广泛的模型兼容性，原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型，让用户在一个界面即可自由切换不同 AI 能力。此外，它还率先支持 MCP（Model Context Protocol）协议，增强了上下文处理能力。针对企业用户，NextChat 提供专业版解决方案，具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能，满足公司对数据隐私和个性化管理的高标准要求。

★ 87.6k|★★☆☆☆|今天

开发框架语言模型

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。

★ 85k|★★☆☆☆|今天

图像数据工具视频

ragflow

RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。

★ 77.1k|★★★☆☆|昨天

Agent图像开发框架