DeepAnalyze

4k 656 较难 1 次阅读今天MIT图像语言模型数据工具其他Agent开发框架

AI 解读由 AI 自动生成，仅供参考

DeepAnalyze 是全球首款专为自主数据科学设计的智能体大模型，堪称您的专属 AI 数据分析师。它无需人工干预，即可独立完成从数据清洗、探索分析、建模预测到可视化展示及报告生成的全流程任务。

面对海量且格式各异的数据（如数据库、CSV、Excel、JSON 乃至非结构化文本），用户往往难以快速提取核心价值并产出专业结论。DeepAnalyze 正是为了解决这一痛点而生，它能像资深分析师一样对多源数据进行深度研究，并一键输出达到专业水准的分析报告，极大降低了数据科学的门槛与时间成本。

这款工具非常适合希望自动化处理数据任务的研究人员、需要快速验证假设的数据科学家，以及想要部署私有化分析助手的开发者。其独特亮点在于完全开源：不仅公开了 8B 参数量的模型权重和核心代码，还分享了包含 50 万条指令的训练数据集。此外，最新更新的 WebUI 支持基于 Docker 的沙箱代码执行，确保了分析过程的安全性与可复现性，让用户能轻松构建属于自己的智能数据分析工作流。

使用场景

某电商公司的数据运营团队需要在每周一上午，基于上周分散在数据库、CSV 日志和 JSON 配置文件中的千万级用户行为数据，产出包含趋势洞察与归因分析的专业周报。

没有 DeepAnalyze 时

数据清洗耗时极长：分析师需手动编写大量 Python 脚本清洗多源异构数据，仅格式统一就要花费半天时间。
分析深度依赖个人经验：面对开放性问题（如“为何某类商品转化率骤降”），往往只能做表面统计，难以自动下钻挖掘根本原因。
报告生成重复劳动：图表绘制完成后，需人工将结论复制粘贴到 PPT 或文档中，排版和文字润色占用大量精力。
响应业务需求滞后：从接到需求到交付报告通常需要 1-2 天，无法支持管理层对突发数据异常的即时决策。

使用 DeepAnalyze 后

全自动流水线作业：DeepAnalyze 自主连接数据库并解析非结构化日志，一键完成从数据预处理到建模的全流程，无需人工干预。
智能深度归因研究：针对异常指标，DeepAnalyze 能像资深分析师一样自动设计验证实验，跨表关联分析并定位具体影响因素。
一键生成专家级报告：工具直接输出包含交互式可视化图表、专业文字解读及改进建议的完整分析报告，格式精美且逻辑严密。
分钟级即时响应：原本需要两天的工作现在仅需几分钟即可完成，让团队能随时应对临时的数据探查需求。

DeepAnalyze 将数据科学家从繁琐的重复劳动中解放出来，真正实现了从“人找数据”到“数据找人”的自主分析变革。

运行环境要求

操作系统

Linux
macOS
Windows

GPU

需要 NVIDIA GPU，推荐显存 16GB+（最低支持量化后运行），需安装 vLLM 依赖的 CUDA 环境

内存

未说明（取决于模型量化程度及上下文长度，建议系统内存充足以配合 GPU）

依赖

notes核心推理引擎依赖 vLLM，需通过 'vllm serve' 启动服务。根据显存大小（16GB/24GB/40GB/80GB）需选择不同量化版本（4-bit/8-bit/原始模型）并配置 max-model-len 和 FP8 KV Cache。前端演示依赖 Node.js (npm install)。支持 Docker 沙箱代码执行环境。模型文件需从 Hugging Face 或 ModelScope 下载。

python3.8+

vllm

torch

transformers

numpy

pandas

fastapi

uvicorn

nodejs/npm (前端依赖)

快速开始

DeepAnalyze

DeepAnalyze：用于自主数据科学的代理型大型语言模型

访问量

作者: 张绍雷、范炬*、范美浩、李国亮、杜晓勇

中国人民大学、清华大学

DeepAnalyze 是首个用于自主数据科学的代理型大语言模型。它无需人工干预即可自主完成广泛的以数据为中心的任务，支持：

🛠 完整的数据科学流水线：自动执行数据准备、分析、建模、可视化和报告生成等各类数据科学任务。
🔍 开放式数据研究：对多样化的数据源进行深入研究，包括结构化数据（数据库、CSV、Excel）、半结构化数据（JSON、XML、YAML）以及非结构化数据（TXT、Markdown），最终生成分析师级别的研究报告。
📊 完全开源：DeepAnalyze 的模型（https://huggingface.co/RUC-DataLab/DeepAnalyze-8B）、**代码**（https://github.com/ruc-datalab/DeepAnalyze）、**训练数据**（https://huggingface.co/datasets/RUC-DataLab/DataScience-Instruct-500K）和**演示**（https://huggingface.co/RUC-DataLab/DeepAnalyze-8B）均已开源，允许您部署或扩展自己的数据分析助手。

deepanalyze

🔥 新闻

[2026年3月16日]：更新 DeepAnalyze WebUI v2，界面更加流畅，新增对 HeyWhale API 的支持，并支持基于 Docker 的沙箱式代码执行。更多详情请参阅 Readme。
[2026年1月31日]：🎉🎉🎉DeepAnalyze 作为官方代理，支持了 2026年（第19届）中国大学生计算机设计大赛大数据主题赛。
[2025年12月28日] 公告：DeepAnalyze API 密钥现已开放 🎉🎉🎉 您现在可以通过此 Google 表单或此飞书表单申请您的 API 密钥。有关完整详情及使用说明，请参阅指南或飞书 Wiki。
[2025年11月13日]：DeepAnalyze 现在支持 OpenAI 风格的 API 端点，并可通过命令行终端界面访问。感谢贡献者 @LIUyizheSDU。
[2025年11月8日]：DeepAnalyze 现在可以通过 JupyterUI 访问，基于 jupyter-mcp-server 构建。感谢贡献者 @ChengJiale150。
[2025年10月28日]：我们欢迎所有贡献，包括改进 DeepAnalyze 和分享用例（详见 CONTRIBUTION.md）。所有合并的 PR 都将被列为贡献者。
[2025年10月27日]：DeepAnalyze 引起了广泛关注，一周内获得了 1000+ GitHub 星标和 20万+ Twitter 浏览量。
[2025年10月21日]：DeepAnalyze 的论文（https://arxiv.org/abs/2510.16872）、**代码**（https://github.com/ruc-datalab/DeepAnalyze）、**模型**（https://huggingface.co/RUC-DataLab/DeepAnalyze-8B）、**训练数据**（https://huggingface.co/datasets/RUC-DataLab/DataScience-Instruct-500K）正式发布！

🖥 演示

WebUI

https://github.com/user-attachments/assets/04184975-7ee7-4ae0-8761-7a7550c5c8fe

上传数据，DeepAnalyze 即可进行面向数据的深度研究 🔍 以及任何以数据为中心的任务 🛠

克隆此仓库并下载 DeepAnalyze-8B。
使用 vllm 部署 DeepAnalyze-8B：vllm serve DeepAnalyze-8B

运行以下脚本启动 API 和界面，然后通过浏览器进行交互（http://localhost:4000）：

cd demo/chat/frontend
npm install
cd ..
bash start.sh

# 停止 API 和界面
bash stop.sh

# 如有需要，停止 vllm

如果您希望在特定 IP 地址下部署，请在 ./demo/chat/backend.py 和 ./demo/chat/frontend/lib/config.ts 中将 localhost 替换为您的 IP 地址。

WebUI v2

https://github.com/user-attachments/assets/2dd1d2aa-6fb9-4202-bc8d-cbe874844725

上传数据，DeepAnalyze即可进行以数据为导向的深度研究🔍以及任何以数据为中心的任务🛠。

更加简洁流畅的用户界面
新增对HeyWhale API密钥的支持
新增基于Docker的沙箱代码执行环境支持。

使用方法与WebUI相同。

cd demo/chat_v2/frontend  
npm install
cd ..
cp .env.example .env 
bash start.sh
# 停止API和界面
bash stop.sh

# 如有需要，停止vllm

JupyterUI

https://github.com/user-attachments/assets/a2335f45-be0e-4787-a4c1-e93192891c5f

熟悉Jupyter Notebook吗？试试通过JupyterUI使用DeepAnalyze吧！

本Demo以Jupyter Lab作为前端，新建笔记本，将<分析|理解|回答>转换为Markdown单元格，将<代码>转换为代码单元格并执行<执行>。
前往demo/jupyter查看更多内容并尝试！
👏非常感谢贡献者@ChengJiale150。

CLI

https://github.com/user-attachments/assets/018acae5-b979-4143-ae1e-5b74da453c1d

通过命令行界面体验DeepAnalyze

使用vllm部署DeepAnalyze-8B：vllm serve DeepAnalyze-8B

启动API服务器并运行CLI界面：

cd API
python start_server.py  # 在一个终端中

cd demo/cli
python api_cli.py       # 在另一个终端中（英文）
# 或
python api_cli_ZH.py    # 在另一个终端中（中文）

CLI提供基于Rich的美观界面，支持文件上传和实时流式响应。
支持英文和中文界面。

[!TIP]

克隆此仓库，在本地部署DeepAnalyze作为您的数据分析师，无需任何工作流或闭源API即可完成任何数据科学任务。

🔥 Demo的UI为初始版本，欢迎进一步开发，我们将把您列为贡献者。

🚀 快速入门

🔑 使用DeepAnalyze API

API密钥现已开放！

如需申请密钥，请填写以下任一申请表单：

主申请表（Google）
备用申请表（飞书）

📚 如需全面的使用说明，请参阅API指南：

文档
飞书Wiki

模型下载

可在RUC-DataLab/DeepAnalyze-8B · Hugging Face或DeepAnalyze-8B · 模型库下载模型。

📊 显存配置推荐参数表

GPU显存	模型类型	推荐max-model-len	是否使用FP8 KV缓存
16GB	8位量化	8192	✓
16GB	4位量化	49152	✓
24GB	原始模型	16384	✓
24GB	8位量化	98304	✓
24GB	4位量化	131072	✓
40GB	原始模型	131072	✓
40GB	8位量化	131072
80GB	原始模型	131072

如需获取量化模型，可使用./quantize.py。

🚀 vLLM启动命令模板

通用命令模板

python -m vllm.entrypoints.openai.api_server \
  --model <model_path> \
  --served-model-name DeepAnalyze-8B \
  --max-model-len <从上表选择> \
  --gpu-memory-utilization 0.95 \
  --port 8000 \
  <根据需要添加fp8> \
  --trust-remote-code

场景示例命令

场景1：16GB显存用户（推荐4位量化版本）

python -m vllm.entrypoints.openai.api_server \
  --model /path/to/deepanalyze/4bit \
  --served-model-name DeepAnalyze-8B \
  --max-model-len 49152 \
  --gpu-memory-utilization 0.95 \
  --port 8000 \
  --kv-cache-dtype fp8 \
  --trust-remote-code

场景2：24GB显存用户（追求最大上下文长度）

python -m vllm.entrypoints.openai.api_server \
  --model /path/to/deepanalyze/4bit \
  --served-model-name DeepAnalyze-8B \
  --max-model-len 131072 \
  --gpu-memory-utilization 0.95 \
  --port 8000 \
  --kv-cache-dtype fp8 \
  --trust-remote-code

场景3：80GB显存用户（最佳性能）

python -m vllm.entrypoints.openai.api_server \
  --model /path/to/original/model \
  --served-model-name DeepAnalyze-8B \
  --max-model-len 131072 \
  --gpu-memory-utilization 0.95 \
  --port 8000 \
  --trust-remote-code

快速选择指南

显存有限（<24GB）：使用4位量化版本+FP8 KV缓存
平衡配置（24-40GB）：根据需求选择模型类型
显存充足（≥40GB）：使用原始模型以获得最佳精度

启动后，可通过http://localhost:8000/v1/completions访问API服务。

环境要求

安装以下包：torch、transformers、vllm>=0.8.5

conda create -n deepanalyze python=3.12 -y
conda activate deepanalyze
pip install -r requirements.txt

# 用于训练
(cd ./deepanalyze/ms-swift/ && pip install -e .)
(cd ./deepanalyze/SkyRL/ && pip install -e .)

requirements.txt列出了DeepAnalyze推理所需的最低依赖项。训练时请参考./deepanalyze/ms-swift/requirements.txt和./deepanalyze/SkyRL/pyproject.toml。
建议将推理和训练环境分开，以避免依赖冲突。

命令交互

通过 vllm 部署 DeepAnalyze-8B：vllm serve DeepAnalyze-8B

运行以下脚本以执行任何数据科学任务：

您可以指定任意数据科学任务，包括特定的数据任务和开放式数据研究。
您可以指定任意数量的数据源，DeepAnalyze 将自动探索这些数据源。
您可以指定任意类型的数据源，例如结构化数据（数据库、CSV、Excel）、半结构化数据（JSON、XML、YAML）以及非结构化数据（TXT、Markdown）。

from deepanalyze import DeepAnalyzeVLLM

prompt = """# 指令
生成一份数据科学报告。

# 数据
文件1：{"name": "bool.xlsx", "size": "4.8KB"}
文件2：{"name": "person.csv", "size": "10.6KB"}
文件3：{"name": "disabled.xlsx", "size": "5.6KB"}
文件4：{"name": "enlist.csv", "size": "6.7KB"}
文件5：{"name": "filed_for_bankrupcy.csv", "size": "1.0KB"}
文件6：{"name": "longest_absense_from_school.xlsx", "size": "16.0KB"}
文件7：{"name": "male.xlsx", "size": "8.8KB"}
文件8：{"name": "no_payment_due.xlsx", "size": "15.6KB"}
文件9：{"name": "unemployed.xlsx", "size": "5.6KB"}
文件10：{"name": "enrolled.csv", "size": "20.4KB"}"""

workspace = "/home/u2023000922/zhangshaolei/deepanalyze_public/DeepAnalyze/example/analysis_on_student_loan/"

deepanalyze = DeepAnalyzeVLLM(
    "/fs/fast/u2023000922/zhangshaolei/checkpoints/deepanalyze-8b/"
)
answer = deepanalyze.generate(prompt, workspace=workspace)
print(answer["reasoning"])

您将获得一份深度研究报告，该报告可以渲染为 PDF 格式：

# 学生入学模式与院校转学的综合分析

## 引言及研究背景

对学生入学模式的分析是教育研究中的一个重要领域，对院校规划、资源分配以及学生支持服务具有重大意义。本研究全面考察了一个包含六所教育机构共1,194条入学记录的数据集，并将其与补充的人口统计、财务及就业状况数据相结合。研究采用了网络分析、预测建模和时间序列模式识别等先进分析技术，以揭示宏观层面的院校趋势以及微观层面的学生流动模式。该数据集具有纵向特性，涵盖了十五个月的入学记录，从而为理解学生在高等教育体系中的复杂路径提供了独特的视角。

我们的方法结合了对入学时长、转学概率和财务指标的定量分析，以及定性...

本研究通过提供关于院校转学网络及其与学生学业成果之间关系的实证证据，丰富了有关学生流动性的现有文献...
.....

deepanalyze

更多示例和任务完成详情，请参阅 DeepAnalyze 官网。

API

您可以构建一个 OpenAI 风格的 API，使用此脚本（请注意将 API/config.py 中的 MODEL_PATH = "DeepAnalyze-8B" 更改为您的 vllm 模型名称）：
```
python API/start_server.py
```

API 使用方法：

FILE_RESPONSE=$(curl -s -X POST "http://localhost:8200/v1/files" \
    -F "file=@data.csv" \
    -F "purpose=file-extract")

FILE_ID=$(echo $FILE_RESPONSE | jq -r '.id')

curl -X POST http://localhost:8200/v1/chat/completions \
     -H "Content-Type: application/json" \
     -d "{
        \"model\": \"DeepAnalyze-8B\",
        \"messages\": [
          {
            \"role\": \"user\",
            \"content\": \"生成一份数据科学报告。\",
            \"file_ids\": [\"$FILE_ID\"]
          }
        ]
      }"
# 等待片刻

详细信息请参阅 API/README.md。

🎈 开发您自己的 DeepAnalyze

1. 下载模型和训练数据

下载 DeepSeek-R1-0528-Qwen3-8B。或者您可以直接基于 DeepAnalyze-8B 进行微调。

如果您使用 DeepSeek-R1-0528-Qwen3-8B 作为基础模型，应添加特殊标记，使用如下命令：

MODEL_PATH=path_to_DeepSeek-R1-0528-Qwen3-8B
SAVE_PATH=path_to_save_DeepSeek-R1-0528-Qwen3-8B-addvocab

python deepanalyze/add_vocab.py \
  --model_path "$MODEL_PATH" \
  --save_path "$SAVE_PATH" \
  --add_tags

下载训练数据 DataScience-Instruct-500K。
- 解压 DataScience-Instruct-500K/RL/data.zip

2. 基于课程的智能体训练

单一能力微调：./scripts/single.sh
多能力智能体训练（冷启动）：./scripts/multi_coldstart.sh
多能力智能体训练（强化学习）：./scripts/multi_rl.sh

3. 评估

我们已使用 vLLM 统一评估了大多数现有的数据科学基准测试（并且还在持续增加中……）。您可以直接按照 ./playground 中的介绍，快速评估 DeepAnalyze 或您自己的智能体。

👏 贡献

我们欢迎任何形式的贡献，合并的 PR 将被列为贡献者。

代码和模型方面的贡献

我们欢迎对 DeepAnalyze 的代码、模型和 UI 的各种贡献，例如 Docker 打包、DeepAnalyze 模型的转换和量化，以及提交基于闭源 LLM 的 DeepAnalyze 工作流。
您可以直接提交拉取请求。
请参阅开发者指南获取贡献指南。

案例研究方面的贡献

我们也特别鼓励您分享使用 DeepAnalyze 的案例和反馈；这些对于帮助我们改进 DeepAnalyze 极其宝贵。
您可以将您的案例放置在 .example/ 下的新文件夹中。我们建议遵循 .example/analysis_on_student_loan/ 的文件结构，其中包括三个部分：
- data/：存储上传的文件
- prompt.txt：输入指令
- README.md：文档说明。我们建议包含输入内容、DeepAnalyze 的输出、其他闭源 LLM 的输出（可选），以及您对该案例的评估和评论。
DeepAnalyze 只有 8B 参数，因此我们也欢迎那些 DeepAnalyze 表现略逊于闭源 LLM 的案例——这将有助于我们进一步改进 DeepAnalyze。

🤝 致谢

训练框架： ms-swift、SkyRL
训练数据来源： Reasoning-Table、Spider、BIRD、DABStep
API密钥及相关服务：HeyWhale社区。

HeyWhale社区（www.heywhale.com）是全球领先的中文实践型AI社区。通过提供海量数据资源、实战案例、学习资料以及丰富的AI培训活动，汇聚了近百万名AI从业者和爱好者，共同分享见解、交流思想、协作创新，并在实践中快速提升技能。

🖋 引用

如果本仓库对您有所帮助，请按以下方式引用：

@misc{deepanalyze,
      title={DeepAnalyze: 自主数据科学的代理式大型语言模型}, 
      author={张绍磊、范举、范美浩、李国梁、杜晓勇},
      year={2025},
      eprint={2510.16872},
      archivePrefix={arXiv},
      primaryClass={cs.AI},
      url={https://arxiv.org/abs/2510.16872}, 
}

如有任何问题，欢迎提交Issue或联系zhangshaolei98@ruc.edu.cn。

🌟 其他

欢迎加入DeepAnalyze微信交流群，与大家畅聊、分享观点！

DeepAnalyze

如果您喜欢DeepAnalyze，请为该项目在GitHub上点个赞⭐。

DeepAnalyze 快速上手指南

DeepAnalyze 是首个用于自主数据科学的代理型大语言模型（Agentic LLM），能够无需人工干预地自动完成数据准备、分析、建模、可视化及报告生成等全流程任务。

1. 环境准备

系统要求

操作系统: Linux (推荐 Ubuntu 20.04+) 或 macOS
GPU: NVIDIA GPU (支持 CUDA)，显存建议 16GB 以上（最低可运行量化版本）
Python: 3.9 - 3.11
Node.js: v18+ (用于部署 WebUI)

前置依赖

确保已安装以下基础工具：

# 检查 Python 版本
python --version

# 检查 Git
git --version

# 检查 Node.js (WebUI 必需)
node --version
npm --version

# 安装 vLLM (推理引擎)
pip install vllm

提示: 国内用户建议使用清华源或阿里源加速 pip 安装： pip install vllm -i https://pypi.tuna.tsinghua.edu.cn/simple

2. 安装步骤

第一步：克隆项目

git clone https://github.com/ruc-datalab/DeepAnalyze.git
cd DeepAnalyze

第二步：下载模型

您可以从 Hugging Face 或 ModelScope（魔搭社区，国内推荐）下载模型。

方案 A：使用 Hugging Face (需网络条件)

# 需安装 huggingface-cli
pip install huggingface_hub
huggingface-cli download RUC-DataLab/DeepAnalyze-8B --local-dir ./models/DeepAnalyze-8B

方案 B：使用 ModelScope (国内加速推荐)

# 安装 modelscope
pip install modelscope
# 下载模型
python -c "from modelscope import snapshot_download; snapshot_download('RUC-DataLab/DeepAnalyze-8B', cache_dir='./models')"

第三步：启动推理服务 (vLLM)

根据您的显存大小选择合适的启动命令。以下以 24GB 显存 为例（使用 4-bit 量化以获得更长上下文）：

python -m vllm.entrypoints.openai.api_server \
  --model ./models/DeepAnalyze-8B \
  --served-model-name DeepAnalyze-8B \
  --max-model-len 131072 \
  --gpu-memory-utilization 0.95 \
  --port 8000 \
  --kv-cache-dtype fp8 \
  --trust-remote-code

显存适配参考:

16GB: 请使用 4-bit 量化模型，设置 --max-model-len 49152 并添加 --kv-cache-dtype fp8。

80GB: 可使用原始模型，移除 --kv-cache-dtype fp8 参数以获得最佳精度。

3. 基本使用

启动推理服务后，您可以通过以下三种方式与 DeepAnalyze 交互：

方式一：命令行界面 (CLI) - 最快捷

适合快速测试和终端用户。

启动后端 API（在新终端窗口）：
```
cd API
python start_server.py
```
启动 CLI 客户端（在另一个终端窗口）：
```
cd demo/cli
# 中文界面
python api_cli_ZH.py
```
启动后即可上传文件并进行自然对话，系统将自动执行代码分析数据。

方式二：Web 界面 (WebUI) - 功能最全

适合需要可视化操作和报告生成的场景。

安装前端依赖：

cd demo/chat/frontend
npm install
cd ..

启动服务：
```
bash start.sh
```
访问浏览器：打开 http://localhost:4000，上传 CSV/Excel/JSON 等数据文件，输入指令即可开始自主分析。

方式三：调用 API

如果您希望将 DeepAnalyze 集成到自己的应用中，可直接调用 OpenAI 兼容接口：

from openai import OpenAI

client = OpenAI(
    base_url="http://localhost:8000/v1",
    api_key="EMPTY" # 本地部署无需真实 key
)

response = client.chat.completions.create(
    model="DeepAnalyze-8B",
    messages=[
        {"role": "user", "content": "分析当前目录下的 data.csv 文件，找出销售额最高的产品并绘制趋势图。"}
    ]
)

print(response.choices[0].message.content)

进阶提示:

若需申请官方 DeepAnalyze API Key 免部署使用，请访问 Google 表单或飞书表单申请。
详细文档请参阅项目根目录下的 docs/DeepAnalyze_API_Key_Usage_Guide.md。

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

★ 349.3k|★★★☆☆|1周前

Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|1周前

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 156.8k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 108.3k|★★☆☆☆|5天前

开发框架图像Agent

gemini-cli

gemini-cli 是一款由谷歌推出的开源 AI 命令行工具，它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言，它提供了一条从输入提示词到获取模型响应的最短路径，无需切换窗口即可享受智能辅助。这款工具主要解决了开发过程中频繁上下文切换的痛点，让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用，还是执行复杂的 Git 操作，gemini-cli 都能通过自然语言指令高效处理。它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口，具备出色的逻辑推理能力；内置 Google 搜索、文件操作及 Shell 命令执行等实用工具；更独特的是，它支持 MCP（模型上下文协议），允许用户灵活扩展自定义集成，连接如图像生成等外部能力。此外，个人谷歌账号即可享受免费的额度支持，且项目基于 Apache 2.0 协议完全开源，是提升终端工作效率的理想助手。

★ 100.8k|★★☆☆☆|6天前

插件Agent图像

markitdown

MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器

★ 93.4k|★★☆☆☆|1周前

插件开发框架