next-ai-draw-io

27.5k 2.9k 简单 1 次阅读今天Apache-2.0图像Agent开发框架

AI 解读由 AI 自动生成，仅供参考

next-ai-draw-io 是一款基于 Next.js 构建的开源 Web 应用，它将强大的 AI 能力与传统绘图工具 draw.io 深度融合。用户只需通过自然语言对话，即可轻松创建、修改或优化复杂的流程图、架构图甚至创意素描，实现了“聊天即绘图”的便捷体验。

这款工具主要解决了传统绘图软件上手门槛高、手动拖拽元素耗时费力的问题。无论是梳理技术架构、设计业务流程，还是进行创意可视化，用户都不再需要纠结于具体的绘图操作，只需描述需求，AI 便能自动完成图形生成与布局调整，极大提升了内容创作效率。

它非常适合开发者、系统架构师、产品经理以及研究人员使用。对于需要频繁绘制技术文档的程序员，或是希望快速将抽象概念可视化的非设计专业人士，next-ai-draw-io 都能提供得力辅助。

在技术亮点方面，该工具支持多种大语言模型提供商（如字节豆包 GLM-4.7 等），并创新性地集成了 MCP（Model Context Protocol）服务器，使其不仅能作为独立网页运行，还能作为桌面应用或通过 Docker 部署，甚至能与 Claude Code CLI 等开发工具联动。其核心在于利用 LLM 理解语义并转化为标准的 draw.io 图形数据，让智能绘图变得灵活且可扩展。

使用场景

某初创公司的后端架构师正在向非技术背景的投资人汇报，急需在会议前快速将复杂的微服务交互逻辑转化为直观的架构图。

没有 next-ai-draw-io 时

绘图耗时过长：需要在 draw.io 中手动拖拽每一个方框和连线，调整对齐和样式往往花费数小时，严重压缩了梳理逻辑的时间。
修改成本高昂：投资人临时提出“增加一个缓存层”或“改为无服务器架构”，意味着要重新布局整个画布，极易打乱原有结构。
沟通存在壁垒：口头描述的技术细节难以实时转化为视觉图像，导致会议中反复解释仍无法达成视觉共识。
美观度难保证：非设计出身的开发者画出的图表往往线条杂乱、风格不统一，影响专业演示效果。

使用 next-ai-draw-io 后

自然语言即绘：直接输入“生成基于 React 和 AWS 的无服务器认证流程图”，next-ai-draw-io 瞬间自动生成结构清晰、连线准确的完整架构图。
指令即时迭代：面对变更需求，只需追加命令“在数据库前加入 Redis 缓存层”，next-ai-draw-io 自动完成节点插入与布局重排，无需手动调整。
所见即所得的协作：在演示现场根据反馈实时修改提示词，next-ai-draw-io 立即呈现新方案，让技术构想与视觉呈现同步更新。
智能美化输出：next-ai-draw-io 内置的 AI 视觉优化能力自动处理配色与间距，直接产出达到出版级质量的矢量图。

next-ai-draw-io 将原本需要数小时的绘图工作缩短为分钟级的对话交互，让技术人员能专注于逻辑本身而非绘图工具的操作。

运行环境要求

操作系统

Windows
macOS
Linux

GPU

未说明

内存

未说明

依赖

notes该项目为基于 Next.js 的 Web 应用，主要通过 npm/nodejs 运行，支持 Docker 部署及桌面客户端下载。无需本地 GPU，AI 推理依赖外部 API（如 AWS Bedrock, OpenAI, Claude 等）。推荐使用具备强逻辑和长文本生成能力的模型（如 Claude Sonnet, GPT-4/5, Gemini 等）以生成准确的 draw.io XML 代码。

python未说明

Next.js 16.x

React 19.x

Vercel AI SDK

react-drawio

快速开始

Next AI Draw.io

人工智能驱动的图表创建工具 - 聊天、绘图、可视化

英语 | 中文 | 日语

一个将AI能力与draw.io图表集成的Next.js Web应用。通过自然语言指令和AI辅助可视化，创建、修改和增强图表。

注意：感谢字节跳动豆包的赞助，演示站点现在使用强大的glm-4.7模型！

https://github.com/user-attachments/assets/9d60a3e8-4a1c-4b5e-acbb-26af2d3eabd1

示例

以下是一些示例提示及其生成的图表：

变压器架构中的动画连接线提示：给我一个变压器架构的动画连接线图。
RAG 技术架构图提示：为聊天应用生成一个RAG架构图。使用连接图来展示数据摄取过程。	使用 React 和 AWS 的认证流程提示：使用 React 和AWS生成一个认证流程图。采用无服务器架构。
开放式创新提示：请为我制作亨利·切斯布罗的开放式创新模型的可视化图。	猫咪草图提示：帮我画一只可爱的小猫吧。

特性

LLM 驱动的图表创建：利用大型语言模型，直接通过自然语言命令创建和操作 draw.io 图表。
基于图像的图表复制：上传现有图表或图片，让 AI 自动复制并增强它们。
PDF 和文本文件上传：上传 PDF 文档和文本文件，提取内容并从现有文档中生成图表。
AI 推理过程显示：对于支持的模型（如 OpenAI o1/o3、Gemini、Claude 等），可以查看 AI 的思考过程。
图表历史记录：全面的版本控制功能，跟踪所有更改，允许您查看和恢复 AI 编辑之前的图表版本。
交互式聊天界面：与 AI 沟通，实时优化您的图表。
云架构图支持：专门支持生成云架构图（AWS、GCP、Azure）。
动画连接线：在图表元素之间创建动态且带动画效果的连接线，以获得更好的可视化效果。

MCP 服务器

通过 MCP（模型上下文协议）, 可以将 Next AI Draw.io 与 Claude Desktop、Cursor 和 VS Code 等 AI 助手一起使用。

{
  "mcpServers": {
    "drawio": {
      "command": "npx",
      "args": ["@next-ai-drawio/mcp-server@latest"]
    }
  }
}

Claude Code CLI

claude mcp add drawio -- npx @next-ai-drawio/mcp-server@latest

然后您可以要求 Claude 创建图表：

“创建一个展示用户认证流程的流程图，包括登录、MFA 和会话管理。”

图表会实时出现在您的浏览器中！

有关 VS Code、Cursor 等客户端配置，请参阅 MCP 服务器 README。

开始使用

在线试用

无需安装！直接在我们的演示网站上试用该应用：

自备 API 密钥：您可以使用自己的 API 密钥来绕过演示站点的使用限制。点击聊天面板中的设置图标，即可配置您的提供商和 API 密钥。您的密钥仅存储在本地浏览器中，绝不会存储在服务器上。

桌面应用

从发布页面下载适用于您平台的原生桌面应用：

支持的平台：Windows、macOS、Linux。

使用 Docker 运行

前往 Docker 指南

安装

克隆仓库：

git clone https://github.com/DayuanJiang/next-ai-draw-io
cd next-ai-draw-io
npm install
cp env.example .env.local

有关每个提供商的详细设置说明，请参阅提供商配置指南。

运行开发服务器：

npm run dev

在浏览器中打开 http://localhost:6002 即可看到应用程序。

部署

部署到 EdgeOne Pages

您可以使用腾讯 EdgeOne Pages 一键部署。

通过此按钮进行部署：

更多详情请参阅腾讯 EdgeOne Pages 文档。

此外，通过腾讯 EdgeOne Pages 部署还将为您提供 DeepSeek 模型的每日免费配额。

在 Vercel 上部署

最简单的部署方式是使用 Next.js 的创建者 Vercel。请务必在 Vercel 控制台中像在本地 .env.local 文件中一样 设置环境变量。

更多详情请参阅 Next.js 部署文档。

在 Cloudflare Workers 上部署

前往 Cloudflare 部署指南

多提供商支持

字节跳动 DouBao (Doubao)
AWS Bedrock（默认）
OpenAI
Anthropic
Google AI
Google Vertex AI
Azure OpenAI
Ollama
OpenRouter
DeepSeek
SiliconFlow
ModelScope
SGLang
Vercel AI Gateway

除 AWS Bedrock 和 OpenRouter 外，所有提供商均支持自定义端点。

📖 详细提供商配置指南 - 查看各提供商的设置说明。

服务器端多模型配置

管理员可以配置多个对所有用户可用的服务器端模型，而无需个人 API 密钥。可通过 AI_MODELS_CONFIG 环境变量（JSON 字符串）或 ai-models.json 文件进行配置。

模型要求：此任务需要强大的模型能力，以生成具有严格格式约束（draw.io XML）的长文本。推荐的模型包括 Claude Sonnet 4.5、GPT-5.1、Gemini 3 Pro 以及 DeepSeek V3.2/R1。

请注意，claude 系列模型曾接受过 draw.io 图表训练，其中包括 AWS、Azure、GCP 等云架构标志。因此，如果您希望创建云架构图，这是最佳选择。

工作原理

该应用使用以下技术：

Next.js：用于前端框架和路由
Vercel AI SDK (ai + @ai-sdk/*)：用于流式传输 AI 响应及多提供商支持
react-drawio：用于图表的表示与操作

图表以可在 draw.io 中渲染的 XML 格式表示。AI 会处理您的指令，并相应地生成或修改此 XML。

支持与联系

特别感谢字节跳动 DouBao 对演示站点 API Token 使用的赞助！ 在 ARK 平台上注册即可获得所有模型的 50 万次免费调用额度！

如果您觉得这个项目很有用，请考虑赞助，以帮助我托管实时演示站点！

如需支持或咨询，请在 GitHub 仓库中提交问题，或联系维护者：

邮箱：me[at]jiang.jp

常见问题解答

常见问题及解决方案请参阅 FAQ。

星标历史

Next AI Draw.io 快速上手指南

Next AI Draw.io 是一款基于 Next.js 的开源工具，支持通过自然语言对话创建、修改和增强 draw.io 流程图。它集成了多种大模型（如 Doubao、Claude、GPT 等），可将文本描述直接转换为专业的架构图或示意图。

环境准备

在开始之前，请确保您的开发环境满足以下要求：

操作系统：Windows, macOS, 或 Linux
Node.js：建议安装 LTS 版本 (推荐 v18.x 或更高)
包管理器：npm 或 pnpm
API Key：准备一个大模型服务商的 API Key（项目默认支持字节跳动豆包、AWS Bedrock、OpenAI、DeepSeek 等）。
- 国内开发者推荐：可使用字节跳动豆包 (Doubao) 或 DeepSeek，注册即可获得免费额度。

安装步骤

1. 克隆项目

打开终端，执行以下命令获取源代码：

git clone https://github.com/DayuanJiang/next-ai-draw-io
cd next-ai-draw-io

2. 安装依赖

安装项目所需的 Node.js 依赖包：

npm install

3. 配置环境变量

复制示例配置文件并创建本地环境变量文件：

cp env.example .env.local

编辑 .env.local 文件，填入您的 API Key 和选定的模型提供商。例如，若使用字节跳动豆包或 OpenAI 兼容接口：

# 示例：配置 API Key (具体变量名请参考 env.example 或文档)
OPENAI_API_KEY=your_api_key_here
OPENAI_BASE_URL=https://api.doubao.com/v1 # 如果使用豆包或其他兼容接口
NEXT_PUBLIC_DEFAULT_MODEL=glm-4-flash # 根据实际选择的模型填写

提示：详细的各厂商配置指南可参考项目内的 docs/en/ai-providers.md。

4. 启动开发服务器

运行以下命令启动应用：

npm run dev

启动成功后，在浏览器中访问：http://localhost:6002

基本使用

启动应用后，您将看到一个集成的聊天与绘图界面。以下是三种最核心的使用方式：

1. 自然语言生成图表

在对话框中输入您的需求，AI 将自动生成 draw.io XML 并渲染出图表。

示例提示词：

"Generate a RAG architecture diagram for chat application. Use connected diagram for data ingestion" （为聊天应用生成一个 RAG 架构图，数据摄入部分使用连接图表示）
示例提示词：

"Create a flowchart showing user authentication with login, MFA, and session management" （创建一个包含登录、多因素认证和会话管理的用户认证流程图）

2. 图片/文件上传复刻

您可以直接上传现有的流程图截图、PDF 文档或文本文件。

操作：点击输入框旁的上传按钮，选择文件。
效果：AI 会分析文件内容，自动复刻并重绘为可编辑的 draw.io 图表，或基于文档内容生成新的架构图。

3. 交互式修改

生成图表后，您可以继续通过对话进行微调。

示例：

"Change the database icon to AWS RDS style and add an animated connector between API and Database." （将数据库图标改为 AWS RDS 风格，并在 API 和数据库之间添加动态连接线。）

其他运行方式

如果不希望本地安装，也可以选择以下方式：

在线体验：访问 Live Demo（支持在设置中填入自己的 API Key 以解除限制）。
桌面客户端：前往 Releases 页面下载 Windows/macOS/Linux 原生应用。
Docker 运行：参考项目根目录下的 docs/en/docker.md 指南。

版本历史

v0.4.152026/04/14

v0.4.142026/03/30

v0.4.132026/03/07

v0.4.122026/01/24

v0.4.112026/01/18

v0.4.102026/01/09

v0.4.92026/01/04

v0.4.82026/01/01

v0.4.72025/12/25

v0.4.62025/12/23

v0.4.52025/12/22

v0.4.42025/12/20

v0.4.32025/12/17

v0.4.12025/12/14

v0.4.02025/12/11

v0.3.02025/12/06

v0.2.02025/11/15

常见问题

在 Windows 环境下使用 Claude Code 无法连接 MCP 服务器怎么办？

自建大模型（如 Qwen）只输出思考过程而不生成图表，如何解决？

为什么上传的图片无法被读取用于生成图表？

如何对 Draw.io 的 UI 界面进行二次开发或自定义？

Docker 部署后点击发送按钮没有反应，可能是什么原因？

如何在界面上删除已添加的模型提供商配置？

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

★ 349.3k|★★★☆☆|1周前

Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|2周前

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 160.8k|★★☆☆☆|今天

开发框架Agent语言模型

opencode

OpenCode 是一款开源的 AI 编程助手（Coding Agent），旨在像一位智能搭档一样融入您的开发流程。它不仅仅是一个代码补全插件，而是一个能够理解项目上下文、自主规划任务并执行复杂编码操作的智能体。无论是生成全新功能、重构现有代码，还是排查难以定位的 Bug，OpenCode 都能通过自然语言交互高效完成，显著减少开发者在重复性劳动和上下文切换上的时间消耗。这款工具专为软件开发者、工程师及技术研究人员设计，特别适合希望利用大模型能力来提升编码效率、加速原型开发或处理遗留代码维护的专业人群。其核心亮点在于完全开源的架构，这意味着用户可以审查代码逻辑、自定义行为策略，甚至私有化部署以保障数据安全，彻底打破了传统闭源 AI 助手的“黑盒”限制。在技术体验上，OpenCode 提供了灵活的终端界面（Terminal UI）和正在测试中的桌面应用程序，支持 macOS、Windows 及 Linux 全平台。它兼容多种包管理工具，安装便捷，并能无缝集成到现有的开发环境中。无论您是追求极致控制权的资深极客，还是渴望提升产出的独立开发者，OpenCode 都提供了一个透明、可信

★ 144.3k|★☆☆☆☆|3天前

Agent插件

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 109.2k|★★☆☆☆|昨天