MeiGen-AI-Design-MCP
MeiGen-AI-Design-MCP 是一款专为大语言模型设计的开源 MCP 服务器插件,致力于将代码智能体转化为专业的本地设计助手。它有效解决了 AI 绘图依赖外部服务、提示词编写门槛高以及生成结果单一等痛点。
通过集成本地 ComfyUI,MeiGen-AI-Design-MCP 实现了完全离线的图像生成,无需担心 API 费用或隐私泄露。其内置的 1,400 多条精选提示词库,配合精细化的提示词工程技术,能自动将自然需求转化为高质量的绘图指令。更值得一提的是,它支持多方向并行生成与子代理执行,能在短时间内输出多种创意方案,保持主上下文窗口的整洁。
MeiGen-AI-Design-MCP 非常适合开发者、视觉设计师以及追求本地化部署的研究人员使用。无论是快速迭代产品概念,还是探索艺术风格,都能借助其高效的工作流显著提升创作效率。
使用场景
某电商团队正在筹备新品发布会,设计师需要在一小时内产出同一款香水瓶的四种不同风格渲染图,用于社交媒体预热。
没有 MeiGen-AI-Design-MCP 时
- 需要手动在多个绘图平台间切换,反复调整提示词才能出图,打断创作心流
- 串行生成图片耗时过长,等待一张结果出来后再试下一张,效率极低
- 缺乏专业提示词库,生成的画面光影和质感往往不符合商业标准,需人工后期修图
- 依赖第三方 API 导致成本不可控且速度受限,无法处理批量并发任务
使用 MeiGen-AI-Design-MCP 后
- 直接在代码编辑器中通过自然语言指令调用,无需离开开发环境即可完成设计
- 内置 1,400+ 专业提示词库,自动优化需求转化为高质量生成任务,减少试错
- 支持多方向并行生成,一次请求即可同时产出四张不同风格的成品,大幅缩短周期
- 基于本地 ComfyUI 运行,隐私安全且无 API 调用费用限制,适合大规模迭代
核心价值:将复杂的图像生成工作流封装进对话界面,让开发者也能像专业设计师一样高效产出视觉资产。
运行环境要求
- 未说明
未说明
未说明

快速开始
MeiGen AI Design MCP
将 Claude Code / OpenClaw 转变为媲美 Lovart 的个人设计助手
本地 ComfyUI 生成,API 集成,1,300+ 专业提示词库,多方向并行输出
英文 | 中文
这是什么?
这是一个开源的 MCP(Model Context Protocol)服务器(通过插件市场安装),通过 8 个工具和精心设计的技能赋予大语言模型 (LLMs) 创意和审美能力,使其能够处理复杂的设计任务。它教导 LLMs 如何有效使用各种图像生成模型,通过参考图像和多方向并行工作流交付专业结果。
- 与本地 ComfyUI 配合使用——无需外部 API 依赖;也可轻松集成任何自定义 API
- 内置来自 nanobanana-trending-prompts 的 1,500+ 精选提示词模板,以及经过微调的提示词工程技术,可将需求转化为具体的图像生成任务
- 并行批量生成和子代理执行,以保持主上下文窗口整洁
演示效果
产品照片 —— 4 个方向并行
"为这款香水创建 4 张产品展示图,其中一张应包含模特。"
流程 —— AI 上传参考图,构思 4 个不同的提示词,然后并行生成所有 4 张:
结果 —— 不到 2 分钟交付 4 种创意方向:
生成的图片:
快速开始
Claude Code 插件(推荐)
# 添加插件市场
/plugin marketplace add jau123/MeiGen-AI-Design-MCP
# 安装
/plugin install meigen@meigen-marketplace
安装后重启 Claude Code(关闭并重新打开,或打开新的终端标签页)。
替代市场 —— 也可通过 wshobson/agents(30k+ stars)获取:
/plugin marketplace add wshobson/agents
/plugin install meigen-ai-design@claude-code-workflows
此市场不捆绑 MCP 服务器配置。安装后,将其添加到项目的
.mcp.json中:{ "mcpServers": { "meigen": { "command": "npx", "args": ["-y", "meigen@1.2.6"] } } }
首次设置
免费功能在重启后立即生效——尝试:
“搜索一些创意灵感”
要解锁图像生成功能,请运行设置向导:
/meigen:setup
向导将引导您完成以下步骤:
- 选择提供商 —— 本地 ComfyUI、MeiGen Cloud 或任何兼容 OpenAI 的 API(自带密钥和端点)
- 输入凭据 —— ComfyUI URL、API Token 或密钥
- 完成 —— 再次重启 Claude Code,然后开始生成
Cursor / VS Code / Windsurf / Roo Code
一条命令即可为任何支持的 AI 编码工具设置 MeiGen:
npx meigen init cursor # Cursor
npx meigen init vscode # VS Code / GitHub Copilot
npx meigen init windsurf # Windsurf
npx meigen init roo # Roo Code
npx meigen init claude # Claude Code(项目级别)
这将为您的工具写入格式和路径正确的 MCP 配置文件。如果配置文件已存在,MeiGen 将被合并而不会覆盖您的其他服务器。
OpenClaw
从 ClawHub 安装技能:
npx clawhub@latest install creative-toolkit
或者安装完整插件(包含命令、技能和 MCP 服务器):
openclaw plugins install meigen-ai-design
其他兼容 MCP 的主机
添加到您的 MCP 配置中(例如 .mcp.json, claude_desktop_config.json):
{
"mcpServers": {
"meigen": {
"command": "npx",
"args": ["-y", "meigen@latest"],
"env": {
"MEIGEN_API_TOKEN": "meigen_sk_..."
}
}
}
}
免费功能(灵感搜索、提示词增强、模型列表)无需任何 API 密钥即可使用。
功能
MCP (模型上下文协议) 工具
| 工具 | 免费 | 描述 |
|---|---|---|
search_gallery |
Yes | 搜索 1,500+ 精选热门提示词,附带视觉预览(由 nanobanana-trending-prompts 提供支持) |
get_inspiration |
Yes | 获取任意画廊条目的完整提示词、所有图片及元数据 |
enhance_prompt |
Yes | 将简短想法转化为专业的图像提示词 |
list_models |
Yes | 列出所有已配置提供商的可用模型 |
upload_reference_image |
Yes | 压缩并上传本地图片作为参考 |
comfyui_workflow |
Yes | 管理 ComfyUI 工作流模板:列表、查看、导入、修改、删除 |
manage_preferences |
Yes | 记住您偏好的风格、宽高比、模型和收藏提示词 |
generate_image |
Key | 生成图像 — 自动路由到最佳可用提供商 |
斜杠命令
| 命令 | 描述 |
|---|---|
/meigen:gen <prompt> |
快速生成 — 跳过对话,直接生成图像 |
/meigen:find <keywords> |
搜索 1,300+ 精选提示词以获取灵感 |
/meigen:models |
浏览并切换此会话的 AI 模型 |
/meigen:ref <file> |
上传本地图片作为参考,返回 URL |
/meigen:setup |
交互式提供商配置向导 |
智能代理
MeiGen 使用专用子代理以实现高效并行执行:
| 代理 | 用途 |
|---|---|
image-generator |
在隔离上下文中执行 generate_image — 实现真正的并行生成 |
prompt-crafter |
编写多个不同的提示词用于批量生成(在 Haiku 上运行以节省成本) |
gallery-researcher |
深度探索画廊而不干扰主对话(在 Haiku 上运行) |
输出样式
使用 /output-style 切换创意模式:
- 创意总监 — 视觉指导模式,包含视觉叙事、情绪板和设计思维
- 极简 — 仅显示图像和文件路径,无评论。适合批量工作流
自动化钩子
- 配置检查 — 会话开始时验证提供商配置,若缺失则引导设置
- 自动打开 — 生成的图像自动在预览程序(macOS)中打开
提供商
MeiGen MCP 支持三种图像生成后端。配置一个或多个 — 系统会自动选择最佳可用项。
ComfyUI — 本地且免费
在自己的 GPU 上运行生成,完全控制模型、采样器和工作流参数。导入任何 ComfyUI API 格式的工作流 — MeiGen 自动检测 KSampler、CLIPTextEncode、EmptyLatentImage 和 LoadImage 节点。
{
"comfyuiUrl": "http://localhost:8188",
"comfyuiDefaultWorkflow": "txt2img"
}
非常适合 Flux、SDXL 或您在本地运行的任何模型。您的图像永远不会离开您的机器。
MeiGen 云
多模型云 API:Nanobanana 2, Seedream 5.0, GPT image 1.5 等。无需 GPU。
获取您的 API 令牌:
- 在 meigen.ai 登录
- 点击头像 → 设置 → API 密钥
- 创建新密钥(以
meigen_sk_开头)
{ "meigenApiToken": "meigen_sk_..." }
自带 API(兼容 OpenAI)
连接遵循 OpenAI 格式的任何图像生成 API — Together AI, Fireworks AI, DeepInfra, SiliconFlow 或您自己的端点。只需提供密钥、基础 URL 和模型名称:
{
"openaiApiKey": "sk-...",
"openaiBaseUrl": "https://api.together.xyz/v1",
"openaiModel": "black-forest-labs/FLUX.1-schnell"
}
所有三个提供商都支持参考图像。MeiGen 和兼容 OpenAI 的 API 直接接受 URL;ComfyUI 接受 URL 和本地文件路径,并将它们注入到您工作流中的 LoadImage 节点。
配置
交互式设置(推荐)
/meigen:setup
向导将引导您完成提供商选择、API 密钥输入和 ComfyUI 工作流导入。您也可以从 API 提供商文档粘贴 curl 命令 — 它会自动提取密钥、URL 和模型。
配置文件
配置存储在 ~/.config/meigen/config.json。ComfyUI 工作流存储在 ~/.config/meigen/workflows/。
环境变量
环境变量优先级高于配置文件。
| 变量 | 描述 |
|---|---|
MEIGEN_API_TOKEN |
MeiGen 平台令牌 |
OPENAI_API_KEY |
您的 API 密钥(任何兼容 OpenAI 的提供商) |
OPENAI_BASE_URL |
API 基础 URL — 更改此地址以使用 Together AI, Fireworks AI 等。 |
OPENAI_MODEL |
提供商处的模型名称(例如 gpt-image-1.5, flux-schnell) |
COMFYUI_URL |
ComfyUI 服务器 URL(默认:http://localhost:8188) |
隐私
MeiGen MCP 尊重您的隐私。以下是关于您数据的处理方式:
- ComfyUI(本地) — 所有处理均留在您的机器上。不向外部发送数据。
- MeiGen 云 — 提示词和参考图像发送至
api.meigen.ai进行生成。生成的图像临时存储在 Cloudflare R2 上。请参阅 meigen.ai/privacy。 - 兼容 OpenAI — 提示词和参考图像发送至配置的 API 端点。请参阅您提供商的隐私政策。
- 参考图像上传 — 图像在本地压缩(最大 2MB)并通过
gen.meigen.ai上传至 Cloudflare R2。上传的图像在 24 小时 后自动过期。无需身份验证。ComfyUI 用户可以直接传递本地文件路径而完全跳过上传。 - 画廊搜索与提示词增强 — 针对捆绑数据在本地运行。无外部 API 调用。
无任何遥测、分析或跟踪。
自定义存储后端
如果您更喜欢使用自己的 S3/R2 桶进行参考图像上传,请设置 UPLOAD_GATEWAY_URL 环境变量或在 ~/.config/meigen/config.json 中设置 uploadGatewayUrl 以指向您自己的预签名端点。该端点必须实现:
POST /upload/presign
Content-Type: application/json
Request: { "filename": "photo.jpg", "contentType": "image/jpeg", "size": 123456 }
Response: { "success": true, "presignedUrl": "https://...", "publicUrl": "https://..." }
presignedUrl 用于 PUT 上传,publicUrl 是返回给用户的公开可访问 URL。
许可证
MIT — 个人和商业用途免费。
版本历史
v1.2.42026/03/06v1.2.32026/02/27v1.2.22026/02/26v1.2.12026/02/26v1.2.02026/02/26v1.2.72026/04/01v1.2.62026/03/25v1.2.52026/03/06常见问题
相似工具推荐
stable-diffusion-webui
stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。
ComfyUI
ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。
ML-For-Beginners
ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程,旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周,包含 26 节精炼课程和 52 道配套测验,内容涵盖从基础概念到实际应用的完整流程,有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。 无论是希望转型的开发者、需要补充算法背景的研究人员,还是对人工智能充满好奇的普通爱好者,都能从中受益。课程不仅提供了清晰的理论讲解,还强调动手实践,让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持,通过自动化机制提供了包括简体中文在内的 50 多种语言版本,极大地降低了全球不同背景用户的学习门槛。此外,项目采用开源协作模式,社区活跃且内容持续更新,确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路,ML-For-Beginners 将是理想的起点。
ragflow
RAGFlow 是一款领先的开源检索增强生成(RAG)引擎,旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体(Agent)能力相结合,不仅支持从各类文档中高效提取知识,还能让模型基于这些知识进行逻辑推理和任务执行。 在大模型应用中,幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构(如表格、图表及混合排版),显著提升了信息检索的准确度,从而有效减少模型“胡编乱造”的现象,确保回答既有据可依又具备时效性。其内置的智能体机制更进一步,使系统不仅能回答问题,还能自主规划步骤解决复杂问题。 这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统,还是致力于探索大模型在垂直领域落地的创新者,都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口,既降低了非算法背景用户的上手门槛,也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目,它正成为连接通用大模型与行业专有知识之间的重要桥梁。
PaddleOCR
PaddleOCR 是一款基于百度飞桨框架开发的高性能开源光学字符识别工具包。它的核心能力是将图片、PDF 等文档中的文字提取出来,转换成计算机可读取的结构化数据,让机器真正“看懂”图文内容。 面对海量纸质或电子文档,PaddleOCR 解决了人工录入效率低、数字化成本高的问题。尤其在人工智能领域,它扮演着连接图像与大型语言模型(LLM)的桥梁角色,能将视觉信息直接转化为文本输入,助力智能问答、文档分析等应用场景落地。 PaddleOCR 适合开发者、算法研究人员以及有文档自动化需求的普通用户。其技术优势十分明显:不仅支持全球 100 多种语言的识别,还能在 Windows、Linux、macOS 等多个系统上运行,并灵活适配 CPU、GPU、NPU 等各类硬件。作为一个轻量级且社区活跃的开源项目,PaddleOCR 既能满足快速集成的需求,也能支撑前沿的视觉语言研究,是处理文字识别任务的理想选择。
tesseract
Tesseract 是一款历史悠久且备受推崇的开源光学字符识别(OCR)引擎,最初由惠普实验室开发,后由 Google 维护,目前由全球社区共同贡献。它的核心功能是将图片中的文字转化为可编辑、可搜索的文本数据,有效解决了从扫描件、照片或 PDF 文档中提取文字信息的难题,是数字化归档和信息自动化的重要基础工具。 在技术层面,Tesseract 展现了强大的适应能力。从版本 4 开始,它引入了基于长短期记忆网络(LSTM)的神经网络 OCR 引擎,显著提升了行识别的准确率;同时,为了兼顾旧有需求,它依然支持传统的字符模式识别引擎。Tesseract 原生支持 UTF-8 编码,开箱即用即可识别超过 100 种语言,并兼容 PNG、JPEG、TIFF 等多种常见图像格式。输出方面,它灵活支持纯文本、hOCR、PDF、TSV 等多种格式,方便后续数据处理。 Tesseract 主要面向开发者、研究人员以及需要构建文档处理流程的企业用户。由于它本身是一个命令行工具和库(libtesseract),不包含图形用户界面(GUI),因此最适合具备一定编程能力的技术人员集成到自动化脚本或应用程序中