Magick

835 136 较难 1 次阅读今天NOASSERTION语言模型开发框架图像Agent

AI 解读由 AI 自动生成，仅供参考

Magick 是一款前沿的可视化人工智能开发环境（AIDE），旨在让用户无需编写代码即可构建复杂的数据管道和多模态智能体。它通过直观的节点式界面，将数据输入、处理变换到最终输出的全过程图形化，解决了传统 AI 开发依赖命令行、门槛高且流程不透明的痛点。

无论是希望快速原型验证的研究人员、需要集成多服务的应用开发者，还是想要探索 AI 可能性的普通创作者，都能利用 Magick 轻松上手。其核心亮点在于独特的“咒语”（Spells）概念，即以标准 JSON 格式存储和共享的数据流图，便于社区协作与复用。系统内置了丰富的功能节点，支持实时智能体自主行动、跨平台社交连接（如 Discord、Twitter）、网络搜索以及语音图像生成等能力。用户只需通过拖拽和连线，就能组合出具备记忆能力和复杂推理逻辑的智能应用，真正让创意低代码落地。

使用场景

一家小型游戏工作室希望为其即将上线的 RPG 游戏快速构建一个能跨平台互动、拥有统一记忆且具备多模态能力的智能 NPC 系统。

没有 Magick 时

开发团队需分别编写代码对接 Discord、Twitter 和 Twilio 接口，耗时数周且维护成本极高。
难以实现 NPC 在不同平台间的“统一记忆”，导致玩家在推特提问后，NPC 在 Discord 中完全不知情。
整合语音生成、图像创作与向量搜索功能需要串联多个独立脚本，调试复杂且极易出错。
非技术背景的游戏策划无法参与逻辑调整，任何细微的行为修改都依赖程序员重写代码。
缺乏可视化的流程管理，复杂的推理逻辑一旦出错，排查问题如同大海捞针。

使用 Magick 后

利用内置的社交连接器，开发者通过拖拽节点即可瞬间打通 Discord 与 Twitter，无需编写底层 API 代码。
借助统一的记忆节点，NPC 能自动同步跨平台对话历史，在不同渠道为用户提供连贯的角色扮演体验。
通过组合现成的语音、图像生成及向量搜索工具节点，轻松构建出能看图说话、有声有色的多模态智能体。
游戏策划可直接在可视化画布上调整"Spells"（数据流），实时修改 NPC 的反应逻辑而无需触碰代码。
基于图的 IDE 让复杂的数据流向一目了然，支持子图嵌套与社区模板共享，大幅加速了迭代与排错过程。

Magick 将原本需要全栈开发数月的多模态智能体工程，转化为可视化的积木搭建过程，让创意不再受限于编码能力。

运行环境要求

操作系统

Linux
macOS
Windows

GPU

未说明

内存

未说明

依赖

notesREADME 中未直接列出具体的硬件配置、Python 版本或依赖库列表。详细的环境要求（包括系统先决条件、数据库配置等）需参考项目文档中针对各操作系统的具体安装指南（docs/installation/）。该工具是一个基于节点的可视化 AI 开发环境，支持连接 Discord、Twitter 等服务，并包含语音和图像生成等功能。本地开发时若使用 Chrome 浏览器，可能需要启用‘允许不安全的 localhost'标志以接受自签名证书。

python未说明

快速开始

Magick是一款突破性的可视化AIDE（人工智能开发环境），专为无代码数据管道和多模态智能体而设计。Magick能够连接到其他服务，并提供适合智能体、聊天机器人、复杂推理系统和拟人化角色的节点与模板。

🗝 核心功能

实时智能体：可自主执行动作，在统一的记忆和自我体系下，以多种模态与用户及其他智能体交互。
社交平台连接器：支持Discord、Twitter和Twilio——Zoom、Google Meet、Reddit、Slack等连接器即将作为插件推出！
支持谷歌、维基百科及语义网搜索。
内置多种实用工具，包括语音与图像生成、向量检索等。
强大的基于图的IDE，适用于复杂的数据管道。
图表可嵌套子图并共享，助力社区快速开发。

🔮 Magick：用AI自动化、构建并实现你的创意。

借助Magick，你无需掌握命令行编程即可释放AI的强大潜力。通过我们的可视化节点式环境，你可以轻松连接热门服务，探索丰富的预构建节点与连接器，将你的愿景变为现实。

▶️ 点击上方图片观看视频

核心概念

法术

法术是一种数据流动的管道，描述数据从一处流向另一处，经过我们称为“节点”的不同处理过程，并通过我们称为“连接”的线路传输。在Magick中，每个图表的数据、节点、变量和预设的集合被称为“法术”。需要注意的是，“法术”并非机器学习领域的术语，我们只是觉得这个名字很有趣。法术可以随时导入导出，其原始格式为JSON，这是一种易于分享的标准格式。

节点

从根本上说，Magick是一个用于接收数据、对其进行处理并最终输出结果的系统。

这种“处理”被称为“转换”，数据会从一种形式转变为另一种形式。而执行转换的“黑盒”则是一个输入任意类型数据、输出任意类型数据的模块。我们称这个进行转换的黑盒为“节点”。节点是Magick的基础构建块。

创建节点

节点可以在“法术”选项卡的编辑窗口中创建。你可以在编辑窗口中右键单击，从上下文菜单中添加节点；也可以直接将“节点”选项卡中的节点拖放到编辑窗口中。此外，还可以通过拖拽来重新排列节点的位置。

要删除节点，只需右键单击该节点并选择“删除”。

节点类型

输入节点
提示模板
代码节点：允许你自定义输入和输出。
生成器节点：允许你定义自己的输入端口，并在节点内部处理这些数据。
等待所有节点：用于等待多个执行分支完成后再合并为一个分支——这是同时执行多项耗时任务的好方法。
…还有更多！（如果你有任何建议，请告诉我们）

输入与输出

所有节点都具有输入和/或输出，但不一定同时具备两者。输入和输出以插座的形式直观地显示出来。插座的颜色决定了它可以接收的数据类型，“灰色”表示默认的未指定类型或“任意”类型。

插座

传入插座的数据对节点可用。节点可以对这些数据进行处理，并将结果返回到输出插座。有些节点（如生成器节点）允许你自定义输入端口，然后在节点内部处理这些数据。而另一些节点（如代码节点）则允许你同时定义输入和输出。

触发器

触发器用于启动节点的异步任务。部分节点无需触发器即可处理数据，但大多数节点需要触发器。触发器可以从一个插座发送到多个输入端口，不过执行顺序无法保证。此时可以使用“等待所有”节点来等待各个执行分支完成后再合并为一个分支——这正是同时执行多项耗时任务的理想方式。

⚙️ 安装

请根据你的操作系统选择相应的安装指南，获取详细的设置说明：

每个指南包含以下内容：

系统要求与先决条件
分步安装说明
环境搭建
数据库配置
故障排除提示

如需更详细的开发文档和架构概述，请参阅：

开发提示

自签名证书

在本地开发时，你可能希望Chrome接受来自localhost的自签名证书。为此，请按照以下步骤操作：

打开：chrome://flags/#allow-insecure-localhost
启用该功能

贡献者

_Michael 💻 📦 💼	_{M̵̞̗̝̼̅̏̎͝Ȯ̴̝̻̊̃̋̀Õ̷̼͋N̸̩̿͜ ̶̜̠̹̼̩͒} 💻 📦	_alextitonis 💻	_{Daniel Adams} 💻	_{Anthony Burchell} 💻 📝	_jin 📝	_{Shivaditya Shivganesh} 💻
_khalildh 💻	_Pigloo 💻	_{avirtualfuture} 💻 📖	_{Alexandre Ferreira} 💻	_{Matei Anghel} 💻	_Trentalantar 📖	_{Lisa Mega Watts} 📖
_r2 📖	_{IRANKUNDA Fabrice} 💻	_{Kien Nguyen} 💻	_{Ben Moore} 💻	_Q 💻	_{thomageanderson} 💻	_Pietro 💻
_codingsh 💻	_{Ben Botwin} 💻 📦	_{K. S. Ernest (iFire) Lee} 💻	_{coffeeorgreentea} 💻 🚇 💼	_Knar 💻	_{Emmy NSABIMANA} 💻

基于 Latitude Games 的 Thoth

原始源代码由以下 Thoth 贡献者编写，该项目已归档在这里。

_Jakob
💻

_{Sean Gillespie}
💻

_Michael
💻

_{Preston Gull}
💻🎨

_{Nick Walton}
💻

_{Mitchell Gordon}
💻

_?/janus
💻

_{Alan Walton}
💻

来和我们一起构建吧！

我们正在 Discord 上以开放社区的形式共同构建 Magick。如果你对参与这个项目感兴趣，我们非常欢迎你的加入。

立即加入：https://bit.ly/magickdiscordgh

Magick 快速上手指南

Magick 是一款突破性的可视化 AI 开发环境（AIDE），专为无代码数据管道和多模态智能体设计。通过基于节点的图形界面，您可以轻松构建智能代理、聊天机器人、复杂推理系统及虚拟角色，无需编写复杂的命令行代码。

环境准备

在开始之前，请确保您的开发环境满足以下要求：

系统要求

操作系统：macOS, Linux, 或 Windows
内存：建议 8GB 及以上
磁盘空间：至少 5GB 可用空间

前置依赖

Node.js：推荐最新 LTS 版本
Git：用于克隆仓库
数据库：根据官方文档需配置本地数据库（通常为 PostgreSQL 或 SQLite，具体视安装脚本而定）
浏览器：推荐使用 Chrome（开发模式下需支持自签名证书）

注意：国内用户若遇到网络问题，建议在克隆仓库或安装依赖时使用国内镜像源（如淘宝 npm 镜像）。

安装步骤

请选择对应您操作系统的安装方式：

1. 获取源码

git clone https://github.com/Oneirocom/Magick.git
cd Magick

(国内加速): 如果 GitHub 连接缓慢，可使用镜像：

git clone https://gitee.com/mirror/Oneirocom-Magick.git # 示例镜像地址，请以实际可用源为准
cd Magick

2. 安装依赖

npm install
# 或者使用国内镜像加速
npm install --registry=https://registry.npmmirror.com

3. 环境配置与数据库初始化

根据项目根目录下的 .env.example 创建配置文件：

cp .env.example .env

编辑 .env 文件填入必要的 API Key 和数据库连接信息。

运行数据库迁移或初始化脚本（具体命令参考各系统详细文档）：

npm run db:migrate

4. 启动应用

npm run dev

启动后，通常在浏览器访问 http://localhost:3000 (端口号以实际输出为准) 即可进入可视化界面。

开发提示：若在本地开发遇到 Chrome 拦截自签名证书，请在地址栏输入 chrome://flags/#allow-insecure-localhost 并启用该选项。

基本使用

Magick 的核心工作流是通过“咒语”（Spells）来构建数据管道。以下是创建一个简单流程的步骤：

核心概念

Spells (咒语)：即数据管道，由节点和连接线组成，本质是 JSON 格式，可导入导出。
Nodes (节点)：处理数据的基本单元（黑盒），接收输入并进行转换后输出。
Sockets (插槽)：节点上的输入/输出接口，颜色代表数据类型（灰色为通用类型）。

快速示例：构建一个简单的文本处理流

进入创作界面：启动应用后，点击左侧菜单栏的 "Spells" 标签页，进入作曲器（Composer）窗口。
添加节点：
- 方法一：在画布空白处右键点击，从上下文菜单中选择节点。
- 方法二：从左侧 "Nodes" 面板拖拽节点到画布。
示例场景：创建一个从输入到生成的简单流。
- 拖入一个 Input Node (输入节点)。
- 拖入一个 Prompt Template (提示词模板节点)。
- 拖入一个 Generator Node (生成节点，用于调用 AI 模型)。
连接节点：鼠标从一个节点的输出插槽（Output Socket）拖拽连线到下一个节点的输入插槽（Input Socket）。
- 将 Input Node 的输出连接到 Prompt Template 的输入。
- 将 Prompt Template 的输出连接到 Generator Node 的输入。
配置与运行：
- 点击 Input Node，在属性面板设置初始文本数据。
- 点击 Prompt Template，编辑提示词逻辑（例如："请总结以下内容：{{input}}"）。
- 点击 Generator Node，选择所需的 AI 模型并配置参数。
大部分节点需要 Trigger (触发器) 来启动异步任务。确保触发信号能正确传递。
执行流程：点击画布上的运行按钮（或通过触发器启动），观察数据流经各个节点，最终在输出节点查看结果。

高级技巧

并行处理：使用 Wait For All Node 等待多个并行分支（如同时搜索 Google 和 Wikipedia）完成后，再合并数据流。
自定义逻辑：使用 Code Node 编写自定义 JavaScript 代码来处理特定的输入输出逻辑。
复用与分享：完成的 Spell 可导出为 JSON 文件，方便在社区分享或作为子图（Subgraph）嵌入到其他项目中。

版本历史

v0.0.13-72024/11/28

v0.0.13-62024/11/27

v0.0.13-52024/11/27

v0.0.13-42024/11/22

v0.0.13-32024/11/22

v0.0.13-22024/11/22

v0.0.13-12024/11/22

v0.0.13-02024/11/22

v0.0.12-262024/09/17

v0.0.12-252024/09/17

v0.0.12-242024/08/29

v0.0.12-222024/08/28

v0.0.12-232024/08/28

v0.0.12-212024/08/27

v0.0.12-202024/08/27

v0.0.12-192024/08/27

v0.0.12-182024/08/27

v0.0.12-172024/08/27

v0.0.12-152024/08/26

v0.0.12-142024/08/26

常见问题

如何为项目添加新的贡献者？

"Is Variable True"节点对布尔值、字符串和数字的真值判断逻辑是什么？

如何在 Avatar 页面集成 xstate 库并实现 TypeText 流程的单元测试？

Magick IDE 中的缩放灵敏度不如 Figma 或 Photoshop 流畅怎么办？

如何处理 VRM0 和 VRM1 模型的支持及 Mtoon 材质丢失问题？

项目的代码库起源是什么？如何致谢早期的贡献者？

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

★ 349.3k|★★★☆☆|今天

Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|昨天

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 141.5k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 107.9k|★★☆☆☆|今天

开发框架图像Agent

LLMs-from-scratch

LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目，旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型（LLM）。它不仅是同名技术著作的官方代码库，更提供了一套完整的实践方案，涵盖模型开发、预训练及微调的全过程。该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型，却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码，用户能够透彻掌握 Transformer 架构、注意力机制等关键原理，从而真正理解大模型是如何“思考”的。此外，项目还包含了加载大型预训练权重进行微调的代码，帮助用户将理论知识延伸至实际应用。 LLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API，而是渴望探究模型构建细节的技术人员而言，这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计：将复杂的系统工程拆解为清晰的步骤，配合详细的图表与示例，让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础，还是为未来研发更大规模的模型做准备

★ 90.1k|★★★☆☆|今天

语言模型图像Agent

Deep-Live-Cam

Deep-Live-Cam 是一款专注于实时换脸与视频生成的开源工具，用户仅需一张静态照片，即可通过“一键操作”实现摄像头画面的即时变脸或制作深度伪造视频。它有效解决了传统换脸技术流程繁琐、对硬件配置要求极高以及难以实时预览的痛点，让高质量的数字内容创作变得触手可及。这款工具不仅适合开发者和技术研究人员探索算法边界，更因其极简的操作逻辑（仅需三步：选脸、选摄像头、启动），广泛适用于普通用户、内容创作者、设计师及直播主播。无论是为了动画角色定制、服装展示模特替换，还是制作趣味短视频和直播互动，Deep-Live-Cam 都能提供流畅的支持。其核心技术亮点在于强大的实时处理能力，支持口型遮罩（Mouth Mask）以保留使用者原始的嘴部动作，确保表情自然精准；同时具备“人脸映射”功能，可同时对画面中的多个主体应用不同面孔。此外，项目内置了严格的内容安全过滤机制，自动拦截涉及裸露、暴力等不当素材，并倡导用户在获得授权及明确标注的前提下合规使用，体现了技术发展与伦理责任的平衡。

★ 88.9k|★★★☆☆|今天

开发框架图像Agent