Magick
Magick 是一款前沿的可视化人工智能开发环境(AIDE),旨在让用户无需编写代码即可构建复杂的数据管道和多模态智能体。它通过直观的节点式界面,将数据输入、处理变换到最终输出的全过程图形化,解决了传统 AI 开发依赖命令行、门槛高且流程不透明的痛点。
无论是希望快速原型验证的研究人员、需要集成多服务的应用开发者,还是想要探索 AI 可能性的普通创作者,都能利用 Magick 轻松上手。其核心亮点在于独特的“咒语”(Spells)概念,即以标准 JSON 格式存储和共享的数据流图,便于社区协作与复用。系统内置了丰富的功能节点,支持实时智能体自主行动、跨平台社交连接(如 Discord、Twitter)、网络搜索以及语音图像生成等能力。用户只需通过拖拽和连线,就能组合出具备记忆能力和复杂推理逻辑的智能应用,真正让创意低代码落地。
使用场景
一家小型游戏工作室希望为其即将上线的 RPG 游戏快速构建一个能跨平台互动、拥有统一记忆且具备多模态能力的智能 NPC 系统。
没有 Magick 时
- 开发团队需分别编写代码对接 Discord、Twitter 和 Twilio 接口,耗时数周且维护成本极高。
- 难以实现 NPC 在不同平台间的“统一记忆”,导致玩家在推特提问后,NPC 在 Discord 中完全不知情。
- 整合语音生成、图像创作与向量搜索功能需要串联多个独立脚本,调试复杂且极易出错。
- 非技术背景的游戏策划无法参与逻辑调整,任何细微的行为修改都依赖程序员重写代码。
- 缺乏可视化的流程管理,复杂的推理逻辑一旦出错,排查问题如同大海捞针。
使用 Magick 后
- 利用内置的社交连接器,开发者通过拖拽节点即可瞬间打通 Discord 与 Twitter,无需编写底层 API 代码。
- 借助统一的记忆节点,NPC 能自动同步跨平台对话历史,在不同渠道为用户提供连贯的角色扮演体验。
- 通过组合现成的语音、图像生成及向量搜索工具节点,轻松构建出能看图说话、有声有色的多模态智能体。
- 游戏策划可直接在可视化画布上调整"Spells"(数据流),实时修改 NPC 的反应逻辑而无需触碰代码。
- 基于图的 IDE 让复杂的数据流向一目了然,支持子图嵌套与社区模板共享,大幅加速了迭代与排错过程。
Magick 将原本需要全栈开发数月的多模态智能体工程,转化为可视化的积木搭建过程,让创意不再受限于编码能力。
运行环境要求
- Linux
- macOS
- Windows
未说明
未说明

快速开始

Magick是一款突破性的可视化AIDE(人工智能开发环境),专为无代码数据管道和多模态智能体而设计。Magick能够连接到其他服务,并提供适合智能体、聊天机器人、复杂推理系统和拟人化角色的节点与模板。
🗝 核心功能
- 实时智能体:可自主执行动作,在统一的记忆和自我体系下,以多种模态与用户及其他智能体交互。
- 社交平台连接器:支持Discord、Twitter和Twilio——Zoom、Google Meet、Reddit、Slack等连接器即将作为插件推出!
- 支持谷歌、维基百科及语义网搜索。
- 内置多种实用工具,包括语音与图像生成、向量检索等。
- 强大的基于图的IDE,适用于复杂的数据管道。
- 图表可嵌套子图并共享,助力社区快速开发。
🔮 Magick:用AI自动化、构建并实现你的创意。
借助Magick,你无需掌握命令行编程即可释放AI的强大潜力。通过我们的可视化节点式环境,你可以轻松连接热门服务,探索丰富的预构建节点与连接器,将你的愿景变为现实。

▶️ 点击上方图片观看视频
核心概念
法术
法术是一种数据流动的管道,描述数据从一处流向另一处,经过我们称为“节点”的不同处理过程,并通过我们称为“连接”的线路传输。在Magick中,每个图表的数据、节点、变量和预设的集合被称为“法术”。需要注意的是,“法术”并非机器学习领域的术语,我们只是觉得这个名字很有趣。法术可以随时导入导出,其原始格式为JSON,这是一种易于分享的标准格式。
节点
从根本上说,Magick是一个用于接收数据、对其进行处理并最终输出结果的系统。
这种“处理”被称为“转换”,数据会从一种形式转变为另一种形式。而执行转换的“黑盒”则是一个输入任意类型数据、输出任意类型数据的模块。我们称这个进行转换的黑盒为“节点”。节点是Magick的基础构建块。
创建节点
节点可以在“法术”选项卡的编辑窗口中创建。你可以在编辑窗口中右键单击,从上下文菜单中添加节点;也可以直接将“节点”选项卡中的节点拖放到编辑窗口中。此外,还可以通过拖拽来重新排列节点的位置。
要删除节点,只需右键单击该节点并选择“删除”。
节点类型
- 输入节点
- 提示模板
- 代码节点:允许你自定义输入和输出。
- 生成器节点:允许你定义自己的输入端口,并在节点内部处理这些数据。
- 等待所有节点:用于等待多个执行分支完成后再合并为一个分支——这是同时执行多项耗时任务的好方法。
- …还有更多!(如果你有任何建议,请告诉我们)
输入与输出
所有节点都具有输入和/或输出,但不一定同时具备两者。输入和输出以插座的形式直观地显示出来。插座的颜色决定了它可以接收的数据类型,“灰色”表示默认的未指定类型或“任意”类型。
插座
传入插座的数据对节点可用。节点可以对这些数据进行处理,并将结果返回到输出插座。有些节点(如生成器节点)允许你自定义输入端口,然后在节点内部处理这些数据。而另一些节点(如代码节点)则允许你同时定义输入和输出。
触发器
触发器用于启动节点的异步任务。部分节点无需触发器即可处理数据,但大多数节点需要触发器。触发器可以从一个插座发送到多个输入端口,不过执行顺序无法保证。此时可以使用“等待所有”节点来等待各个执行分支完成后再合并为一个分支——这正是同时执行多项耗时任务的理想方式。
⚙️ 安装
请根据你的操作系统选择相应的安装指南,获取详细的设置说明:
每个指南包含以下内容:
- 系统要求与先决条件
- 分步安装说明
- 环境搭建
- 数据库配置
- 故障排除提示
如需更详细的开发文档和架构概述,请参阅:
开发提示
自签名证书
在本地开发时,你可能希望Chrome接受来自localhost的自签名证书。为此,请按照以下步骤操作:
- 打开:
chrome://flags/#allow-insecure-localhost - 启用该功能
贡献者
基于 Latitude Games 的 Thoth
原始源代码由以下 Thoth 贡献者编写,该项目已归档在 这里。
![]() Jakob 💻 |
![]() Sean Gillespie 💻 |
![]() Michael 💻 |
![]() Preston Gull 💻🎨 |
![]() Nick Walton 💻 |
![]() Mitchell Gordon 💻 |
![]() ?/janus 💻 |
![]() Alan Walton 💻 |
来和我们一起构建吧!
我们正在 Discord 上以开放社区的形式共同构建 Magick。如果你对参与这个项目感兴趣,我们非常欢迎你的加入。
立即加入:https://bit.ly/magickdiscordgh

版本历史
v0.0.13-72024/11/28v0.0.13-62024/11/27v0.0.13-52024/11/27v0.0.13-42024/11/22v0.0.13-32024/11/22v0.0.13-22024/11/22v0.0.13-12024/11/22v0.0.13-02024/11/22v0.0.12-262024/09/17v0.0.12-252024/09/17v0.0.12-242024/08/29v0.0.12-222024/08/28v0.0.12-232024/08/28v0.0.12-212024/08/27v0.0.12-202024/08/27v0.0.12-192024/08/27v0.0.12-182024/08/27v0.0.12-172024/08/27v0.0.12-152024/08/26v0.0.12-142024/08/26常见问题
相似工具推荐
openclaw
OpenClaw 是一款专为个人打造的本地化 AI 助手,旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚,能够直接接入你日常使用的各类通讯渠道,包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息,OpenClaw 都能即时响应,甚至支持在 macOS、iOS 和 Android 设备上进行语音交互,并提供实时的画布渲染功能供你操控。 这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地,用户无需依赖云端服务即可享受快速、私密的智能辅助,真正实现了“你的数据,你做主”。其独特的技术亮点在于强大的网关架构,将控制平面与核心助手分离,确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者,以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力(支持 macOS、Linux 及 Windows WSL2),即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你
stable-diffusion-webui
stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。
everything-claude-code
everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上
ComfyUI
ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。
LLMs-from-scratch
LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目,旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型(LLM)。它不仅是同名技术著作的官方代码库,更提供了一套完整的实践方案,涵盖模型开发、预训练及微调的全过程。 该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型,却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码,用户能够透彻掌握 Transformer 架构、注意力机制等关键原理,从而真正理解大模型是如何“思考”的。此外,项目还包含了加载大型预训练权重进行微调的代码,帮助用户将理论知识延伸至实际应用。 LLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API,而是渴望探究模型构建细节的技术人员而言,这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计:将复杂的系统工程拆解为清晰的步骤,配合详细的图表与示例,让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础,还是为未来研发更大规模的模型做准备
Deep-Live-Cam
Deep-Live-Cam 是一款专注于实时换脸与视频生成的开源工具,用户仅需一张静态照片,即可通过“一键操作”实现摄像头画面的即时变脸或制作深度伪造视频。它有效解决了传统换脸技术流程繁琐、对硬件配置要求极高以及难以实时预览的痛点,让高质量的数字内容创作变得触手可及。 这款工具不仅适合开发者和技术研究人员探索算法边界,更因其极简的操作逻辑(仅需三步:选脸、选摄像头、启动),广泛适用于普通用户、内容创作者、设计师及直播主播。无论是为了动画角色定制、服装展示模特替换,还是制作趣味短视频和直播互动,Deep-Live-Cam 都能提供流畅的支持。 其核心技术亮点在于强大的实时处理能力,支持口型遮罩(Mouth Mask)以保留使用者原始的嘴部动作,确保表情自然精准;同时具备“人脸映射”功能,可同时对画面中的多个主体应用不同面孔。此外,项目内置了严格的内容安全过滤机制,自动拦截涉及裸露、暴力等不当素材,并倡导用户在获得授权及明确标注的前提下合规使用,体现了技术发展与伦理责任的平衡。

































