Magick

GitHub
835 136 较难 1 次阅读 今天NOASSERTION语言模型开发框架图像Agent
AI 解读 由 AI 自动生成,仅供参考

Magick 是一款前沿的可视化人工智能开发环境(AIDE),旨在让用户无需编写代码即可构建复杂的数据管道和多模态智能体。它通过直观的节点式界面,将数据输入、处理变换到最终输出的全过程图形化,解决了传统 AI 开发依赖命令行、门槛高且流程不透明的痛点。

无论是希望快速原型验证的研究人员、需要集成多服务的应用开发者,还是想要探索 AI 可能性的普通创作者,都能利用 Magick 轻松上手。其核心亮点在于独特的“咒语”(Spells)概念,即以标准 JSON 格式存储和共享的数据流图,便于社区协作与复用。系统内置了丰富的功能节点,支持实时智能体自主行动、跨平台社交连接(如 Discord、Twitter)、网络搜索以及语音图像生成等能力。用户只需通过拖拽和连线,就能组合出具备记忆能力和复杂推理逻辑的智能应用,真正让创意低代码落地。

使用场景

一家小型游戏工作室希望为其即将上线的 RPG 游戏快速构建一个能跨平台互动、拥有统一记忆且具备多模态能力的智能 NPC 系统。

没有 Magick 时

  • 开发团队需分别编写代码对接 Discord、Twitter 和 Twilio 接口,耗时数周且维护成本极高。
  • 难以实现 NPC 在不同平台间的“统一记忆”,导致玩家在推特提问后,NPC 在 Discord 中完全不知情。
  • 整合语音生成、图像创作与向量搜索功能需要串联多个独立脚本,调试复杂且极易出错。
  • 非技术背景的游戏策划无法参与逻辑调整,任何细微的行为修改都依赖程序员重写代码。
  • 缺乏可视化的流程管理,复杂的推理逻辑一旦出错,排查问题如同大海捞针。

使用 Magick 后

  • 利用内置的社交连接器,开发者通过拖拽节点即可瞬间打通 Discord 与 Twitter,无需编写底层 API 代码。
  • 借助统一的记忆节点,NPC 能自动同步跨平台对话历史,在不同渠道为用户提供连贯的角色扮演体验。
  • 通过组合现成的语音、图像生成及向量搜索工具节点,轻松构建出能看图说话、有声有色的多模态智能体。
  • 游戏策划可直接在可视化画布上调整"Spells"(数据流),实时修改 NPC 的反应逻辑而无需触碰代码。
  • 基于图的 IDE 让复杂的数据流向一目了然,支持子图嵌套与社区模板共享,大幅加速了迭代与排错过程。

Magick 将原本需要全栈开发数月的多模态智能体工程,转化为可视化的积木搭建过程,让创意不再受限于编码能力。

运行环境要求

操作系统
  • Linux
  • macOS
  • Windows
GPU

未说明

内存

未说明

依赖
notesREADME 中未直接列出具体的硬件配置、Python 版本或依赖库列表。详细的环境要求(包括系统先决条件、数据库配置等)需参考项目文档中针对各操作系统的具体安装指南(docs/installation/)。该工具是一个基于节点的可视化 AI 开发环境,支持连接 Discord、Twitter 等服务,并包含语音和图像生成等功能。本地开发时若使用 Chrome 浏览器,可能需要启用‘允许不安全的 localhost'标志以接受自签名证书。
python未说明
Magick hero image

快速开始

加入Discord 在Twitter上关注 在LinkedIn上关注 在YouTube上订阅

Magick是一款突破性的可视化AIDE(人工智能开发环境),专为无代码数据管道和多模态智能体而设计。Magick能够连接到其他服务,并提供适合智能体、聊天机器人、复杂推理系统和拟人化角色的节点与模板。

🗝 核心功能

  • 实时智能体:可自主执行动作,在统一的记忆和自我体系下,以多种模态与用户及其他智能体交互。
  • 社交平台连接器:支持Discord、Twitter和Twilio——Zoom、Google Meet、Reddit、Slack等连接器即将作为插件推出!
  • 支持谷歌、维基百科及语义网搜索。
  • 内置多种实用工具,包括语音与图像生成、向量检索等。
  • 强大的基于图的IDE,适用于复杂的数据管道。
  • 图表可嵌套子图并共享,助力社区快速开发。

🔮 Magick:用AI自动化、构建并实现你的创意。

借助Magick,你无需掌握命令行编程即可释放AI的强大潜力。通过我们的可视化节点式环境,你可以轻松连接热门服务,探索丰富的预构建节点与连接器,将你的愿景变为现实。

Magick - AI for Mere Mortals
▶️ 点击上方图片观看视频

核心概念

法术

法术是一种数据流动的管道,描述数据从一处流向另一处,经过我们称为“节点”的不同处理过程,并通过我们称为“连接”的线路传输。在Magick中,每个图表的数据、节点、变量和预设的集合被称为“法术”。需要注意的是,“法术”并非机器学习领域的术语,我们只是觉得这个名字很有趣。法术可以随时导入导出,其原始格式为JSON,这是一种易于分享的标准格式。

节点

从根本上说,Magick是一个用于接收数据、对其进行处理并最终输出结果的系统。

这种“处理”被称为“转换”,数据会从一种形式转变为另一种形式。而执行转换的“黑盒”则是一个输入任意类型数据、输出任意类型数据的模块。我们称这个进行转换的黑盒为“节点”。节点是Magick的基础构建块。

创建节点

节点可以在“法术”选项卡的编辑窗口中创建。你可以在编辑窗口中右键单击,从上下文菜单中添加节点;也可以直接将“节点”选项卡中的节点拖放到编辑窗口中。此外,还可以通过拖拽来重新排列节点的位置。

要删除节点,只需右键单击该节点并选择“删除”。

节点类型

  • 输入节点
  • 提示模板
  • 代码节点:允许你自定义输入和输出。
  • 生成器节点:允许你定义自己的输入端口,并在节点内部处理这些数据。
  • 等待所有节点:用于等待多个执行分支完成后再合并为一个分支——这是同时执行多项耗时任务的好方法。
  • …还有更多!(如果你有任何建议,请告诉我们)

输入与输出

所有节点都具有输入和/或输出,但不一定同时具备两者。输入和输出以插座的形式直观地显示出来。插座的颜色决定了它可以接收的数据类型,“灰色”表示默认的未指定类型或“任意”类型。

插座

传入插座的数据对节点可用。节点可以对这些数据进行处理,并将结果返回到输出插座。有些节点(如生成器节点)允许你自定义输入端口,然后在节点内部处理这些数据。而另一些节点(如代码节点)则允许你同时定义输入和输出。

触发器

触发器用于启动节点的异步任务。部分节点无需触发器即可处理数据,但大多数节点需要触发器。触发器可以从一个插座发送到多个输入端口,不过执行顺序无法保证。此时可以使用“等待所有”节点来等待各个执行分支完成后再合并为一个分支——这正是同时执行多项耗时任务的理想方式。


⚙️ 安装

请根据你的操作系统选择相应的安装指南,获取详细的设置说明:

每个指南包含以下内容:

  • 系统要求与先决条件
  • 分步安装说明
  • 环境搭建
  • 数据库配置
  • 故障排除提示

如需更详细的开发文档和架构概述,请参阅:

开发提示

自签名证书

在本地开发时,你可能希望Chrome接受来自localhost的自签名证书。为此,请按照以下步骤操作:

  1. 打开:chrome://flags/#allow-insecure-localhost
  2. 启用该功能

贡献者

所有贡献者

Michael
Michael

💻 📦 💼
M̵̞̗̝̼̅̏̎͝Ȯ̴̝̻̊̃̋̀Õ̷̼͋N̸̩̿͜ ̶̜̠̹̼̩͒
M̵̞̗̝̼̅̏̎͝Ȯ̴̝̻̊̃̋̀Õ̷̼͋N̸̩̿͜ ̶̜̠̹̼̩͒

💻 📦
alextitonis
alextitonis

💻
Daniel Adams
Daniel Adams

💻
Anthony Burchell
Anthony Burchell

💻 📝
jin
jin

📝
Shivaditya Shivganesh
Shivaditya Shivganesh

💻
khalildh
khalildh

💻
Pigloo
Pigloo

💻
avirtualfuture
avirtualfuture

💻 📖
Alexandre Ferreira
Alexandre Ferreira

💻
Matei Anghel
Matei Anghel

💻
Trentalantar
Trentalantar

📖
Lisa Mega Watts
Lisa Mega Watts

📖
r2
r2

📖
IRANKUNDA Fabrice
IRANKUNDA Fabrice

💻
Kien Nguyen
Kien Nguyen

💻
Ben Moore
Ben Moore

💻
Q
Q

💻
thomageanderson
thomageanderson

💻
Pietro
Pietro

💻
codingsh
codingsh

💻
Ben Botwin
Ben Botwin

💻 📦
K. S. Ernest (iFire) Lee
K. S. Ernest (iFire) Lee

💻
coffeeorgreentea
coffeeorgreentea

💻 🚇 💼
Knar
Knar

💻
Emmy NSABIMANA
Emmy NSABIMANA

💻

基于 Latitude Games 的 Thoth

原始源代码由以下 Thoth 贡献者编写,该项目已归档在 这里

Jakob
Jakob

💻
Sean Gillespie
Sean Gillespie

💻
Michael
Michael

💻
Preston Gull
Preston Gull

💻🎨
Nick Walton
Nick Walton

💻
Mitchell Gordon
Mitchell Gordon

💻
?/janus
?/janus

💻
Alan Walton
Alan Walton

💻

来和我们一起构建吧!

我们正在 Discord 上以开放社区的形式共同构建 Magick。如果你对参与这个项目感兴趣,我们非常欢迎你的加入。

立即加入:https://bit.ly/magickdiscordgh

版本历史

v0.0.13-72024/11/28
v0.0.13-62024/11/27
v0.0.13-52024/11/27
v0.0.13-42024/11/22
v0.0.13-32024/11/22
v0.0.13-22024/11/22
v0.0.13-12024/11/22
v0.0.13-02024/11/22
v0.0.12-262024/09/17
v0.0.12-252024/09/17
v0.0.12-242024/08/29
v0.0.12-222024/08/28
v0.0.12-232024/08/28
v0.0.12-212024/08/27
v0.0.12-202024/08/27
v0.0.12-192024/08/27
v0.0.12-182024/08/27
v0.0.12-172024/08/27
v0.0.12-152024/08/26
v0.0.12-142024/08/26

常见问题

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手,旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚,能够直接接入你日常使用的各类通讯渠道,包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息,OpenClaw 都能即时响应,甚至支持在 macOS、iOS 和 Android 设备上进行语音交互,并提供实时的画布渲染功能供你操控。 这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地,用户无需依赖云端服务即可享受快速、私密的智能辅助,真正实现了“你的数据,你做主”。其独特的技术亮点在于强大的网关架构,将控制平面与核心助手分离,确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者,以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力(支持 macOS、Linux 及 Windows WSL2),即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

349.3k|★★★☆☆|今天
Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。

162.1k|★★★☆☆|昨天
开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上

141.5k|★★☆☆☆|今天
开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。

107.9k|★★☆☆☆|今天
开发框架图像Agent

LLMs-from-scratch

LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目,旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型(LLM)。它不仅是同名技术著作的官方代码库,更提供了一套完整的实践方案,涵盖模型开发、预训练及微调的全过程。 该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型,却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码,用户能够透彻掌握 Transformer 架构、注意力机制等关键原理,从而真正理解大模型是如何“思考”的。此外,项目还包含了加载大型预训练权重进行微调的代码,帮助用户将理论知识延伸至实际应用。 LLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API,而是渴望探究模型构建细节的技术人员而言,这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计:将复杂的系统工程拆解为清晰的步骤,配合详细的图表与示例,让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础,还是为未来研发更大规模的模型做准备

90.1k|★★★☆☆|今天
语言模型图像Agent

Deep-Live-Cam

Deep-Live-Cam 是一款专注于实时换脸与视频生成的开源工具,用户仅需一张静态照片,即可通过“一键操作”实现摄像头画面的即时变脸或制作深度伪造视频。它有效解决了传统换脸技术流程繁琐、对硬件配置要求极高以及难以实时预览的痛点,让高质量的数字内容创作变得触手可及。 这款工具不仅适合开发者和技术研究人员探索算法边界,更因其极简的操作逻辑(仅需三步:选脸、选摄像头、启动),广泛适用于普通用户、内容创作者、设计师及直播主播。无论是为了动画角色定制、服装展示模特替换,还是制作趣味短视频和直播互动,Deep-Live-Cam 都能提供流畅的支持。 其核心技术亮点在于强大的实时处理能力,支持口型遮罩(Mouth Mask)以保留使用者原始的嘴部动作,确保表情自然精准;同时具备“人脸映射”功能,可同时对画面中的多个主体应用不同面孔。此外,项目内置了严格的内容安全过滤机制,自动拦截涉及裸露、暴力等不当素材,并倡导用户在获得授权及明确标注的前提下合规使用,体现了技术发展与伦理责任的平衡。

88.9k|★★★☆☆|今天
开发框架图像Agent