Unity-Skills

705 96 简单 1 次阅读今天MIT图像插件Agent语言模型开发框架其他

AI 解读由 AI 自动生成，仅供参考

Unity-Skills 是一款专为 Unity 引擎打造的 AI 自动化技能库，旨在让大语言模型直接通过 REST API 操控 Unity 编辑器。它解决了传统 AI 辅助开发中“只能写代码、无法直接操作场景”的痛点，实现了从编写脚本到直接创建物体、配置材质灯光及构建场景的全流程自动化。

该工具特别适合 Unity 游戏开发者、技术美术以及希望提升工作流效率的研究人员使用。无论是需要 AI 辅助编写 C# 代码的半自动模式，还是希望 AI 直接执行复杂场景搭建的全自动模式，用户都能灵活切换。

Unity-Skills 的核心亮点在于其庞大的功能储备与高稳定性：内置 513 个预定义技能，覆盖 14 类设计咨询模块；支持事务性原子操作，确保失败时自动回滚以保障场景安全；具备防幻觉机制，有效避免调用不存在的命令。此外，它还原生支持 Claude Code、Antigravity 等主流 AI 终端，并允许同时控制多个 Unity 实例，为现代游戏开发提供了强大且可靠的智能助手。

使用场景

某游戏工作室的技术美术正在为一款开放世界 RPG 快速搭建包含数百个动态光源和交互道具的复杂夜间场景。

没有 Unity-Skills 时

重复劳动繁重：手动放置并配置数百个路灯、火把及阴影参数，耗时数小时且极易因疲劳产生遗漏。
试错成本高昂：调整全局光照策略时，一旦脚本编译失败或操作失误，往往导致场景状态损坏，需手动回滚或重新加载备份。
多项目协同困难：同时维护多个关卡实例时，无法同步执行批量修改，必须在不同编辑器窗口间反复切换操作。
AI 指令不可靠：直接让 AI 生成 C# 代码常出现幻觉，调用不存在的 API 或参数错误，导致开发者需花费大量时间调试而非创作。

使用 Unity-Skills 后

全自动场景构建：通过“全自动模式”直接下达指令，Unity-Skills 利用内置的 513 项技能在分钟内完成所有物体的创建、材质赋予及灯光烘焙设置。
原子化事务保障：依托其事务原子性机制，任何步骤失败均自动回滚至安全状态，确保场景始终干净可用，彻底消除脏数据风险。
多实例并发控制：利用自动端口发现功能，一次性向多个正在运行的 Unity 项目发送指令，实现跨关卡的批量资源更新与同步。
防幻觉精准执行：内置的路由规则与“禁止列表”有效拦截无效命令，确保 AI 对 Unity 引擎的直接操控准确无误，无需人工二次校验代码。

Unity-Skills 将原本繁琐易错的机械性场景搭建工作，转化为安全、精准且可并发的自然语言交互流程，极大释放了开发者的创造力。

运行环境要求

操作系统

Windows
macOS
Linux

GPU

未说明

内存

未说明

依赖

notes该工具是运行在 Unity 编辑器内的插件，核心依赖是 Unity 2022.3 或更高版本（官方维护基线），未来将聚焦 Unity 6。它通过 REST API 与外部 AI 终端（如 Claude Code, Antigravity 等）通信，自身不直接依赖特定的 Python 版本、GPU 或深度学习框架。安装方式支持通过 Unity Package Manager (UPM) 添加 Git URL，并提供一键安装脚本将技能文件配置到对应的 AI 终端目录中。

python未说明

Unity 2022.3+

Claude Code

Antigravity

Gemini CLI

OpenAI Codex

快速开始

🎮 UnitySkills

Unity-Skills

基于 REST API 的 AI 驱动 Unity 编辑器自动化引擎
让 AI 通过 Skills 直接控制 Unity 场景

🎉 我们现已收录于 DeepWiki！
有问题？请查看 AI 生成的文档 →

当前官方维护基线为 Unity 2022.3+。代码库中可能仍保留部分 Unity 2021 的兼容逻辑，但未来的功能开发、回归测试及适配工作将聚焦于 2022.3+ / Unity 6。

🤝 致谢

本项目是在 unity-mcp 优秀理念基础上进行的深度重构与功能扩展。

🚀 核心特性

🛠️ 513 个 REST Skills 综合工具包：包含 14 个辅助设计模块，支持多对象批量操作。
🎛️ 双模式灵活性：可根据不同工作流程在半自动（代码优先）和全自动（直接操控）之间切换。
🤖 原生支持四大 IDE：Claude Code / Antigravity / Gemini CLI / Codex — 一键安装即用。
🛡️ 事务原子性：失败操作会自动回滚，确保场景干净安全。
🌍 多实例同时控制：自动端口发现与全局注册，可同时控制多个 Unity 项目。
🔗 超稳定长连接：可配置请求超时时间（默认 15 分钟），Domain Reload 后自动恢复，并在脚本编译或资源更新期间提供重试提示。
🛡️ 防幻觉护栏：每个 Skill 模块都包含禁止列表和路由规则，以防止调用不存在的命令或参数错误。

🎛️ 运行模式

模式	默认	可用技能	使用场景
半自动	✅	~80	AI 编写 C# 代码 + 轻量级 Skills 辅助（脚本、感知、场景、编辑器、资源、工作流、调试）
全自动	—	全部 513	AI 直接操控 Unity（创建对象、配置材质/灯光/UI、构建场景）

如何切换：

→ 全自动："full auto" / "full-auto mode" / "build the scene for me" / "directly manipulate Unity"
→ 半自动："semi-auto" / "code-first" — 每次新会话默认为半自动模式

14 个辅助设计模块（架构、性能、设计模式、可测试性等）在两种模式下均可使用，并按需加载。

🏗️ 支持快速安装的 IDE/终端

本项目已针对以下环境进行了深度优化，以确保持续稳定的开发体验（未列出的工具并不一定不支持——只是缺少快速安装程序；可使用 自定义安装 将其部署到相应目录）：

AI 终端	支持状态	特色功能
Antigravity	✅ 已支持	支持 `/unity-skills` 斜杠命令，与原生工作流无缝集成。
Claude Code	✅ 已支持	智能识别 Skill 意图，支持复杂的多步骤自动化。
Gemini CLI	✅ 已支持	实验性支持，适配最新的 `experimental.skills` 规范。
Codex	✅ 已支持	支持 `$skill` 显式调用及隐式意图识别。

🏁 快速入门

概览：安装 Unity 插件 → 启动 UnitySkills 服务器 → AI 使用 Skills

一键安装演示

1. 安装 Unity 插件

通过 Unity 包管理器，使用 Git URL 添加：

稳定版（main）：

https://github.com/Besty0728/Unity-Skills.git?path=/SkillsForUnity

测试版（beta）：

https://github.com/Besty0728/Unity-Skills.git?path=/SkillsForUnity#beta

指定版本（如 v1.6.0）：

https://github.com/Besty0728/Unity-Skills.git?path=/SkillsForUnity#v1.6.0

📦 所有版本包均可在 Releases 页面获取。

2. 启动服务器

在 Unity 中，点击菜单：Window > UnitySkills > Start Server

⏳ script_*、debug_force_recompile、debug_set_defines、部分资源重新导入以及包变更可能会触发编译或 Domain Reload。在此期间 REST 接口暂时不可用属正常现象，请稍候再试。

3. 一键配置 AI Skills

打开 Window > UnitySkills > Skill Installer。
选择对应终端图标（Claude / Antigravity / Gemini / Codex）。
点击 "Install" 即完成环境配置，无需手动复制代码。

安装程序会将包中的 unity-skills~/ 模板目录复制到目标位置。

安装程序生成的文件（位于目标目录）：

SKILL.md

skills/

references/

scripts/unity_skills.py

scripts/agent_config.json（包含 Agent 标识符）

Antigravity 还会额外生成 workflows/unity-skills.md

Codex 注意事项：建议进行 全局安装。若在项目级别安装，则需在 AGENTS.md 中声明才能被识别；全局安装后，重启 Codex 即可使用。

📘 完整的安装与使用说明，请参阅：Setup Guide | 安装指南

4. 手动安装 Skills（可选）

若不支持或更倾向于手动安装，请按照以下 标准流程 进行部署（适用于所有支持 Skills 的工具）：

✅ 标准安装方法 A

自定义安装：在安装界面中，选择“Custom Path”选项，将 Skills 安装到您指定的任意目录（如 Assets/MyTools/AI），以便于项目管理。

✅ 标准安装方法 B

定位 Skills 源目录：UPM 包中的 SkillsForUnity/unity-skills~/ 目录是可分发的 Skills 模板（根目录包含 SKILL.md）。
找到工具的 Skills 根目录：不同工具的路径可能不同，请先参考该工具的文档。
完整复制：将 unity-skills~/ 的全部内容复制到工具的 Skills 根目录中（重命名为 unity-skills/）。
创建 agent_config.json：在 unity-skills/scripts/ 目录下创建一个 agent_config.json 文件：
```
{"agentId": "your-agent-name", "installedAt": "2026-02-11T00:00:00Z"}
```
将 your-agent-name 替换为你的 AI 工具名称（例如 claude-code、antigravity、gemini-cli、codex）。
目录结构要求：复制完成后，保持如下结构（示例）：
- unity-skills/SKILL.md
- unity-skills/skills/
- unity-skills/references/
- unity-skills/scripts/unity_skills.py
- unity-skills/scripts/agent_config.json
重启工具：让工具重新加载 Skills 列表。
验证加载：在工具中触发 Skills 列表或命令（或执行一个简单的技能调用），以确认其可用性。

🔎 常见工具目录参考

以下是一些经过验证的默认目录（如果工具配置了自定义路径，则使用自定义路径）：

Claude Code：~/.claude/skills/
Antigravity：~/.agent/skills/
Gemini CLI：~/.gemini/skills/
OpenAI Codex：~/.codex/skills/

🧩 其他支持 Skills 的工具

如果你使用的是其他支持 Skills 的工具，请按照该工具文档中指定的 Skills 根目录进行安装。只要满足 标准安装规范（根目录包含 SKILL.md 并保持 skills/、references/ 和 scripts/ 结构），就能被正确识别。

📦 Skills 分类概览（513 个）

分类	数量	核心功能
Cinemachine	23	2.x/3.x 双版本自动安装/MixingCamera/ClearShot/TargetGroup/Spline
工作流	22	持久化历史/任务快照/会话级撤销/回滚/书签
材质	21	批量修改材质属性/HDR/PBR/发光/关键词/渲染队列
GameObject	18	创建/查找/变换同步/批量操作/层级管理/重命名/复制
场景	10	多场景加载/卸载/激活/截图/上下文/依赖分析/报告导出
UI 系统	16	Canvas/按钮/文本/滑块/切换开关/锚点/布局/对齐/分布
UI Toolkit	15	UXML/USS 文件管理/UIDocument/PanelSettings 全属性读写/模板生成/结构检查/批量创建
资源	11	资源导入/删除/移动/复制/搜索/文件夹/批量操作/刷新
编辑器	12	播放模式/选择/撤销-重做/上下文获取/菜单执行
Timeline	12	轨道创建/删除/剪辑管理/播放控制/绑定/时长
物理	12	射线检测/球形检测/盒形检测/物理材质/层碰撞矩阵
音频	10	音频导入设置/AudioSource/AudioClip/AudioMixer/批量
纹理	10	纹理导入设置/平台设置/Sprite/类型/大小搜索/批量
模型	10	模型导入设置/网格信息/材质映射/动画/骨骼/批量
脚本	12	C# 脚本创建/读取/替换/列表/信息/重命名/移动/分析
包	11	包管理/安装/移除/搜索/版本/依赖关系/Cinemachine/Splines
AssetImport	11	纹理/模型/音频/Sprite 导入设置/标签管理/重新导入
项目	11	渲染管线/构建设置/包管理/层/标签/PlayerSettings/质量
着色器	11	着色器创建/URP 模板/编译检查/关键词/变体分析/全局关键词
相机	11	场景视图控制/游戏摄像机创建/属性/截图/正交切换/列表
地形	10	地形创建/高度图/珀林噪声/平滑/平整/纹理绘制
NavMesh	10	打包/路径计算/代理/障碍物/采样/区域成本
清理	10	未使用的资源/重复文件/空文件夹/缺失脚本修复/依赖树
ScriptableObject	10	创建/读写/批量设置/删除/查找/JSON 导入导出
控制台	10	日志捕获/清除/导出/统计/暂停控制/折叠/播放时清空
调试	10	错误日志/编译检查/堆栈跟踪/程序集/定义符号/内存信息
事件	10	UnityEvent 监听器管理/批量添加/复制/状态控制/列表
智能	10	场景 SQL 查询/空间查询/自动布局/吸附地面/网格吸附/随机化/替换
测试	10	测试运行/按名称运行/分类/模板创建/汇总统计
预制件	11	创建/实例化/覆盖应用与撤销/批量实例化/变体/查找实例/资源属性编辑
组件	10	添加/删除/属性配置/批量操作/复制/启用-禁用
优化	10	纹理压缩/网格压缩/音频压缩/场景分析/静态标志/LOD/重复材质/过度绘制
性能分析器	10	FPS/内存/纹理/网格/材质/音频/渲染统计/对象数量/AssetBundle
灯光	10	灯光创建/类型配置/强度-颜色/批量切换/探头组/反射探头/光照贴图
验证	10	项目验证/空文件夹清理/引用检测/网格碰撞器/着色器错误
Animator	10	动画控制器/参数/状态机/过渡/分配/播放
感知	11	场景摘要/层级树/脚本分析/空间查询/材质概览/场景快照/依赖分析/报告导出/性能提示/脚本依赖图
示例	8	基础示例：创建/删除/变换/场景信息

⚠️ 大多数模块都支持 *_batch 批量操作。在操作多个对象时，优先使用批量 Skills 以获得更好的性能。

🧠 unity-skills/skills/ 还包含 14 个设计建议模块，用于架构、脚本设计、性能、可维护性以及 Inspector 指导。

📂 项目结构

.
├── SkillsForUnity/                 # Unity 编辑器插件（UPM 包）
│   ├── package.json                # com.besty.unity-skills
│   ├── unity-skills~/              # 跨平台 AI 技能模板（带波浪号的隐藏目录，随包打包）
│   │   ├── SKILL.md                # 主要技能定义（AI 可读）
│   │   ├── scripts/
│   │   │   └── unity_skills.py     # Python 客户端库
│   │   ├── skills/                 # 模块化技能文档 + 13 个辅助模块
│   │   └── references/             # Unity 开发参考资料
│   └── Editor/Skills/              # 核心技能逻辑（40 个 Skills.cs 文件，共 513 个技能）
│       ├── SkillsHttpServer.cs     # HTTP 服务器核心（生产者-消费者模型）
│       ├── SkillRouter.cs          # 请求路由与基于反射的技能发现
│       ├── WorkflowManager.cs      # 持久化工作流（任务/会话/快照）
│       ├── RegistryService.cs      # 全局注册中心（多实例发现）
│       ├── GameObjectFinder.cs     # 统一的游戏对象查找器（按名称/实例ID/路径）
│       ├── BatchExecutor.cs        # 通用批处理框架
│       ├── GameObjectSkills.cs     # 游戏对象操作（18 个技能）
│       ├── MaterialSkills.cs       # 材质操作（21 个技能）
│       ├── CinemachineSkills.cs    # Cinemachine 2.x/3.x（23 个技能）
│       ├── WorkflowSkills.cs       # 工作流撤销/回滚（22 个技能）
│       ├── PerceptionSkills.cs     # 场景理解（11 个技能）
│       └── ...                     # 共 513 个技能的源代码
├── docs/
│   └── SETUP_GUIDE.md              # 完整的设置与使用指南
├── CHANGELOG.md                    # 版本更新日志
└── LICENSE                         # MIT 许可证

⭐ 星标历史

📄 许可证

本项目采用 MIT 许可证。

Unity-Skills 快速上手指南

Unity-Skills 是一个基于 REST API 的 AI 驱动 Unity 编辑器自动化引擎，允许 AI 通过技能（Skills）直接控制 Unity 场景。支持半自动（代码优先）和全自动（直接操作）两种模式，内置 513+ 个原子化技能。

🛠️ 环境准备

Unity 版本：官方维护基准为 Unity 2022.3+ 或 Unity 6。
- 注：虽然部分代码兼容 Unity 2021，但新功能与测试均针对 2022.3+ 优化。
AI 终端工具（任选其一）：
- Claude Code
- Antigravity
- Gemini CLI
- OpenAI Codex
网络环境：需确保能访问 GitHub 以拉取插件包。

📦 安装步骤

1. 在 Unity 中安装插件

打开 Unity 项目，进入 Window > Package Manager：

点击左上角 + 号，选择 Add package from git URL...。

输入以下地址并点击 Add：

稳定版 (推荐):

https://github.com/Besty0728/Unity-Skills.git?path=/SkillsForUnity

测试版 (Beta):

https://github.com/Besty0728/Unity-Skills.git?path=/SkillsForUnity#beta

指定版本 (例如 v1.6.0):

https://github.com/Besty0728/Unity-Skills.git?path=/SkillsForUnity#v1.6.0

2. 启动 UnitySkills 服务

在 Unity 编辑器顶部菜单栏点击： Window > UnitySkills > Start Server

⚠️ 注意：首次启动或涉及脚本编译、资源导入时，可能会触发 Domain Reload，导致 REST 服务暂时不可用，请稍等片刻后重试。

3. 配置 AI 终端 (一键安装)

在 Unity 中点击菜单： Window > UnitySkills > Skill Installer

在弹出的窗口中，选择你正在使用的 AI 终端图标（Claude / Antigravity / Gemini / Codex）。
点击 Install 按钮。
系统将自动把技能模板复制到对应终端的技能目录，并生成配置文件 agent_config.json。

Codex 用户特别提示：建议进行全局安装。若选择项目级安装，需在项目根目录的 AGENTS.md 中声明才能被识别。安装完成后请重启 Codex 终端。

(若一键安装失败，可参考原文档中的“手动安装”部分，将 unity-skills~/ 目录内容手动复制到对应终端的 skills 根目录，如 ~/.claude/skills/)

🚀 基本使用

切换运行模式

Unity-Skills 默认启动为 半自动模式 (Semi-Auto)，AI 主要编写 C# 代码辅助操作。如需让 AI 直接操控编辑器，可在对话中发送指令切换：

切换至全自动模式 (直接使用 513+ 技能)：

"full auto" 或 "build the scene for me"
切换回半自动模式 (代码优先)：

"semi-auto" 或 "code-first"

使用示例

假设你已启动服务器并完成配置，在 AI 终端中输入以下自然语言指令：

示例 1：创建场景物体 (全自动模式)

请在场景中心创建一个红色的立方体，并添加一个旋转动画。

AI 将直接调用 GameObject 和 Timeline 相关技能执行操作，无需你写代码。

示例 2：批量修改材质 (全自动模式)

选中场景中所有使用 Standard Shader 的材质，将它们的金属度 (Metallic) 统一调整为 0.8。

AI 将调用 Material 批处理技能完成修改。

示例 3：查询与清理 (通用)

检查项目中是否有未使用的资源文件，并列出列表。

AI 将调用 Cleaner 模块进行分析。

更多详细技能列表与高级配置，请参阅项目文档中的 Setup Guide。

版本历史

v1.6.92026/04/03

v1.6.82026/04/03

v1.6.72026/04/02

v1.6.62026/03/26

v1.6.52026/03/22

v1.6.42026/03/17

v1.6.32026/03/15

v1.6.22026/03/13

v1.6.12026/03/09

v1.6.02026/03/07

v1.5.52026/03/05

v1.5.42026/03/03

v1.5.32026/03/01

v1.5.22026/02/25

v1.5.12026/02/16

v1.5.02026/02/13

v1.4.42026/02/11

v1.4.32026/02/09

v1.4.22026/02/08

v1.4.12026/02/05

常见问题

安装插件后编译报错，提示 'PanelSettings' 不包含 'referenceSpritePixelsPerUnit' 或 'textureSlotCount' 定义怎么办？

AI 调用 gameobject_create 创建子物体时，设置了 parentName 参数但父子关系未生效怎么办？

为什么调用 console_get_logs 或 debug_get_logs 无法读取到 Unity Console 中已有的历史日志？

打开 Unity Skills 窗口或点击 Start Server 时报错找不到 'JetBrains.Annotations' 程序集怎么办？

项目文档是中文的，非中文用户如何获取帮助或使用该插件？

该插件是否支持 Windsurf 编辑器？

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

★ 349.3k|★★★☆☆|4天前

Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|5天前

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 148.6k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 108.1k|★★☆☆☆|2天前

开发框架图像Agent

gemini-cli

gemini-cli 是一款由谷歌推出的开源 AI 命令行工具，它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言，它提供了一条从输入提示词到获取模型响应的最短路径，无需切换窗口即可享受智能辅助。这款工具主要解决了开发过程中频繁上下文切换的痛点，让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用，还是执行复杂的 Git 操作，gemini-cli 都能通过自然语言指令高效处理。它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口，具备出色的逻辑推理能力；内置 Google 搜索、文件操作及 Shell 命令执行等实用工具；更独特的是，它支持 MCP（模型上下文协议），允许用户灵活扩展自定义集成，连接如图像生成等外部能力。此外，个人谷歌账号即可享受免费的额度支持，且项目基于 Apache 2.0 协议完全开源，是提升终端工作效率的理想助手。

★ 100.8k|★★☆☆☆|今天

插件Agent图像

markitdown

MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器

★ 93.4k|★★☆☆☆|3天前

插件开发框架