openclaw-master-skills

GitHub
1.9k 289 简单 1 次阅读 今天MITAgent
AI 解读 由 AI 自动生成,仅供参考

openclaw-master-skills 是一个由 MyClaw.ai 维护的精选技能库,汇集了 560 多个高质量的 OpenClaw 技能模块,并坚持每周更新。它旨在解决 AI 智能体在落地应用中“能力单一”和“开发重复造轮子”的痛点,为用户提供了一站式的功能扩展方案。无论是需要自动化执行网页浏览、深度学术研究、PPT 生成,还是进行文本人性化润色、多模态内容创作,用户都能在此找到经过验证的成熟模块。

该项目特别适合希望快速增强 AI 助手能力的开发者、研究人员以及普通用户。对于开发者而言,它提供了丰富的现成组件,可大幅缩短从构思到部署的时间;对于非技术背景的用户,通过简单的命令即可让个人 AI 代理掌握复杂任务。其技术亮点在于生态的开放性与实用性并重:不仅包含基于 Rust 的高性能无头浏览器自动化工具以提升执行效率,还涵盖了针对大模型提示词工程的安全审查与优化框架。所有技能均经过人工筛选与实测,确保在真实场景中的稳定性与有效性,是构建强大自主 AI 代理的理想资源库。

使用场景

某初创公司的内容运营团队需要每周快速产出多篇深度行业分析报告,并配套生成演示文稿和宣传视频,但团队人手紧张且技术栈分散。

没有 openclaw-master-skills 时

  • 研究效率低下:人工搜集资料耗时费力,或使用简单的搜索插件只能得到碎片化信息,缺乏系统性的深度调研能力。
  • 工具集成困难:为了生成 PPT、处理图片或进行网页自动化,开发人员需要分别寻找并调试多个独立的开源脚本,环境配置复杂且容易冲突。
  • 内容质量不稳定:直接由大模型生成的文案往往"AI 味”过重,缺乏专业润色,难以通过原创性检测,还需额外寻找“去 AI 化”工具。
  • 工作流割裂:从资料收集、文案撰写到最终的多媒体制作,各个环节无法在一个统一的智能体(Agent)中自动流转,依赖大量人工手动复制粘贴。

使用 openclaw-master-skills 后

  • 一键深度调研:直接调用 deep-research-pro 技能,智能体可自动多源搜索、综合信息并输出带引用的专业报告,将数小时的研究工作缩短至几分钟。
  • 全栈技能即插即用:通过 clawhub install 瞬间部署 ai-ppt-generatorimage-generatebrowser-use 等 387+ 个精选技能,无需手动配置复杂的环境依赖。
  • 内容自然拟人:利用 humanize-ai-text 技能自动优化文案风格,有效规避检测机制,确保输出内容既专业又具备自然的人类表达特征。
  • 端到端自动化闭环:在一个 MyClaw 智能体中串联起“调研 - 写作 - 美化 - 视频生成”全流程,实现从输入主题到输出完整多媒体素材包的无人值守运行。

openclaw-master-skills 通过将分散的顶尖原子能力整合为标准化技能库,让普通用户也能瞬间拥有专家级的全能 AI 特工团队。

运行环境要求

操作系统
  • Linux
  • macOS
GPU

未说明 (部分技能如 sglang-diffusion-video 需本地 GPU,computer-use 需 Xvfb/XFCE)

内存

未说明

依赖
notes该工具是 MyClaw.ai 平台的技能集合包,并非单一独立运行的模型。安装方式主要通过 'clawhub' 命令行工具或手动克隆仓库并将特定技能复制到 '~/.openclaw/workspace/skills/' 目录。具体运行环境取决于所选用的单个技能(例如:browser-use 需要浏览器环境,computer-use 需要虚拟桌面环境,本地视频生成技能需要对应的 AI 推理后端)。README 中未提供统一的 Python 版本、显存或内存硬性要求,需参考具体技能的文档。
python未说明
clawhub
git
Node.js (部分技能需要)
Rust (部分技能需要)
openclaw-master-skills hero image

快速开始

🧠 OpenClaw 大师技能

由 MyClaw.ai 提供支持 387+ 技能 每周更新

语言: English · 中文 · Français · Deutsch · Русский · 日本語 · Italiano · Español


🤖 由 MyClaw.ai 提供支持

MyClaw.ai 是一个 AI 个人助理平台,为每位用户提供运行在专用服务器上的功能齐全的 AI 代理。OpenClaw 大师技能是我们精心策划、每周更新的生态系统中最佳技能集合——经过精心挑选,帮助您的 AI 代理完成更多任务。

🌐 试用 MyClaw.aihttps://myclaw.ai


🚀 如何安装

# 通过 ClawHub 安装单个技能
clawhub install openclaw-master-skills

# 或者手动克隆并复制
git clone https://github.com/LeoYeAI/openclaw-master-skills.git
cp -r openclaw-master-skills/skills/<skill-name> ~/.openclaw/workspace/skills/

📦 技能索引(387 个技能)

🤖 AI 与 LLM 工具(50)

技能 描述
academic-deep-research 透明、严谨的研究,提供完整的方法论——而非黑盒式的 API 封装。进行详尽的
agent-browser 基于 Rust 的快速无头浏览器自动化命令行工具,具备 Node.js 备用方案,使 AI 代理能够进
agent-browser-clawdbot 面向 AI 代理优化的无头浏览器自动化命令行工具,支持可访问性树快照和引用基
ai-humanizer >
ai-ppt-generator 使用百度 AI 生成 PPT。根据内容智能选择模板。
ai-prompt-engineering-safety-review 全面的 AI 提示词工程安全审查与改进提示。分析提示以确保安
ai-prompt-generator 专业 AI 提示词生成工具,帮助用户创建高效、精准的 AI 提示词。内置多种框架和模板,让 AI 输出质量提升 10 倍。
ai-travel 以 AI 代理的身份在 drifts.bot 上旅行。多步骤沉浸式旅程,具有时间锁定的进展机制,参
ai-web-automation 自动化 Web 任务执行服务。
boost-prompt 交互式提示词优化流程:询问范围、交付成果、约束条件;复制最终提
browser-use 自动化浏览器交互,用于网页测试、表单填写、截图及数据提取。使用
computer-use 在无头 Linux 服务器上实现完整的桌面电脑使用。Xvfb + XFCE 虚拟桌面结合 xdotool 自动
deep-research-pro 多源深度研究代理。搜索网络、综合发现并交付带引用的报告
edge-tts
gemini Gemini 命令行工具,用于一次性问答、摘要和生成。
humanize-ai-text 将 AI 生成文本人性化,以规避检测。该工具会重写 ChatGPT、Claude 和 GPT 等模型生成的文
humanizer
image-generate 使用内置 image_generate.py 脚本生成图片, 准备清晰具体的 prompt
ltx-video
mcporter 使用 mcporter 命令行工具直接列出、配置、认证并调用 MCP 服务器/工具(HTTP 或 stdio),
model-usage 使用 CodexBar 命令行本地成本使用情况工具,汇总 Codex 或 Claude 的每模型使用情况,包括计
nano-banana-pro 使用 Nano Banana Pro(Gemini 3 Pro Image)生成/编辑图像。适用于图像创建/修改请求
openai-image-gen 通过 OpenAI Images API 批量生成图像。随机提示采样器 + index.html 画廊。
openai-whisper 使用 Whisper 命令行工具进行本地语音转文字(无需 API 密钥)。
openai-whisper-api 通过 OpenAI Audio Transcriptions API(Whisper)转录音频。
oracle 使用 @steipete/oracle 命令行工具将提示词与合适的文件打包,获取第二模型的评审(
perplexity 通过 Perplexity API 进行 AI 驱动的答案式网络搜索。返回基于证据的回答,并附有引用
playwright 使用 Playwright 进行浏览器自动化和网页抓取。处理表单、截图、数据提取。标准工
playwright-mcp 通过 Playwright MCP 服务器进行浏览器自动化。导航网站、点击元素、填写表单、提取
prompt-engineering-expert 高级提示词工程专家,擅长定制指令设计及针对 AI 代
prompt-engineering-patterns 掌握高级提示词工程技术,以最大化 LLM 的性能、可靠性和可控
sag ElevenLabs 文本转语音,采用 Mac 风格的 say 用户界面。
summarize 使用 summarize 命令行工具总结 URL 或文件内容(网页、PDF、图片、音频、YouTube)。
vercel-ai-sdk 回答关于 AI SDK 的问题,并协助构建 AI 驱动的功能。适用于开发者:(1) 提出问

| agentcreate | 基于 AI 的 OpenClaw 代理创建工具——通过模型选择创建并配置独立代理 | | ai-model-router | 智能 AI 模型路由器,可在本地模型和云端模型之间自动切换 | | ai-model-router-v2 | AI 模型路由器 v2——增强版本地/云端自动切换功能 | | ai-news-aggregator-sl | 通过聚合订阅源抓取 AI 及科技新闻或自定义主题 | | ai-task-hub | AI 任务中心,提供图像分析、背景去除、语音转文字、TTS 等服务 | | creative-toolkit | 多提供商图像生成——Nanobanana、Seedream、GPT Image | | gemini-browser | 通过浏览器自动化查询 Google Gemini | | html-slide-creator | 创建零依赖的 HTML 演示文稿,完全在浏览器中运行 | | master-skills | 为 AI 代理提供安全的密钥管理——私钥、API 密钥、钱包凭证 | | media-generation | 生成图像、编辑、制作短视频、修复/扩展图像内容 | | microsoft-skill-creator | 使用 Learn MCP 工具为 Microsoft 技术创建代理技能 | | nidhov01-agent-browser | 快速的基于 Rust 的无头浏览器自动化命令行工具,具备 Node.js 备用方案 | | nidhov01-find-skills | 通过自然语言查询发现并安装代理技能 | | nidhov01-proactive-agent | 将 AI 代理从任务执行者转变为积极主动的合作伙伴 | | sglang-diffusion-video | 使用本地 SGLang-Diffusion 服务器生成视频(Wan2.2、Hunyuan) | | turing-pyramid | 优先行动选择——10 种需求,结合时间衰减和紧张度评分 |

🔍 搜索与网络(21)

技能 描述
baidu-search 使用百度 AI 搜索引擎 (BDSE) 进行网页搜索。适用于获取实时信息、文档或研究需求。
brave-search 通过 Brave Search API 进行网页搜索和内容提取。适用于搜索文档、事实或其他信息。
byterover 在进行任何工作之前,您必须使用此工具来收集上下文信息。这是面向 AI 代理的知识管理工具。
clean-content-fetch 获取干净、可读的网页正文内容,适合现代网页、博客、新闻、公告和微信公众号文章抓取;支持网页正文提取、内容清洗、去噪、Markdown 输出,适用于普通 fetch 效果不佳、页面噪音较多或动态渲染干扰的情况。
ddg-web-search 使用 DuckDuckGo Lite 通过 web_fetch 进行无需 API 密钥的网页搜索。当其他网页搜索工具不可用时,可用作备用方案。
desearch-web-search 搜索网络并获得带有标题、URL 和摘要的实时 SERP 样式结果。适用于地理相关查询。
duckduckgo-search 使用 DuckDuckGo 执行网页搜索,从互联网上检索实时信息。适用于需要快速获取最新资讯的场景。
ebay-product-research 专业的 eBay 选品分析工具,帮助卖家发现高利润、低竞争的产品。分析销量、价格趋势、竞争程度、利润空间,提供数据驱动的选品建议。
exa-web-search-free 通过 Exa MCP 进行免费的 AI 搜索。可用于新闻/信息搜索,以及从 GitHub/Stack Overflow 等平台搜索代码文档或示例。
file-search 使用 fdrg(ripgrep)实现快速的文件名和内容搜索。
firecrawl
firecrawl-search 通过 Firecrawl API 进行网页搜索和爬取。适用于需要搜索网络、爬取网站(包括
google-search 使用 Google 自定义搜索引擎 (PSE) 进行网页搜索。适用于需要实时信息、文档
multi-search-engine 集成 17 种搜索引擎(8 家中国厂商 + 9 家全球厂商)。支持高级搜索运算符。
openclaw-tavily-search 通过 Tavily API 进行网页搜索(Brave 的替代方案)。当用户要求搜索网络或查找
qmd 具有 MCP 模式的本地搜索/索引 CLI(BM25 + 向量 + 重排序)。
scrapling-official 使用 Scrapling 爬取网页,并具备反机器人绕过功能(如 Cloudflare Turnstile),同时以隐身无头模式运行。
searxng 使用您本地的 SearXNG 实例进行尊重隐私的元搜索引擎。可用于搜索网页、图片、新闻等。
tavily 使用 Tavily Search API 进行 AI 优化的网页搜索。适用于需要全面网络调研、当前
tavily-search-1-0-0 通过 Tavily API 进行 AI 优化的网页搜索。为 AI 代理返回简洁且相关的结果。
web-search-plus 统一的搜索技能,具备智能自动路由功能。通过多信号分析自动选择

📋 生产力与办公(43)

技能 描述
1password 设置并使用 1Password CLI (op)。在安装 CLI、启用桌面应用集成时使用,si
agent-memory 面向 AI 代理的持久化记忆系统。记住事实、从经验中学习,并跟踪实体 ac
apple-notes 通过 macOS 上的 memo CLI 管理 Apple Notes(创建、查看、编辑、删除、搜索、移动和导出
apple-reminders 通过 macOS 上的 remindctl CLI 管理 Apple 提醒事项(列出、添加、编辑、完成、删除)。支持
bear-notes 使用 grizzly CLI 创建、搜索和管理 Bear 笔记。
caldav-calendar 使用 vdirsyncer + khal 同步和查询 CalDAV 日历(iCloud、Google、Fastmail、Nextcloud 等)。
calendar 日历管理和日程安排。创建事件、管理会议,并在不同日历服务提供商之间同步
doc-coauthoring 引导用户完成文档协作编写的结构化流程。当用户想要编写 wri
document-parser 高精度文档解析技能,从 PDF、图片、Word 文档中提取结构化数据。
docx 当用户想要创建、读取、编辑或操作 Word 文档(.docx 文件)时,请使用此技能。
elite-longterm-memory 针对 Cursor、Claude、ChatGPT 和 Copilot 的终极 AI 代理记忆系统。WAL 协议 + 向量检索
erpclaw >
excel-xlsx 正确处理类型、日期、公式,并实现跨平台兼容性地读取、写入和生成 Excel 文件。
gcalcli-calendar 通过 gcalcli 使用 Google 日历:默认仅显示当天的日程;通过日程优先的有限范围查找 s
google-calendar 通过 Google 日历 API 与 Google 日历交互——列出即将发生的事件、创建新事件、
linear 查询和管理 Linear 中的问题、项目以及团队工作流。
markdown-converter 使用 markitdown 将文档和文件转换为 Markdown 格式。用于将 PDF、Word (.docx)、Pow
memory-hygiene 审计、清理和优化 Clawdbot 的向量内存(LanceDB)。当内存因垃圾数据而臃肿时使用,
memory-manager 代理的本地内存管理。包括压缩检测、自动快照和语义搜索。使用
memory-setup 为 Moltbot/Clawdbot 启用并配置持久上下文的记忆搜索功能。在设置 memo
microsoft-excel
nano-pdf 使用 nano-pdf CLI,通过自然语言指令编辑 PDF 文件。
notion Notion API 用于创建和管理页面、数据库和区块。
obsidian 处理 Obsidian 仓库(纯 Markdown 笔记),并通过 obsidian-cli 实现自动化。
pdf 只要用户需要对 PDF 文件进行任何操作,就使用此技能。这包括阅读或 extra
pdf-extract 从 PDF 文件中提取文本,用于 LLM 处理
pdf-text-extractor 带 OCR 支持的 PDF 文本提取工具。非常适合数字化文档、处理发票或其他 a
ppt-generator 将用户讲稿一键生成乔布斯风极简科技感竖屏HTML演示稿。当用户需要生成PPT、演示文稿、Slides、幻灯片,或要求科技风/极简风/乔布斯风格的演示时触发此技能。输出为单个可直接运行的HTML文件。
pptx 只要涉及 .pptx 文件,无论作为输入、输出还是两者兼备,都可以使用此技能。这 includ
slidev 使用 Markdown、Vue 组件和代码高亮功能,为开发者创建并展示基于 Web 的幻灯片。
things-mac 通过 macOS 上的 things CLI 管理 Things 3(通过 URL 方案添加/更新项目和待办事项;读取/搜索
todoist 管理 Todoist 中的任务和项目。当用户询问任务、待办事项、提醒或 producti
trello 通过 Trello REST API 管理 Trello 板、列表和卡片。
word-docx 正确的结构、样式和跨平台兼容性地读取和生成 Word 文档。
xlsx 只要电子表格文件是主要的输入或输出,就使用此技能。这意味着任何任务 where

| changelog-curator | 从变更记录整理对外 changelog,区分用户价值与内部改动 | | clipboard-knowledge-capture | 剪贴板片段沉淀到本地知识库,自动补来源/标签/行动 | | database-admin | 数据库管理员——模式管理、数据操作、查询优化 | | main-image-editor | 截图+中文指令 PSD 批量编辑 | | openclaw-todoist | 多代理身份下的 Todoist 任务管理 | | product-dev-ops-package | 产品研发运营协作(PM/架构/开发/运营四角色) | | todo-tracker-safe | 具有输入验证和安全文件操作的 secure TODO 追踪器 | | hengheng-system-time | 各种格式和时区下的精确系统时间 |

💻 开发与 DevOps(87)

技能 描述
api-design-principles 掌握 REST 和 GraphQL API 设计原则,构建直观、可扩展且易于维护的 API。
architecture-blueprint-generator 全面的项目架构蓝图生成器,能够分析代码库并创建详细的架构设计。
architecture-patterns 实现经过验证的后端架构模式,包括整洁架构、六边形架构等。
better-auth-best-practices 集成 Better Auth——全面的 TypeScript 身份验证框架的技能。
code 编码工作流程,包含规划、实现、验证和测试,以确保软件开发的规范性。
code-exemplars-blueprint-generator 与技术无关的提示生成器,用于创建可定制的 AI 提示,扫描代码库并提取示例。
code-review 系统化的代码审查模式,涵盖安全性、性能、可维护性、正确性和技术规范等方面。
coding 适应用户偏好、约定和模式的编码风格记忆,确保一致的编码实践。
create-auth-skill 使用 Better Auth 在 TypeScript/JavaScript 应用中创建认证层的技能。
debug-pro 系统化的调试方法论及特定语言的调试命令。
dispatching-parallel-agents 当面临两个或多个独立任务,且这些任务无需共享状态或按顺序依赖时使用。
docker-essentials 容器管理、镜像操作和调试所需的 Docker 核心命令与工作流。
executing-plans 当您拥有书面的实施计划,并希望在单独的会话中执行该计划,同时进行评审检查点时使用。
expo-api-routes 在 Expo Router 中使用 EAS 托管创建 API 路由的指南。
expo-building-native-ui 使用 Expo Router 构建精美应用的完整指南。涵盖基础知识、样式设计、组件等内容。
expo-cicd-workflows 帮助理解和编写 Expo 项目的 EAS 工作流 YAML 文件。当用户需要时使用此技能。
expo-deployment 将 Expo 应用部署到 iOS App Store、Android Play Store、Web 托管平台以及 API 路由。
expo-dev-client 在本地或通过 TestFlight 构建并分发 Expo 开发客户端。
expo-native-data-fetching 在实现或调试任何网络请求、API 调用或数据获取时使用。涵盖 fetch API 等内容。
expo-tailwind-setup 在 Expo 中使用 react-native-css 和 NativeWind v5 设置 Tailwind CSS v4,实现通用样式。
expo-ui-jetpack-compose @expo/ui/jetpack-compose 包允许您在应用中使用 Jetpack Compose 视图和修饰符。
expo-ui-swift-ui @expo/ui/swift-ui 包允许您在应用中使用 SwiftUI 视图和修饰符。
expo-use-dom 使用 Expo DOM 组件在原生平台上通过 WebView 运行 Web 代码,在 Web 上则按原样运行。将 Web 代码迁移到…
finishing-a-development-branch 当实现已完成、所有测试均通过,且需要决定如何将工作集成到主分支时使用。
frontend-design-ultimate 使用 React、Tailwind CSS 和 shadcn/ui 创建独特且生产级的静态网站——无需线框图。
git 全面的版本控制覆盖,包括核心命令、团队工作流、分支策略和恢复方法。
git-commit 执行 git commit,结合规范化的提交信息分析、智能暂存和消息生成功能。
git-essentials 版本控制、分支管理和协作所需的 Git 核心命令与工作流。
github 使用 gh CLI 与 GitHub 交互。利用 gh issuegh prgh rungh api 处理问题、
go-install Content-Disposition: form-data; name="file"; filename="SKILL.md"
go-install-zh Content-Disposition: form-data; name="file"; filename="SKILL.md"
mcp-builder 创建高质量 MCP(模型上下文协议)服务器的指南,使 LLM 能够与…互动。
microservices-patterns 设计微服务架构,包括服务边界、事件驱动通信和韧性机制。
modern-javascript-patterns 掌握 ES6+ 特性,包括 async/await、解构赋值、展开运算符、箭头函数、Promise 等。
n8n 通过 API 管理 n8n 工作流和自动化。当处理 n8n 工作流、执行或自动化时使用。
n8n-workflow-automation 设计并输出具有强大触发器、幂等性、错误处理、日志记录等功能的 n8n 工作流 JSON。
next-best-practices Next.js 最佳实践——文件约定、RSC 边界、数据模式、异步 API、元数据、错误处理等。
next-cache-components Next.js 16 缓存组件——PPR、缓存指令、缓存生命周期、缓存标签、更新标签等。
nextjs-app-router-patterns 掌握 Next.js 14+ 的 App Router,包括服务器组件、流式传输、并行路由和高级数据处理。
nodejs-backend-patterns 使用 Express/Fastify 构建生产就绪的 Node.js 后端服务,实现中间件模式。
nuxt Nuxt 全栈 Vue 框架,支持 SSR、自动导入和基于文件的路由。当处理…时使用。
opencode-controller 通过斜杠命令控制和操作 Opencode。使用此技能管理会话、选择模型、
pinia Pinia 是官方的 Vue 状态管理库,类型安全且可扩展。当定义商店、工作时使用。
pnpm Node.js 包管理器,具有严格的依赖解析能力。当运行 pnpm 特定命令时使用。
postgresql-table-design 设计 PostgreSQL 特有的数据库模式。涵盖最佳实践、数据类型、索引、约束和性能优化。
python-design-patterns Python 设计模式,包括 KISS 原则、关注点分离、单一职责和组合模式等。
python-performance-optimization 使用 cProfile、内存分析工具和性能最佳实践对 Python 代码进行剖析和优化。当…时使用。
python-testing-patterns 实施全面的测试策略,包括 pytest、夹具、模拟和测试驱动开发。
rag-implementation 使用向量数据库等构建适用于 LLM 应用的检索增强生成(RAG)系统。
react-doctor 在进行 React 相关更改后运行,以便及早发现潜在问题。当审查代码、完成功能时使用。
react-native-best-practices 提供 React Native 性能优化指南,涵盖 FPS、TTI、包大小、内存泄漏等方面。
react-state-management 掌握现代 React 状态管理技术,包括 Redux Toolkit、Zustand、Jotai 和 React Query。当…时使用。
receiving-code-review 当收到代码审查反馈时使用,尤其是在实施建议之前,特别是当反馈显得…时。
requesting-code-review 当完成任务、实现重大功能或在合并前需要验证工作是否符合要求时使用。
responsive-design 使用容器查询、流体排版、CSS Grid 和移动端优先的设计方法,实现现代响应式布局。
rustchain-mcp MCP 服务器为 AI 代理提供访问 RustChain 古老性证明区块链和 BoTTube AI 原生…的能力。
sql-toolkit 查询、设计、迁移和优化 SQL 数据库。当处理 SQLite、PostgreSQL 或 MySQL 时使用。
supabase-postgres-best-practices 来自 Supabase 的 Postgres 性能优化和最佳实践。当编写或审查…时使用此技能。
superdesign 专业前端设计指南,用于创建美观现代的 UI。当构建着陆页时使用。
systematic-debugging 当遇到任何 bug、测试失败或意外行为时使用,然后再提出修复方案。
template-skill 替换为技能描述以及 Claude 应该何时使用该技能。
test-driven-development 在编写实现代码之前,当实施任何功能或修复 bug 时使用。
turborepo
typescript-advanced-types 掌握 TypeScript 的高级类型系统,包括泛型、条件类型、映射类型和模板…
ui-ux-pro-max UI/UX 设计智能及实施指导,用于构建精良的界面。当…时使用。
unocss UnoCSS 是即时原子 CSS 引擎,是 Tailwind CSS 的超集。当配置 UnoCSS 或编写实用…时使用。
upgrading-react-native 通过应用 rn-diff-purge 模板差异并更新包来升级 React Native 应用至新版本。
using-git-worktrees 当开始需要与当前工作区隔离的功能开发,或在执行实现之前时使用。
vercel-composition-patterns 描述:
vercel-react-best-practices Vercel Engineering 提供的 React 和 Next.js 性能优化指南。此技能应被…
vite Vite 构建工具的配置、插件 API、SSR 以及 Vite 8 Rolldown 的迁移。当处理…时使用。
vitepress VitePress 是由 Vite 和 Vue 驱动的静态站点生成器。当构建文档站点、会议…时使用。
vitest Vitest 是由 Vite 驱动的快速单元测试框架,兼容 Jest API。当编写测试时使用。
vue Vue 3 Composition API、script setup 宏、响应式系统和内置组件。当编写…时使用。
vue-best-practices 必须用于 Vue.js 任务。强烈推荐使用 <script setup> 和 TypeScr…的 Composition API。
vue-best-practices-hyf0 必须用于 Vue.js 任务。强烈推荐使用 <script setup> 和 TypeScr…的 Composition API。
vue-debug-guides Vue 3 的调试和错误处理,涵盖运行时错误、警告、异步失败以及 SSR/水合过程中的问题。
vue-jsx-best-practices Vue 中的 JSX 语法(例如 class 与 className、JSX 插件配置等)。
vue-pinia-best-practices Pinia 商店、状态管理模式、商店设置以及与商店相关的响应式机制。
vue-router-best-practices Vue Router 4 的模式、导航守卫、路由参数以及路由组件生命周期的交互。
vue-router-best-practices-hyf0 Vue Router 4 的模式、导航守卫、路由参数以及路由组件生命周期的交互。
vue-testing-best-practices 用于 Vue.js 测试。涵盖 Vitest、Vue Test Utils、组件测试、模拟和测试模式等。
vue-testing-best-practices-hyf0 用于 Vue.js 测试。涵盖 Vitest、Vue Test Utils、组件测试、模拟和测试模式等。
web-component-design 掌握 React、Vue 和 Svelte 的组件模式,包括 CSS-in-JS、组合策略和反应…
web-design-guidelines 检查 UI 代码是否符合 Web 界面指南。当被要求“审查我的 UI”或“检查可用性…”时使用。
webapp-testing 使用 Playwright 与本地 Web 应用交互并进行测试的工具包。支持验证…
writing-plans 当您拥有一个多步骤任务的规格或需求,但在接触代码之前使用。

📈 市场营销与增长(35)

技能 描述
ab-test-setup 当用户想要规划、设计或实施 A/B 测试或实验时。也适用于用户
analytics-tracking 当用户想要设置、改进或审计分析跟踪和衡量时。也适用于 t
blogwatcher 使用 blogwatcher CLI 监控博客和 RSS/Atom 订阅源的更新。
brand-guidelines 将 Anthropic 的官方品牌颜色和字体应用于任何可能受益的媒介上。
communication-playbook >
competitor-alternatives 当用户想要为 SEO 和销售赋能创建竞争对手比较或替代页面时。
content-strategy 当用户想要规划内容策略、决定创作哪些内容,或弄清楚该做什么时。
copy-editing 当用户想要编辑、审查或改进现有的营销文案时。也适用于用户意
copywriting 当用户想要为任何页面撰写、改写或改进营销文案时——包括首页、
email-sequence 当用户想要创建或优化电子邮件序列、滴灌式营销活动、自动化邮件流程,或
form-cro 当用户想要优化任何非注册/登录表单时——包括潜在客户收集表单等。
free-tool-strategy 当用户想要规划、评估或构建用于营销目的的免费工具时——例如潜在客户获取工具。
launch-strategy 当用户想要规划产品发布、功能上线或版本发布策略时。也适用于 wh
marketing-ideas 当用户需要为其 SaaS 或软件产品提供营销创意、灵感或策略时。
marketing-mode 营销模式结合了 23 种全面的营销技能,涵盖战略、心理学、内容、SEO、
marketing-psychology 当用户想要将心理学原理、心智模型或行为科学应用于营销时。
marketing-skills 简而言之:23 种营销手册(CRO、SEO、文案、分析、实验、定价、发布、广告、社交)
offer-positioning-auditor 审计产品或服务方案的清晰度、差异化以及购买障碍。适用于改进时。
onboarding-cro 当用户想要优化注册后的引导流程、用户激活、首次使用体验,或 ti
page-cro 当用户想要优化、改进或提高任何营销页面的转化率时——包括
paid-ads 当用户需要在 Google Ads、Meta(Facebook/Instagram)、L 上开展付费广告活动的帮助时。
partnerships-ecosystem >
popup-cro 当用户想要创建或优化弹出窗口、模态框、叠加层、滑入式广告或横幅以提升转化率时。
pricing-strategy 当用户需要在定价决策、套餐设计或盈利策略方面获得帮助时。也适用于
product-marketing-context 当用户想要创建或更新其产品营销背景文档时。也适用于
programmatic-seo 当用户想要利用模板和数据大规模创建由 SEO 驱动的页面时。也适用于
referral-program 当用户想要创建、优化或分析推荐计划、联盟营销计划或口碑传播机制时。
seo-audit 当用户想要审计、审查或诊断其网站上的 SEO 问题时。也适用于用户 m
shopify-seo-bot 自动优化 Shopify 店铺 SEO,包括产品标题、描述、meta 标签、图片 ALT 等。提升 Google 搜索排名,增加自然流量。
shopify-seo-optimizer 专为 Shopify 店铺设计的 SEO 优化工具。优化产品标题、描述、元标签、图片 Alt、URL 结构,提升店铺在 Google 的搜索排名和自然流量。
signup-flow-cro 当用户想要优化注册、登记、账户创建或试用激活流程时。A
tiktok-viral-predictor AI 预测 TikTok 视频爆款潜力,分析热门元素、BGM、标签。提供优化建议,提高视频上推荐概率。

| adclaw | 广告创意搜索助手 | | adwords | 营销文案助手 — 100+标题公式、AIDA框架、痛点挖掘 | | new-visitor-cold-start | 基于新访客行为的个性化推荐与转化优化 |

🎨 媒体与创意(10)

技能 描述
algorithmic-art 使用 p5.js 创建算法艺术,结合种子随机性和交互式参数探索。U
canvas-design 使用设计理念在 .png 和 .pdf 文档中创作精美的视觉艺术。你应该使用此
gifgrep 使用 CLI/TUI 搜索 GIF 提供者,下载结果并提取静帧/拼图。
songsee 使用 songsee CLI 从音频中生成频谱图和特征面板可视化效果。
video-frames 使用 ffmpeg 从视频中提取帧或短片。
web-artifacts-builder 一套工具,用于使用现代前端技术创建复杂、多组件的 claude.ai HTML 艺术品。
youtube-api-skill
youtube-auto-captions 自动为 YouTube 视频生成字幕,支持多语言翻译、时间轴校准。提升视频可访问性和 SEO。
youtube-transcript 获取并总结 YouTube 视频的字幕文本。适用于被要求总结、转录或提取 c
youtube-watcher 从 YouTube 视频中获取并阅读字幕文本。适用于需要总结视频、回答问

💰 金融与交易(18)

技能 描述
stock-analysis 使用Yahoo Finance数据分析股票和加密货币。支持投资组合管理和观察列表功能。
stock-market-pro >-
stock-watcher 管理和监控个人股票观察列表,支持添加、删除、列出股票等功能。
trader-daily
tushare-finance 获取中国金融市场数据(A股、港股、美股、基金、期货、债券)。支持220+个Tushare Pro接口:股票行情、财务报表、宏观经济指标。当用户请求股价数据、财务分析、指数行情、GDP/CPI等宏观数据
us-stock-analysis 全面的美国股票分析,包括基本面分析(财务指标、业务质量、
yahoo-finance 使用Yahoo获取股票价格、报价、基本面、收益、期权、股息和分析师评级

| alchemy-openapi-skill | Alchemy Prices API通过精选的OpenAPI模式进行读取 | | basedagents | 搜索并交互BasedAgents.ai代理注册表 | | chainbase-openapi-skill | Chainbase索引的钱包和代币数据通过OpenAPI读取 | | citrea-claw-skill | 监控Citrea比特币L2生态系统 | | coingecko-openapi-skill | CoinGecko和GeckoTerminal市场数据API | | eastmoney-financial-data-1-0-2 | 东方财富行情/财务数据查询(股票/基金/债券/资金流向) | | eastmoney-financial-search-1-0-2 | 东方财富金融信源智能搜索(新闻/公告/研报/政策) | | moralis-openapi-skill | Moralis EVM钱包和代币数据通过OpenAPI读取 | | ths-advanced-analysis | 同花顺高级分析(分钟K线/板块行情/多股对比/大单竞价) | | upbit-openapi-skill | Upbit公开交易所市场API | | wyckoff-a-share | 根据股票代码进行Wyckoff大师风格的A股分析 |

💬 沟通与消息传递(18)

技能 描述
agentmail 面向AI代理设计的API优先电子邮件平台。创建和管理专用邮箱,发送和
bluebubbles 构建或更新Clawdbot的BlueBubbles外部渠道插件(扩展包,REST发送/p
discord 当需要通过Clawdbot的discord工具控制Discord时使用:发送消息、反应、发布
feishu-doc 从飞书(Lark)Wiki、Docs、Sheets和Bitable中获取内容。自动解析Wiki URL至
feishu-evolver-wrapper 飞书集成的能力进化器包装器。管理进化循环生命周期(启动/st
gmail
himalaya 通过IMAP/SMTP管理电子邮件的CLI。使用himalaya可以列出、阅读、写入、回复、转发、搜索以及
imap-smtp-email 通过IMAP/SMTP读取和发送电子邮件。检查新消息或未读消息,获取内容,搜索邮箱,m
imsg iMessage/SMS CLI用于列出聊天记录、历史、监听和发送。
internal-comms 一套资源,帮助我撰写各种内部沟通材料,采用符合我公司格式的
outlook 通过Microsoft Graph API读取、搜索和管理Outlook电子邮件及日历。当用户请求时使用
slack 当需要通过Clawdbot的slack工具控制Slack时使用,包括对消息做出反应
slack-gif-creator 为Slack优化的动态GIF制作知识和工具。提供约束条件、验证
telegram OpenClaw技能,用于设计Telegram Bot API工作流和基于命令的对话,使用direc

| feishu-doc-collab | 飞书实时AI协作文档 | | nidhov01-notion | Notion API用于页面、数据库和块的管理 | | nidhov01-github | GitHub CLI交互——问题、PR、运行和API | | openai-codex-multi-oauth | 管理多个OpenAI Codex OAuth账户 |

🏠 智能家居与物联网(9)

技能 描述
blucli BluOS CLI(blu)用于设备发现、播放、分组和音量调节。
camsnap 从RTSP/ONVIF摄像头捕获帧或视频片段。
desktop-control 高级桌面自动化,包括鼠标、键盘和屏幕控制
eightctl 控制Eight Sleep睡眠舱(状态、温度、闹钟、计划)。
home-assistant 控制Home Assistant智能家居设备,运行自动化任务,并接收webhook事件。当con
openhue 通过OpenHue CLI控制飞利浦Hue灯具/场景。
peekaboo 使用Peekaboo CLI捕捉并自动化macOS UI。
sonoscli 控制Sonos音箱(发现/状态/播放/音量/分组)。
spotify-player 通过spogo(首选)或spotify_player在终端上播放/搜索Spotify音乐。

🧠 记忆与智能体增强(32)

技能 描述
agent-autonomy-kit 不再等待提示,持续工作。
agent-reach >
agent-team-orchestration 协调具有明确角色、任务生命周期、交接协议和审查流程的多智能体团队。
answeroverflow 通过 Answer Overflow 搜索已索引的 Discord 社区讨论,找到编码问题的解决方案。
auto-updater 每天自动更新 Clawdbot 及所有已安装技能。通过 cron 定时运行,检查更新。
capability-evolver 针对 AI 智能体的自我进化引擎。分析运行时历史以识别改进点并应用。
clawddocs Clawdbot 文档专家,提供决策树导航、搜索脚本、文档获取及版本控制功能。
clawdhub 使用 ClawdHub CLI 搜索、安装、更新和发布来自 clawdhub.com 的智能体技能。使用时…
clawsec
compaction-ui-enhancements 背景内存压缩功能,支持自动触发、聊天摘要段落、可配置阈值和模式切换。
evomap 连接到 EvoMap 协作式进化市场。发布 Gene+Capsule 组合包,获取促销信息。
find-skills 当用户提出“如何做 X”或“寻找一个…”等问题时,帮助其发现并安装智能体技能。
last30days 研究过去 30 天内 Reddit + X + 网页上的任何主题,综合结果并撰写可复制粘贴的内容。
mindkeeper 你的 AI 大脑时光机——为智能体上下文文件提供版本控制。当用户询问…时使用。
openclaw-backup 备份和恢复 OpenClaw 数据。当用户请求创建备份或设置自动备份计划时使用。
openclaw-guardian 为 OpenClaw Gateway 部署并管理守护进程。提供自动化健康监测功能。
openclaw-skill-vetter 在安装任何 AI 智能体技能之前进行安全审查。用于检测凭证相关风险等。
proactive-agent 将 AI 智能体从单纯执行任务的角色转变为能够预测需求并持续主动协作的伙伴。
proactive-agent-lite 通过记忆架构和反向推理机制,将 AI 智能体从任务执行者转变为主动型伙伴。
remembering-conversations 当用户在探索代码后询问“我应该怎么做…”或“最佳方法是什么…”时使用;或者当…
safe-exec 为 OpenClaw 智能体提供安全的命令执行功能,具备自动危险模式检测和风险评估能力。
self-improving 自我反思 + 自我批判 + 自我学习 + 自组织记忆。智能体评估自身表现。
self-reflection 通过结构化反思和记忆实现持续自我提升。
session-logs 使用 jq 搜索和分析你自己的会话日志(旧对话/父级对话)。
skill-creator 创建新技能、修改和优化现有技能,并衡量技能性能。当用户…时使用。
skill-finder-cn 技能查找器
skill-listing-polisher 在发布前优化技能的公开列表。用于完善标题、描述、标签和变更记录。
skill-scanner 在安装前扫描 Clawdbot 和 MCP 中的技能,检测恶意软件、间谍软件、加密货币挖矿程序及恶意代码模式。
skill-vetter 面向 AI 智能体的安全优先技能审查。在从 ClawdHub、GitHub 等来源安装任何技能前使用。
skill-vetting 在安装 ClawHub 技能前进行安全性和实用性审查。当考虑安装某个 C 时使用。
subagent-driven-development 当在当前会话中执行包含独立任务的实施计划时使用。
swarmclaw 管理你的 SwarmClaw 智能体集群,创建和分配任务,检查智能体和会话状态,触发…

🔒 安全与审计(6)

技能 描述
audit-website 对网站进行 SEO、性能、安全性、技术、内容等 15 类问题的审计。
healthcheck 使用 JSON 文件存储跟踪饮水和睡眠情况。
security-auditor 用于审查代码中的安全漏洞、实现身份验证流程以及审计 OW…

| bankofbots | 为 AI 智能体提供信任评分——记录交易并计算声誉。 | | runtime-sentinel | OpenClaw 智能体的运行时安全守护者。 | | sentinel-oleg | 运行时安全层——为智能体拦截输入/输出/日志。 |

📊 数据与分析(2)

技能 描述
data-analysis 通过严谨的统计方法、正确的方法论和对分析局限性的认识,将原始数据转化为决策。
data-analyst 数据可视化、报告生成、SQL 查询和电子表格自动化。将你的 AI 智能体…

📱 社交与内容(13)

技能 描述
amazon-price-tracker 实时监控亚马逊商品价格,设置降价提醒,追踪历史价格曲线。帮助买家低价购入,卖家竞品监控。
food-order Reorder Foodora orders + track ETA/status with ordercli。未经用户明确确认,请勿自动确认。
linkedin 通过浏览器中继或Cookie实现LinkedIn自动化操作,包括发送消息、查看个人资料及网络互动等。
news-summary 当用户请求新闻更新、每日简报或最新动态时,应使用此技能。
readgzh 描述:“ReadGZH — 让AI阅读微信公众号全文。支持标准文章。”
reddit 浏览、搜索、发布帖子并管理Reddit社区。仅读取功能无需认证即可使用;发帖和版主操作则需要登录。
reddit-readonly >-
social-content 当用户需要帮助创建、安排或优化LinkedIn、Twitter等社交媒体内容时,可使用此技能。
weibo-trending-bot 实时监控微博热搜榜,追踪热点话题、明星八卦、社会新闻。自动生成蹭热点文案。
x-twitter 与Twitter/X互动——阅读推文、搜索、发布、点赞、转发以及管理时间线。
xiaohongshu-mcp >
xurl 一款专注于吸引WordPress和Shopify客户的Twitter研究与内容情报技能。

| jike-publisher | 通过浏览器自动化将帖子发布到即刻平台 |

📦 其他(43)

技能 描述
add-educational-comments 向指定文件添加教育性评论;若未提供文件,则提示用户输入待评论的文件。
agent-governance
agentic-eval
api-gateway
apple-appstore-reviewer 按照指导对代码库进行审查,重点关注Apple App Store优化点。
automation-workflows 作为独立创业者,设计并实施自动化工作流以节省时间、提升效率。使用wh
brainstorming 在进行任何创意工作之前,务必先使用此技能——例如开发功能、构建组件或增加新特性。
breakdown-feature-implementation 根据Epoch monorepo结构,生成详细的功能实现计划。
browser 此技能利用无头浏览器(Puppeteer)渲染网页,并提取干净、易读的内容。
canvas 在已连接的OpenClaw节点上显示HTML内容(Mac应用、iOS、Android)。
chrome-devtools 使用Chrome DevTools MCP进行专家级浏览器自动化、调试和性能分析。使用
citedy-content-ingestion >
citedy-content-writer >
citedy-lead-magnets >
citedy-trend-scout >
citedy-video-shorts >
clankers-world 运营Clankers World房间,采用OpenClaw优先的加入/阅读/发送/排队/提醒流程,以及cw-*运行时环境。
clawdbot-filesystem 高级文件系统操作——列出文件、搜索内容、批量处理及目录分析,适用于Cl
cron-mastery 掌握OpenClaw的定时系统。可用于安排可靠的提醒、设置定期维护任务等。
filesystem 高级文件系统操作,用于列出文件、搜索内容、批量处理及目录分析。
free-ride 管理来自OpenRouter的免费AI模型,供OpenClaw使用。自动按质量排序模型,并进行配置。
gog Google Workspace命令行工具,适用于Gmail、日历、云端硬盘、联系人、表格和文档。
gogcli 描述:Google Workspace命令行工具,适用于Gmail、日历、云端硬盘、表格、文档、幻灯片、联系人、任务等。
goplaces 通过goplaces CLI查询Google Places API(新接口),支持文本搜索、地点详情获取、地址解析及评价查看等功能。
local-places 通过本地代理访问Google Places API,搜索餐厅、咖啡馆等场所。
miniade-agent-lifecycle-manager 在节点上管理完整的OpenClaw智能体生命周期操作:创建/注册智能体、配置通道
moltbook-interact 与Moltbook社交网络中的AI智能体互动。发布帖子、回复、浏览并分析互动数据。使用
ordercli 专为Foodora设计的命令行工具,用于查看历史订单及当前订单状态(Deliveroo正在进行中)。
personal-finish-notifier 通过OpenCla向Claude Code或其他智能体工作流中添加简单的“Claude已完成”的提醒。
productivity 通过能量管理、时间分块和特定情境下的生产力策略规划、专注并完成工作。
salesmate
tech-data-playbook >
theme-factory 一套用于为各类文档、演示文稿、报告及HTML页面等赋予统一主题样式的工具包。
tmux 通过发送按键指令和抓取窗格输出,远程控制tmux会话以实现交互式CLI操作。
upgrading-expo Expo SDK版本升级指南及依赖问题修复方法。
using-superpowers 开始任何对话时使用此技能——明确如何查找和使用技能,并要求使用Skill工具。
veadk-skills 根据用户的需求,完成与VeADK相关的各项功能。
verification-before-completion 在声称工作已完成、修复完毕或测试通过之前使用此技能——在提交或创建PR之前必须执行。
weather 获取当前天气及未来预报信息(无需API密钥)。
widget 在macOS上创建、更新、隐藏、显示、列出及删除Übersicht桌面小部件。当需要时使用此技能。
writing-skills 在创建新技能、编辑现有技能或部署前验证技能功能时使用此技能。

🤝 贡献

发现了一个很棒的技能?请在ClawHub上提交,或直接发起一个PR!

📄 许可证

MIT——详见LICENSE

| haodf | 好大夫智能找医生 — 症状、专科、位置匹配 | | health-score-pro | 结合10本畅销健康书籍的综合健康管理方案 |

版本历史

v0.7.02026/03/31
v0.4.02026/03/12

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手,旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚,能够直接接入你日常使用的各类通讯渠道,包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息,OpenClaw 都能即时响应,甚至支持在 macOS、iOS 和 Android 设备上进行语音交互,并提供实时的画布渲染功能供你操控。 这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地,用户无需依赖云端服务即可享受快速、私密的智能辅助,真正实现了“你的数据,你做主”。其独特的技术亮点在于强大的网关架构,将控制平面与核心助手分离,确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者,以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力(支持 macOS、Linux 及 Windows WSL2),即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

349.3k|★★★☆☆|昨天
Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。

162.1k|★★★☆☆|昨天
开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上

142.7k|★★☆☆☆|今天
开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。

107.9k|★★☆☆☆|今天
开发框架图像Agent

LLMs-from-scratch

LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目,旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型(LLM)。它不仅是同名技术著作的官方代码库,更提供了一套完整的实践方案,涵盖模型开发、预训练及微调的全过程。 该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型,却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码,用户能够透彻掌握 Transformer 架构、注意力机制等关键原理,从而真正理解大模型是如何“思考”的。此外,项目还包含了加载大型预训练权重进行微调的代码,帮助用户将理论知识延伸至实际应用。 LLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API,而是渴望探究模型构建细节的技术人员而言,这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计:将复杂的系统工程拆解为清晰的步骤,配合详细的图表与示例,让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础,还是为未来研发更大规模的模型做准备

90.1k|★★★☆☆|今天
语言模型图像Agent

Deep-Live-Cam

Deep-Live-Cam 是一款专注于实时换脸与视频生成的开源工具,用户仅需一张静态照片,即可通过“一键操作”实现摄像头画面的即时变脸或制作深度伪造视频。它有效解决了传统换脸技术流程繁琐、对硬件配置要求极高以及难以实时预览的痛点,让高质量的数字内容创作变得触手可及。 这款工具不仅适合开发者和技术研究人员探索算法边界,更因其极简的操作逻辑(仅需三步:选脸、选摄像头、启动),广泛适用于普通用户、内容创作者、设计师及直播主播。无论是为了动画角色定制、服装展示模特替换,还是制作趣味短视频和直播互动,Deep-Live-Cam 都能提供流畅的支持。 其核心技术亮点在于强大的实时处理能力,支持口型遮罩(Mouth Mask)以保留使用者原始的嘴部动作,确保表情自然精准;同时具备“人脸映射”功能,可同时对画面中的多个主体应用不同面孔。此外,项目内置了严格的内容安全过滤机制,自动拦截涉及裸露、暴力等不当素材,并倡导用户在获得授权及明确标注的前提下合规使用,体现了技术发展与伦理责任的平衡。

88.9k|★★★☆☆|昨天
开发框架图像Agent