skills

10k 609 简单 6 次阅读 3天前Apache-2.0Agent插件

AI 解读由 AI 自动生成，仅供参考

skills 是一个让 AI 编程助手轻松调用 Hugging Face 生态能力的开源项目。它通过标准化的“技能包”形式，将数据集创建、模型训练、评估等复杂任务封装成指令清晰的操作模块，使 OpenAI Codex、Claude Code、Gemini CLI 和 Cursor 等主流 AI 代理工具能够直接理解并执行相关命令。

过去，开发者若想指挥 AI 操作 Hugging Face 平台，往往需要反复编写提示词或手动配置环境，过程繁琐且容易出错。skills 解决了这一痛点，它提供了一套通用的接口规范，让不同品牌的 AI 助手都能“读懂”相同的任务指令，实现了跨平台的互操作性。无论是下载模型、上传文件还是管理云端计算任务，用户只需安装对应的技能包，AI 即可自动按标准流程执行。

该项目非常适合经常与机器学习模型打交道的开发者、数据科学家及研究人员使用。其核心亮点在于采用了统一的 Agent Skills 格式，不仅兼容多家大厂的 AI 工具，还支持社区贡献自定义技能。这意味着用户可以像安装插件一样扩展 AI 的能力边界，无需重复造轮子，极大地提升了工作流效率与协作便利性。

使用场景

一位机器学习工程师正试图将最新的研究模型部署到生产环境，并需要快速验证其在特定数据集上的表现。

没有 skills 时

命令记忆负担重：工程师必须频繁查阅 huggingface-cli 的复杂文档，才能记清下载模型、上传文件或管理仓库的具体命令行参数。
工作流割裂：在编写评估代码时，需手动切换终端运行脚本、复制结果，再回到编辑器更新 Model Card 中的评估表格，极易出错。
环境配置繁琐：每次在新项目中复用云算力任务或数据集加载逻辑时，都要重新编写大量样板代码，无法直接调用标准化的最佳实践。
多工具协作困难：若团队混用 Claude Code、Cursor 或 Codex，每位成员都需要单独配置各自的插件或提示词，难以统一操作规范。

使用 skills 后

自然语言驱动：工程师只需对编码助手说“下载该模型并运行云端评估”，skills 自动将其转化为准确的 hf-cli 命令，无需记忆任何参数。
全流程自动化：助手能直接调用 huggingface-community-evals 技能，自动提取评估数据并更新 README 中的结果表格，实现从训练到文档的一站式闭环。
即插即用标准化：通过引入预定义的 skill 文件夹，团队可立即复用经过验证的数据集创建和模型训练流程，大幅减少重复造轮子。
跨平台无缝兼容：无论团队成员使用何种主流 AI 编程工具（如 Gemini CLI 或 OpenAI Codex），均可通过同一套 skills 定义获得一致的操作能力。

skills 通过将 Hugging Face 生态的复杂操作封装为标准化的智能指令，让开发者从繁琐的命令记忆中解放出来，专注于核心算法创新。

运行环境要求

操作系统

未说明

GPU

未说明

内存

未说明

依赖

notes该工具并非传统的本地运行 AI 模型，而是一套用于配置编码代理（如 Claude Code, OpenAI Codex, Gemini CLI, Cursor）的指令集和技能包。它本身没有特定的操作系统、GPU、内存或 Python 版本要求，其运行环境取决于用户所使用的具体编码代理工具以及技能执行时调用的外部服务（如 Hugging Face Hub API）。部分技能（如训练类）可能需要在远程 Hugging Face Jobs 基础设施上运行，或在本地环境中安装相应的库（如 transformers, trl, gradio 等），但具体要求视具体技能而定。

python未说明

未说明

快速开始

Hugging Face 技能

Hugging Face 技能是针对数据集创建、模型训练和评估等 AI/ML 任务的定义。它们可与所有主流编码代理工具互操作，例如 OpenAI Codex、Anthropic 的 Claude Code、Google DeepMind 的 Gemini CLI 以及 Cursor。

此仓库中的技能遵循标准化的 Agent Skills 格式。

技能如何工作？

实际上，技能是自包含的文件夹，将指令、脚本和资源打包在一起，供 AI 代理在特定用例中使用。每个文件夹都包含一个 SKILL.md 文件，该文件以 YAML 前置元数据（名称和描述）开头，随后是编码代理在技能激活期间遵循的指导说明。

[!NOTE] “技能”实际上是 Anthropic 在 Claude AI 和 Claude Code 中使用的术语，并未被其他代理工具采用，但我们非常喜欢这个词！OpenAI Codex 使用开放的 Agent Skills 格式，其中每个技能都是一个包含 SKILL.md 文件的目录，Codex 会从 Codex Skills 指南中记录的标准 .agents/skills 位置发现这些技能。Codex 还可以处理 AGENTS.md 文件。Google Gemini 则使用“扩展”来在 gemini-extension.json 文件中定义编码代理的指令。本仓库与所有这些工具均兼容，甚至更多！

[!TIP] 如果您的代理不支持技能，可以直接使用 agents/AGENTS.md 作为备用方案。

安装

Hugging Face 技能与 Claude Code、Codex、Gemini CLI 和 Cursor 兼容。

Claude Code

将仓库注册为插件市场：

/plugin marketplace add huggingface/skills

要安装某个技能，运行：

/plugin install <skill-name>@huggingface/skills

例如：

/plugin install hf-cli@huggingface/skills

Codex

将您想使用的任何技能从本仓库的 skills/ 目录复制或符号链接到 Codex 的标准 .agents/skills 位置之一（例如 $REPO_ROOT/.agents/skills 或 $HOME/.agents/skills），具体请参阅 Codex Skills 指南。
一旦技能出现在这些位置之一，Codex 就会按照 Agent Skills 标准发现它，并在其决定使用该技能时或您明确调用时加载 SKILL.md 指令。
如果您的 Codex 设置仍然依赖于 AGENTS.md，则可以使用本仓库中生成的 agents/AGENTS.md 文件作为备用的指令包。

Gemini CLI

本仓库包含用于与 Gemini CLI 集成的 gemini-extension.json 文件。
在本地安装：

gemini extensions install . --consent

或者使用 GitHub URL：

gemini extensions install https://github.com/huggingface/skills.git --consent

更多帮助请参阅 Gemini CLI 扩展文档。

Cursor

本仓库包含 Cursor 插件清单：

.cursor-plugin/plugin.json
.mcp.json（配置了 Hugging Face MCP 服务器 URL）

可通过 Cursor 插件流程从仓库 URL（或本地检出）进行安装。

对于贡献者，可使用以下命令重新生成清单：

./scripts/publish.sh

技能

此仓库包含一些入门级技能。您也可以向仓库贡献自己的技能。

可用技能

名称	描述	文档
`hf-cli`	使用 hf CLI 执行 Hugging Face Hub 操作。下载模型/数据集、上传文件、管理仓库，并运行云端计算任务。	SKILL.md
`huggingface-community-evals`	在 Hugging Face 模型卡片中添加和管理评估结果。支持从 README 内容中提取评估表格、从 Artificial Analysis API 导入分数，以及使用 vLLM/lighteval 运行自定义评估。	SKILL.md
`huggingface-datasets`	使用 Dataset Viewer REST API 和 npx 工具探索、查询并提取任何 Hugging Face 数据集中的数据。无需 Python 依赖——涵盖拆分/配置发现、行分页、文本搜索、过滤、通过 parquetlens 使用 SQL 查询，以及通过 CLI 上传数据集。	SKILL.md
`huggingface-gradio`	在 Python 中构建 Gradio Web UI 和演示。适用于创建或编辑 Gradio 应用程序、组件、事件监听器、布局或聊天机器人时使用。	SKILL.md
`huggingface-jobs`	在 Hugging Face 基础设施上运行计算任务。执行 Python 脚本、管理计划任务并监控任务状态。	SKILL.md
`huggingface-llm-trainer`	使用 TRL 在 Hugging Face Jobs 基础设施上训练或微调语言模型。涵盖 SFT、DPO、GRPO 和奖励建模等训练方法，以及用于本地部署的 GGUF 转换。包括硬件选择、成本估算、Trackio 监控和 Hub 持久化。	SKILL.md
`huggingface-paper-publisher`	在 Hugging Face Hub 上发布和管理研究论文。支持创建论文页面、将论文与模型/数据集关联、声明作者身份，以及生成基于 Markdown 的专业研究文章。	SKILL.md
`huggingface-papers`	以 Markdown 格式查看和阅读 Hugging Face 论文页面，并在需要时使用 papers API 获取结构化元数据，如作者、关联模型、数据集、Spaces 和媒体 URL 等。	SKILL.md
`huggingface-tool-builder`	构建用于 Hugging Face Hub 和 API 工作流的可重用脚本。适用于串联 API 调用、丰富 Hub 元数据或自动化重复性任务。	SKILL.md
`huggingface-trackio`	使用 Trackio 跟踪和可视化机器学习训练实验。通过 Python API 记录指标，并通过 CLI 检索这些指标。支持与 HF Spaces 同步的实时仪表板。	SKILL.md
`huggingface-vision-trainer`	使用 Transformers Trainer API，在 Hugging Face Jobs 基础设施上或本地训练和微调目标检测模型（RTDETRv2、YOLOS、DETR 等）以及图像分类模型（timm 和 transformers 模型——MobileNetV3、MobileViT、ResNet、ViT/DINOv3 等）。包括 COCO 数据集格式支持、Albumentations 数据增强、mAP/mAR 指标、Trackio 跟踪、硬件选择和 Hub 持久化。	SKILL.md
`transformers-js`	直接在 JavaScript/TypeScript 中运行最先进的机器学习模型，用于 NLP、计算机视觉、音频处理和多模态任务。可在 Node.js 和浏览器中使用 WebGPU/WASM 运行 Hugging Face 模型。	SKILL.md

在你的编码代理中使用技能

安装技能后，在向编码代理发出指令时直接提及该技能：

“使用 HF LLM 训练师技能来估算运行 70B 模型所需的 GPU 内存。”
“使用 HF 模型评估技能来对最新检查点启动 run_eval_job.py。”
“使用 HF 数据集创建者技能来草拟新的少样本分类模板。”
“使用 HF 论文发布者技能来索引我的 arXiv 论文，并将其与我的模型关联。”

你的编码代理会在完成任务时自动加载相应的 SKILL.md 指令和辅助脚本。

贡献或自定义技能

复制现有的某个技能文件夹（例如 hf-datasets/），并重命名。

更新新文件夹的 SKILL.md 文件头：

---
name: my-skill-name
description: 描述技能的功能及适用场景
---

# 技能标题
指导说明 + 示例 + 安全约束

添加或编辑你指令中引用的支持性脚本、模板和文档。
在 .claude-plugin/marketplace.json 中添加一个条目，提供简洁易懂的人类可读描述。
运行以下命令：
```
./scripts/publish.sh
```
以重新生成并验证所有生成的元数据。
在你的编码代理中重新安装或重新加载技能包，使更新后的文件夹可用。

市场

.claude-plugin/marketplace.json 文件列出了带有人类可读描述的技能，供插件市场使用。CI 会验证 SKILL.md 文件和 marketplace.json 中的技能名称和路径是否匹配，但描述是分开维护的：SKILL.md 中的描述指导 Claude 何时激活该技能，而市场描述则是为浏览可用技能的人类编写的。

其他参考

直接访问 huggingface/skills 浏览最新的指令、脚本和模板。
查阅 Hugging Face 文档，了解你在每个技能中引用的具体库或工作流。

Hugging Face Skills 快速上手指南

Hugging Face Skills 是一套标准化的 AI/ML 任务定义（如数据集创建、模型训练、评估），可被主流编程助手（如 Claude Code, OpenAI Codex, Google Gemini CLI, Cursor）直接识别和调用。本指南将帮助你快速配置并使用这些技能。

环境准备

在使用前，请确保你的开发环境满足以下要求：

操作系统：Linux, macOS 或 Windows (WSL 推荐)。
编程助手：已安装并配置好以下任一工具：
- Claude Code
- OpenAI Codex
- Google Gemini CLI
- Cursor IDE
网络环境：由于资源托管在 GitHub 和 Hugging Face，国内开发者建议配置全局代理或使用加速镜像，以确保插件安装和模型下载顺畅。
依赖工具：部分技能可能需要 git, python, nodejs 等基础运行环境，具体取决于你调用的技能类型。

安装步骤

根据你使用的编程助手，选择对应的安装方式。

1. Claude Code 用户

通过插件市场注册并安装技能包：

# 1. 注册 Hugging Face Skills 为插件市场源
/plugin marketplace add huggingface/skills

# 2. 安装具体技能（例如安装 hf-cli 技能）
/plugin install hf-cli@huggingface/skills

2. OpenAI Codex 用户

Codex 通过读取特定目录下的 SKILL.md 文件来发现技能。

# 将所需的技能文件夹从仓库复制到 Codex 的标准技能目录
# 示例：将 hf-cli 技能复制到当前项目的 .agents/skills 目录
cp -r skills/hf-cli $REPO_ROOT/.agents/skills/

# 或者复制到全局目录
cp -r skills/hf-cli $HOME/.agents/skills/

注：如果你的 Codex 配置仍依赖 AGENTS.md，可直接使用仓库中的 agents/AGENTS.md 文件作为指令集。

3. Google Gemini CLI 用户

通过扩展命令安装：

# 本地安装（需先 clone 本仓库）
gemini extensions install . --consent

# 或直接通过 GitHub URL 安装
gemini extensions install https://github.com/huggingface/skills.git --consent

4. Cursor 用户

Cursor 支持通过插件清单自动识别。

方法一：在 Cursor 设置中，通过 "Install from Repository URL" 输入本仓库地址进行安装。
方法二：如果是本地开发，确保项目根目录包含 .cursor-plugin/plugin.json 或 .mcp.json 文件，Cursor 会自动加载。

基本使用

安装完成后，无需手动运行脚本。只需在与编程助手的对话中直接提及技能名称或功能描述，助手便会自动加载对应的 SKILL.md 指令和辅助脚本来完成任务。

使用示例

场景 1：管理模型与数据集

“使用 hf-cli 技能帮我下载 meta-llama/Llama-3-8b 模型，并上传我的微调数据到 Hugging Face Hub。”

场景 2：模型评估

“调用 huggingface-community-evals 技能，从 README 中提取评估表格，并使用 vLLM 运行一次自定义评估。”

场景 3：构建演示应用

“利用 huggingface-gradio 技能，为我刚才训练的图像分类模型创建一个 Web 演示界面，包含图片上传组件和结果展示。”

场景 4：训练任务

“使用 huggingface-llm-trainer 技能估算运行 70B 参数模型所需的 GPU 显存，并生成基于 TRL 的 SFT 训练脚本。”

自定义技能（可选）

如果你需要定制专属技能：

复制 skills/ 目录下现有的任意技能文件夹并重命名。
修改新文件夹内的 SKILL.md，更新 YAML 头部信息（name, description）及具体指导内容。
运行 ./scripts/publish.sh 重新生成元数据。
在你的编程助手中重新加载该技能目录。

常见问题

使用 gemini-cli 安装扩展时，因 AGENTS.md 文件导致安装失败怎么办？

为什么在 gemini-cli 中 .md 文件会导致 schema 验证错误？

如何在 claude code 中正确添加和安装 huggingface/skills 插件？

claude code 报错找不到 marketplace.json 文件如何解决？

该项目是否接受外部技能集合（如 NoizAI/skills）的贡献？

如果之前通过 gemini-cli 安装失败，如何彻底清理残留文件以便重新安装？

相似工具推荐

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|今天

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 139k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 107.7k|★★☆☆☆|2天前

开发框架图像Agent

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。

★ 85k|★★☆☆☆|今天

图像数据工具视频

ragflow

RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。

★ 77.1k|★★★☆☆|2天前

Agent图像开发框架

OpenHands

OpenHands 是一个专注于 AI 驱动开发的开源平台，旨在让智能体（Agent）像人类开发者一样理解、编写和调试代码。它解决了传统编程中重复性劳动多、环境配置复杂以及人机协作效率低等痛点，通过自动化流程显著提升开发速度。无论是希望提升编码效率的软件工程师、探索智能体技术的研究人员，还是需要快速原型验证的技术团队，都能从中受益。OpenHands 提供了灵活多样的使用方式：既可以通过命令行（CLI）或本地图形界面在个人电脑上轻松上手，体验类似 Devin 的流畅交互；也能利用其强大的 Python SDK 自定义智能体逻辑，甚至在云端大规模部署上千个智能体并行工作。其核心技术亮点在于模块化的软件智能体 SDK，这不仅构成了平台的引擎，还支持高度可组合的开发模式。此外，OpenHands 在 SWE-bench 基准测试中取得了 77.6% 的优异成绩，证明了其解决真实世界软件工程问题的能力。平台还具备完善的企业级功能，支持与 Slack、Jira 等工具集成，并提供细粒度的权限管理，适合从个人开发者到大型企业的各类用户场景。

★ 70.6k|★★★☆☆|今天

语言模型Agent开发框架