codex-skills

851 43 简单 2 次阅读昨天Agent插件

AI 解读由 AI 自动生成，仅供参考

codex-skills 是一个专为 AI 编程助手扩展能力的技能集合库，旨在赋予 Codex 等智能体处理复杂工程任务的本领。它整合了从项目规划、文档查阅到前端设计与浏览器自动化的全方位模块。许多开发者在使用 AI 辅助编程时，常面临 AI 难以拆解复杂需求或无法精准获取最新技术文档的困境。codex-skills 通过提供结构化的任务拆解计划和实时文档检索能力，有效解决了这些协作障碍，让 AI 真正成为得力的开发搭档。

它特别适合需要高效完成全栈开发的程序员和 AI 应用构建者。其独特亮点在于引入了多智能体协同规划机制，例如让不同模型共同制定方案并择优录取，同时内置了来自 Vercel 和 Anthropic 的前端最佳实践指南。用户只需通过简单的 CLI 命令，就能将 planner、read-github 等技能一键安装到本地环境，无论是全局共享还是针对特定项目配置都非常灵活。这使得 AI 不再局限于简单的代码生成，而是能深度参与实际的工程化落地流程。

使用场景

某初创公司全栈工程师需要在紧迫期限内交付一个包含实时数据可视化的管理后台。

没有 codex-skills 时

手动拆解复杂需求耗时费力，容易遗漏关键原子任务导致后期返工。
查阅 React 和 Next.js 官方文档需频繁切换浏览器标签，严重打断开发思路。
前端样式规范依赖个人经验，难以保证团队代码风格的一致性和可维护性。
自动化测试脚本编写繁琐，缺乏统一的执行入口且日常维护成本极高。

使用 codex-skills 后

planner 技能自动生成带冲刺阶段的详细实施计划，让任务拆解更加清晰可控。
read-github 和 ctx7old 直接提供上下文友好的文档查询，开发者无需离开终端即可获取信息。
vercel-react-best-practices 内置最佳实践指引，确保代码结构符合高性能标准。
agent-browser 快速完成页面交互验证与截图，大幅降低了人工手动测试的时间消耗。

codex-skills 通过标准化技能模块显著提升了复杂项目的交付效率与代码质量。

运行环境要求

操作系统

未说明

GPU

无需本地 GPU，依赖云端 API

内存

未说明

依赖

notes需配置 CONTEXT7_API_KEY 和 GEMINI_API_KEY; llm-council 需多厂商 API 订阅 (Claude/OpenAI/Gemini); 浏览器自动化技能依赖 Playwright 或 Rust 二进制工具; 钩子目录包含 Python 安装脚本。

python3.x (用于 Hook 安装)

nodejs

python3

playwright

rust

context7-cli

快速开始

CodexSkills

一套用于规划、文档访问、前端开发和浏览器自动化的 Codex/智能体 (Agent) 技能集合。

可用技能

智能体编排

planner: 创建全面的、分阶段的实施计划，包含冲刺和原子任务。用于规划实施、分解功能或创建结构化路线图。
plan-harder: 增强型规划变体，用于更详细的分析和任务分解。
parallel-task: 通过启动多个并行子智能体同时完成任务来执行计划文件。需要来自 planner 的现有计划文件。
llm-council: 多智能体编排系统，用于规划复杂任务。生成多个 AI 规划器（Claude, Codex, Gemini）以生成独立计划，然后使用评审智能体综合最佳方案。包括实时 Web 用户界面 (UI) 用于监控进度并交互式优化计划。

文档访问

ctx7old: 通过 Context7 CLI 获取最新的库文档。
openai-docs-skill: 通过 CLI 使用 OpenAI Docs 模型上下文协议 (MCP) 服务器查询 OpenAI 开发者文档。
markdown-url: 在需要访问的任何网站前缀加上 https://markdown.new/ 以获得干净、Markdown 友好的视图。
read-github: 通过 gitmcp.io MCP 服务读取和搜索 GitHub 仓库文档。将 github.com/owner/repo URL (统一资源定位符) 转换为 gitmcp.io/owner/repo 以便 大语言模型 (LLM) 友好地访问仓库。

前端与设计

frontend-design: 独特的系统设计指导（源自 Anthropic）。
frontend-responsive-ui: 响应式 UI 标准（源自 Anthropic）。
vercel-react-best-practices: React/Next.js 性能指导（源自 Vercel）。

Codex 工具集

create-hook: 创建或更新全局或项目范围的 Codex 钩子 (Hook)。引导用户完成范围、钩子类型和行为，然后编写钩子配置和脚本。
pluginstaller: 从 GitHub 仓库安装 Codex 插件到仓库或个人市场。处理插件发现、验证和市场注册。
role-creator: 创建和更新自定义 Codex 智能体为独立的 TOML 文件。收集所需输入并将智能体定义写入全局或项目范围。

浏览器自动化

gemini-computer-use: Gemini 2.5 Computer Use 浏览器控制智能体技能（Playwright + 安全确认循环）。
agent-browser: Vercel Labs 提供的基于 Rust 的快速无头浏览器自动化 CLI，具有适用于 AI 智能体的快照/动作模式。

安装

使用 skills.sh 命令行界面 (CLI) 安装技能：

# List available skills before installing
npx skills add am-will/codex-skills --list

# Install specific skills to user scope (global)
npx skills add am-will/codex-skills --skill planner --skill context7 -g

# Install all skills interactively (prompts for selection)
npx skills add am-will/codex-skills -g

# Install to specific agents
npx skills add am-will/codex-skills --skill planner -a claude-code -a codex -g

# Install to current project (instead of global)
npx skills add am-will/codex-skills --skill planner

# Non-interactive install (skip prompts)
npx skills add am-will/codex-skills --skill planner -g -y

CLI 选项：

标志	用途
`-g, --global`	安装到用户目录（所有项目的全局范围）
`-a, --agent <agents...>`	针对特定智能体（`claude-code`, `codex` 等）
`-s, --skill <skills...>`	按名称安装特定技能
`-l, --list`	列出可用技能而不进行安装
`-y, --yes`	跳过确认提示

其他命令：

npx skills list          # 显示已安装的技能
npx skills remove <name> # 卸载技能
npx skills update        # 更新所有已安装的技能

关于浏览器工具的说明：该仓库包含两个浏览器自动化工具（gemini-computer-use 和 agent-browser）。你不需要同时安装两者——选择最适合你工作流程的一个。我推荐 agent-browser 以获得速度和简洁性。

关于 Context7 的说明：ctx7old 技能需要在 CONTEXT7_API_KEY 中设置 Context7 API 密钥。请参阅 skills/ctx7old/.env.example 进行设置。

关于 Gemini Computer Use 技能的说明：此技能需要 GEMINI_API_KEY。请让 Codex 帮助你设置它。

关于 llm-council 的说明：此技能需要多个提供商（Claude/Anthropic, OpenAI for Codex, Google for Gemini）的 API 密钥或活跃订阅。在技能目录中运行 ./setup.sh 进行配置。包括一个实时 Web UI，会在规划会话期间自动启动。

Codex 钩子目录

hooks/ 目录包含 50 个即插即用的 Codex 钩子 (Hook) 包目录，源自 davila7/claude-code-templates 并适配了 Codex 事件模型。

类别：

类别	包数量	示例
`automation`	18	Slack/Discord/Telegram 通知、Vercel 自动部署、依赖检查器、变更日志记录器
`development-tools`	8	调试窗口、保存时 lint、智能格式化、文件备份、worktree ghostty
`git`	3	常规提交、防止直接推送、验证分支名称
`git-workflow`	2	自动 git-add、智能提交
`monitoring`	2	停止时桌面通知、LangSmith 追踪
`performance`	2	性能预算守卫、性能监控器
`post-tool`	4	格式化 JS/Python 文件、git-add 更改、更改后运行测试
`pre-tool`	4	编辑前备份、console-log 清理器、bash 前通知、更新搜索年份
`quality-gates`	3	计划门控、范围守卫、TDD 门控
`security`	4	危险命令阻止器、文件保护、秘密扫描器、安全扫描器
`testing`	1	测试运行器

安装一个包：

python3 hooks/aitmpl-codex/install-bundle.py hooks/aitmpl-codex/<category>/<bundle> <target-repo>

手动安装：将包的 hooks.json 复制到 <repo>/.codex/hooks.json，将其 .codex/hooks/ 脚本复制到 <repo>/.codex/hooks/，然后重启 Codex。

有关兼容性、测试框架和包结构的完整详情，请参见 hooks/README.md。

Codex 自定义多智能体

agents/ 目录包含 Codex 的自定义多智能体配置。这些基于 TOML 的智能体 (Agent) 定义提供专用角色（架构师、前端、后端、安全等）和工作层级的并行任务执行。与 Codex 配合使用以启动专为你的工作流定制的目的构建智能体。

codex-skills 快速上手指南

codex-skills 是一个专为 Codex/Agent 设计的技能集合，提供规划、文档访问、前端开发及浏览器自动化等功能。本指南将帮助您快速集成并使用这些技能。

环境准备

在开始之前，请确保您的开发环境满足以下要求：

运行环境：已安装 Node.js 和 npm（用于执行 npx 命令）。
目标平台：适用于 Codex 及其相关 Agent 环境。
API 密钥（按需配置）：
- 使用 ctx7old 技能需设置 CONTEXT7_API_KEY。
- 使用 gemini-computer-use 技能需设置 GEMINI_API_KEY。
- 使用 llm-council 技能需配置多个提供商的 API Key（Claude/OpenAI/Gemini）。

提示：若网络环境受限，建议在使用 npx 前配置国内 npm 镜像以提升下载速度。

安装步骤

1. 安装核心技能包

使用 skills.sh CLI 工具进行安装。默认安装到用户全局范围（所有项目可用）：

# 交互式安装所有技能
npx skills add am-will/codex-skills -g

# 仅安装特定技能（例如 planner）
npx skills add am-will/codex-skills --skill planner -g

# 非交互式安装（跳过确认）
npx skills add am-will/codex-skills --skill planner -g -y

常用参数说明：

-g, --global：安装到用户目录（全局）。
-a, --agent <agents...>：指定目标 Agent（如 claude-code, codex）。
-s, --skill <skills...>：指定要安装的特定技能名称。
-l, --list：列出可用技能而不安装。

2. 安装 Hooks 工具包（可选）

仓库包含 50 个预配置的 Codex Hooks 包，可用于自动化工作流。

# 安装特定分类下的 Bundle
python3 hooks/aitmpl-codex/install-bundle.py hooks/aitmpl-codex/<category>/<bundle> <target-repo>

3. 管理已安装技能

# 查看已安装的技能
npx skills list

# 卸载特定技能
npx skills remove <name>

# 更新所有已安装技能
npx skills update

基本使用

1. 验证安装

安装完成后，可在 Agent 中直接调用已集成的技能名称。例如，在 Codex 会话中使用规划技能：

planner: Create a roadmap for implementing a new feature...

2. 浏览器自动化选择

仓库提供了两种浏览器自动化工具，二选一即可：

agent-browser：基于 Rust 的无头浏览器，速度快，推荐首选。
gemini-computer-use：Gemini 2.5 计算机使用技能。

3. 自定义 Agent

如需使用多智能体协作，可参考 agents/ 目录中的 TOML 配置文件，将其加载至 Codex 以启动专用角色（如架构师、前端专家等）。

注意：部分技能依赖外部 API 服务，请确保已在环境变量中正确配置相应的密钥，否则可能导致技能无法正常工作。

常见问题

在 Windows PowerShell 环境中运行 codex-subagent 技能失败怎么办？

如何更新已安装的 Codex Skills？

plan-harder 技能在计划模式下无法写入文件如何解决？

如何创建不绑定特定技术栈的通用代理角色？

相似工具推荐

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|今天

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 139k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 107.7k|★★☆☆☆|2天前

开发框架图像Agent

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。

★ 85k|★★☆☆☆|今天

图像数据工具视频

ragflow

RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。

★ 77.1k|★★★☆☆|2天前

Agent图像开发框架

OpenHands

OpenHands 是一个专注于 AI 驱动开发的开源平台，旨在让智能体（Agent）像人类开发者一样理解、编写和调试代码。它解决了传统编程中重复性劳动多、环境配置复杂以及人机协作效率低等痛点，通过自动化流程显著提升开发速度。无论是希望提升编码效率的软件工程师、探索智能体技术的研究人员，还是需要快速原型验证的技术团队，都能从中受益。OpenHands 提供了灵活多样的使用方式：既可以通过命令行（CLI）或本地图形界面在个人电脑上轻松上手，体验类似 Devin 的流畅交互；也能利用其强大的 Python SDK 自定义智能体逻辑，甚至在云端大规模部署上千个智能体并行工作。其核心技术亮点在于模块化的软件智能体 SDK，这不仅构成了平台的引擎，还支持高度可组合的开发模式。此外，OpenHands 在 SWE-bench 基准测试中取得了 77.6% 的优异成绩，证明了其解决真实世界软件工程问题的能力。平台还具备完善的企业级功能，支持与 Slack、Jira 等工具集成，并提供细粒度的权限管理，适合从个人开发者到大型企业的各类用户场景。

★ 70.6k|★★★☆☆|今天

语言模型Agent开发框架