codex-skills

GitHub
851 43 简单 2 次阅读 昨天Agent插件
AI 解读 由 AI 自动生成,仅供参考

codex-skills 是一个专为 AI 编程助手扩展能力的技能集合库,旨在赋予 Codex 等智能体处理复杂工程任务的本领。它整合了从项目规划、文档查阅到前端设计与浏览器自动化的全方位模块。许多开发者在使用 AI 辅助编程时,常面临 AI 难以拆解复杂需求或无法精准获取最新技术文档的困境。codex-skills 通过提供结构化的任务拆解计划和实时文档检索能力,有效解决了这些协作障碍,让 AI 真正成为得力的开发搭档。

它特别适合需要高效完成全栈开发的程序员和 AI 应用构建者。其独特亮点在于引入了多智能体协同规划机制,例如让不同模型共同制定方案并择优录取,同时内置了来自 Vercel 和 Anthropic 的前端最佳实践指南。用户只需通过简单的 CLI 命令,就能将 planner、read-github 等技能一键安装到本地环境,无论是全局共享还是针对特定项目配置都非常灵活。这使得 AI 不再局限于简单的代码生成,而是能深度参与实际的工程化落地流程。

使用场景

某初创公司全栈工程师需要在紧迫期限内交付一个包含实时数据可视化的管理后台。

没有 codex-skills 时

  • 手动拆解复杂需求耗时费力,容易遗漏关键原子任务导致后期返工。
  • 查阅 React 和 Next.js 官方文档需频繁切换浏览器标签,严重打断开发思路。
  • 前端样式规范依赖个人经验,难以保证团队代码风格的一致性和可维护性。
  • 自动化测试脚本编写繁琐,缺乏统一的执行入口且日常维护成本极高。

使用 codex-skills 后

  • planner 技能自动生成带冲刺阶段的详细实施计划,让任务拆解更加清晰可控。
  • read-github 和 ctx7old 直接提供上下文友好的文档查询,开发者无需离开终端即可获取信息。
  • vercel-react-best-practices 内置最佳实践指引,确保代码结构符合高性能标准。
  • agent-browser 快速完成页面交互验证与截图,大幅降低了人工手动测试的时间消耗。

codex-skills 通过标准化技能模块显著提升了复杂项目的交付效率与代码质量。

运行环境要求

操作系统
  • 未说明
GPU

无需本地 GPU,依赖云端 API

内存

未说明

依赖
notes需配置 CONTEXT7_API_KEY 和 GEMINI_API_KEY; llm-council 需多厂商 API 订阅 (Claude/OpenAI/Gemini); 浏览器自动化技能依赖 Playwright 或 Rust 二进制工具; 钩子目录包含 Python 安装脚本。
python3.x (用于 Hook 安装)
nodejs
python3
playwright
rust
context7-cli
codex-skills hero image

快速开始

image

CodexSkills

一套用于规划、文档访问、前端开发和浏览器自动化的 Codex/智能体 (Agent) 技能集合。

可用技能

智能体编排

  • planner: 创建全面的、分阶段的实施计划,包含冲刺和原子任务。用于规划实施、分解功能或创建结构化路线图。
  • plan-harder: 增强型规划变体,用于更详细的分析和任务分解。
  • parallel-task: 通过启动多个并行子智能体同时完成任务来执行计划文件。需要来自 planner 的现有计划文件。
  • llm-council: 多智能体编排系统,用于规划复杂任务。生成多个 AI 规划器(Claude, Codex, Gemini)以生成独立计划,然后使用评审智能体综合最佳方案。包括实时 Web 用户界面 (UI) 用于监控进度并交互式优化计划。

文档访问

  • ctx7old: 通过 Context7 CLI 获取最新的库文档。
  • openai-docs-skill: 通过 CLI 使用 OpenAI Docs 模型上下文协议 (MCP) 服务器查询 OpenAI 开发者文档。
  • markdown-url: 在需要访问的任何网站前缀加上 https://markdown.new/ 以获得干净、Markdown 友好的视图。
  • read-github: 通过 gitmcp.io MCP 服务读取和搜索 GitHub 仓库文档。将 github.com/owner/repo URL (统一资源定位符) 转换为 gitmcp.io/owner/repo 以便 大语言模型 (LLM) 友好地访问仓库。

前端与设计

  • frontend-design: 独特的系统设计指导(源自 Anthropic)。
  • frontend-responsive-ui: 响应式 UI 标准(源自 Anthropic)。
  • vercel-react-best-practices: React/Next.js 性能指导(源自 Vercel)。

Codex 工具集

  • create-hook: 创建或更新全局或项目范围的 Codex 钩子 (Hook)。引导用户完成范围、钩子类型和行为,然后编写钩子配置和脚本。
  • pluginstaller: 从 GitHub 仓库安装 Codex 插件到仓库或个人市场。处理插件发现、验证和市场注册。
  • role-creator: 创建和更新自定义 Codex 智能体为独立的 TOML 文件。收集所需输入并将智能体定义写入全局或项目范围。

浏览器自动化

  • gemini-computer-use: Gemini 2.5 Computer Use 浏览器控制智能体技能(Playwright + 安全确认循环)。
  • agent-browser: Vercel Labs 提供的基于 Rust 的快速无头浏览器自动化 CLI,具有适用于 AI 智能体的快照/动作模式。

安装

使用 skills.sh 命令行界面 (CLI) 安装技能:

# List available skills before installing
npx skills add am-will/codex-skills --list

# Install specific skills to user scope (global)
npx skills add am-will/codex-skills --skill planner --skill context7 -g

# Install all skills interactively (prompts for selection)
npx skills add am-will/codex-skills -g

# Install to specific agents
npx skills add am-will/codex-skills --skill planner -a claude-code -a codex -g

# Install to current project (instead of global)
npx skills add am-will/codex-skills --skill planner

# Non-interactive install (skip prompts)
npx skills add am-will/codex-skills --skill planner -g -y

CLI 选项:

标志 用途
-g, --global 安装到用户目录(所有项目的全局范围)
-a, --agent <agents...> 针对特定智能体(claude-code, codex 等)
-s, --skill <skills...> 按名称安装特定技能
-l, --list 列出可用技能而不进行安装
-y, --yes 跳过确认提示

其他命令:

npx skills list          # 显示已安装的技能
npx skills remove <name> # 卸载技能
npx skills update        # 更新所有已安装的技能

关于浏览器工具的说明:该仓库包含两个浏览器自动化工具(gemini-computer-useagent-browser)。你不需要同时安装两者——选择最适合你工作流程的一个。我推荐 agent-browser 以获得速度和简洁性。

关于 Context7 的说明ctx7old 技能需要在 CONTEXT7_API_KEY 中设置 Context7 API 密钥。请参阅 skills/ctx7old/.env.example 进行设置。

关于 Gemini Computer Use 技能的说明:此技能需要 GEMINI_API_KEY。请让 Codex 帮助你设置它。

关于 llm-council 的说明:此技能需要多个提供商(Claude/Anthropic, OpenAI for Codex, Google for Gemini)的 API 密钥或活跃订阅。在技能目录中运行 ./setup.sh 进行配置。包括一个实时 Web UI,会在规划会话期间自动启动。


Codex 钩子目录

hooks/ 目录包含 50 个即插即用的 Codex 钩子 (Hook) 包目录,源自 davila7/claude-code-templates 并适配了 Codex 事件模型。

类别:

类别 包数量 示例
automation 18 Slack/Discord/Telegram 通知、Vercel 自动部署、依赖检查器、变更日志记录器
development-tools 8 调试窗口、保存时 lint、智能格式化、文件备份、worktree ghostty
git 3 常规提交、防止直接推送、验证分支名称
git-workflow 2 自动 git-add、智能提交
monitoring 2 停止时桌面通知、LangSmith 追踪
performance 2 性能预算守卫、性能监控器
post-tool 4 格式化 JS/Python 文件、git-add 更改、更改后运行测试
pre-tool 4 编辑前备份、console-log 清理器、bash 前通知、更新搜索年份
quality-gates 3 计划门控、范围守卫、TDD 门控
security 4 危险命令阻止器、文件保护、秘密扫描器、安全扫描器
testing 1 测试运行器

安装一个包:

python3 hooks/aitmpl-codex/install-bundle.py hooks/aitmpl-codex/<category>/<bundle> <target-repo>

手动安装:将包的 hooks.json 复制到 <repo>/.codex/hooks.json,将其 .codex/hooks/ 脚本复制到 <repo>/.codex/hooks/,然后重启 Codex。

有关兼容性、测试框架和包结构的完整详情,请参见 hooks/README.md


Codex 自定义多智能体

agents/ 目录包含 Codex 的自定义多智能体配置。这些基于 TOML 的智能体 (Agent) 定义提供专用角色(架构师、前端、后端、安全等)和工作层级的并行任务执行。与 Codex 配合使用以启动专为你的工作流定制的目的构建智能体。

常见问题

相似工具推荐

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。

162.1k|★★★☆☆|今天
开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上

139k|★★☆☆☆|今天
开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。

107.7k|★★☆☆☆|2天前
开发框架图像Agent

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程,旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周,包含 26 节精炼课程和 52 道配套测验,内容涵盖从基础概念到实际应用的完整流程,有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。 无论是希望转型的开发者、需要补充算法背景的研究人员,还是对人工智能充满好奇的普通爱好者,都能从中受益。课程不仅提供了清晰的理论讲解,还强调动手实践,让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持,通过自动化机制提供了包括简体中文在内的 50 多种语言版本,极大地降低了全球不同背景用户的学习门槛。此外,项目采用开源协作模式,社区活跃且内容持续更新,确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路,ML-For-Beginners 将是理想的起点。

85k|★★☆☆☆|今天
图像数据工具视频

ragflow

RAGFlow 是一款领先的开源检索增强生成(RAG)引擎,旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体(Agent)能力相结合,不仅支持从各类文档中高效提取知识,还能让模型基于这些知识进行逻辑推理和任务执行。 在大模型应用中,幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构(如表格、图表及混合排版),显著提升了信息检索的准确度,从而有效减少模型“胡编乱造”的现象,确保回答既有据可依又具备时效性。其内置的智能体机制更进一步,使系统不仅能回答问题,还能自主规划步骤解决复杂问题。 这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统,还是致力于探索大模型在垂直领域落地的创新者,都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口,既降低了非算法背景用户的上手门槛,也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目,它正成为连接通用大模型与行业专有知识之间的重要桥梁。

77.1k|★★★☆☆|2天前
Agent图像开发框架

OpenHands

OpenHands 是一个专注于 AI 驱动开发的开源平台,旨在让智能体(Agent)像人类开发者一样理解、编写和调试代码。它解决了传统编程中重复性劳动多、环境配置复杂以及人机协作效率低等痛点,通过自动化流程显著提升开发速度。 无论是希望提升编码效率的软件工程师、探索智能体技术的研究人员,还是需要快速原型验证的技术团队,都能从中受益。OpenHands 提供了灵活多样的使用方式:既可以通过命令行(CLI)或本地图形界面在个人电脑上轻松上手,体验类似 Devin 的流畅交互;也能利用其强大的 Python SDK 自定义智能体逻辑,甚至在云端大规模部署上千个智能体并行工作。 其核心技术亮点在于模块化的软件智能体 SDK,这不仅构成了平台的引擎,还支持高度可组合的开发模式。此外,OpenHands 在 SWE-bench 基准测试中取得了 77.6% 的优异成绩,证明了其解决真实世界软件工程问题的能力。平台还具备完善的企业级功能,支持与 Slack、Jira 等工具集成,并提供细粒度的权限管理,适合从个人开发者到大型企业的各类用户场景。

70.6k|★★★☆☆|今天
语言模型Agent开发框架