Agent-Skills-for-Context-Engineering
Agent-Skills-for-Context-Engineering 是一个开源的 Agent 技能集合,专注于上下文工程(Context Engineering)领域,帮助开发者构建生产级的 AI Agent 系统。
上下文工程是管理语言模型上下文窗口的学科。与单纯的提示词工程不同,它关注的是如何优化进入模型注意力预算的所有信息——包括系统提示、工具定义、检索文档、消息历史和工具输出等。随着上下文变长,模型会出现“中间丢失”、注意力衰减等问题,这个工具正是为了解决这些挑战而设计的。
该仓库提供了系统化的技能模块,涵盖基础概念(如上下文降级模式、压缩策略)、架构设计(多 Agent 模式、记忆系统、工具设计)、运营优化(上下文压缩、评估框架)以及项目开发方法论。此外还支持构建托管 Agent,配备沙盒虚拟机和多人协作功能。
适合有一定编程基础的开发者、研究人员以及正在构建 AI Agent 产品的技术团队使用。无论是想学习如何优化 Agent 上下文管理,还是需要具体的架构模式和评估方法,这个开源项目都能提供实用的参考和可复用的技能模板。
使用场景
某中型科技公司的 AI 团队正在开发一个企业级智能代码审查助手,需要同时处理代码片段、审查历史、团队规范和工具输出,在多轮对话中保持一致性和准确性。
没有 Agent-Skills-for-Context-Engineering 时
- 团队在构建 Agent 时只能凭经验调整上下文,导致模型在长对话中频繁出现"遗忘"早期需求的问题
- 多 Agent 协作时,每个 Agent 的上下文相互干扰,无法有效区分不同任务的信息优先级
- 代码审查涉及大量工具输出(静态分析结果、测试报告),直接填入上下文导致 token 浪费严重,模型性能下降
- 团队反复调试但找不到根本原因,只能通过缩短对话长度来规避问题,严重影响用户体验
- 缺乏系统性的评估方法,无法量化不同上下文策略的效果,优化工作盲目且低效
使用 Agent-Skills-for-Context-Engineering 后
- 应用 context-degradation 技能识别出"lost-in-the-middle"现象,针对性地将关键审查规则放在上下文的开头和结尾
- 采用 context-compression 技能对工具输出进行结构化压缩,在保留关键信息的同时减少 60% 的 token 消耗
- 引入 memory-systems 技能设计分层记忆架构,将团队规范存入长期记忆,当前审查任务使用短期记忆
- 运用 multi-agent-patterns 技能重构为"审查员+规范检查员+建议生成器"的分层架构,降低上下文复杂度
- 通过 evaluation 和 advanced-evaluation 技能建立量化评估体系,用 LLM-as-Judge 方法持续监控并优化上下文策略
通过系统性的上下文工程,这家企业成功将代码审查助手的有效对话轮次从 5 轮提升至 20 轮以上,审查准确率提高 35%。
运行环境要求
- 未说明
未说明
未说明

快速开始
上下文工程的智能体技能集
一个全面、开放的智能体技能集,专注于构建生产级AI智能体系统的上下文工程原则。这些技能教授策划上下文的艺术和科学,以在任何智能体平台上最大化智能体效能。
什么是上下文工程?
上下文工程是管理语言模型上下文窗口的学科。与专注于制作有效指令的提示工程不同,上下文工程关注的是对进入模型有限注意力预算的所有信息进行整体整理:系统提示、工具定义、检索到的文档、消息历史和工具输出。
根本挑战在于上下文窗口受限于注意力机制而非原始令牌容量。随着上下文长度增加,模型表现出可预测的退化模式:"中间丢失"现象、U形注意力曲线和注意力稀缺。有效的上下文工程意味着寻找最小化的高信号令牌集合,以最大化预期结果的概率。
认可
该仓库在学术研究中被引用,作为静态技能架构的基础性工作:
"虽然静态技能已被广泛认可 [Anthropic, 2025b; Muratcan Koylan, 2025],但MCE是首批动态演进它们的系统之一,弥合了手动技能工程和自主自我改进之间的鸿沟。"
— 通过智能体技能演进的元上下文工程,北京大学通用人工智能国家重点实验室 (2026)
技能概览
基础技能
这些技能为所有后续的上下文工程工作奠定基础理解。
| 技能 | 描述 |
|---|---|
| context-fundamentals | 理解什么是上下文、为什么它重要,以及智能体系统中上下文的结构 |
| context-degradation | 识别上下文失败模式:中间丢失、污染、干扰和冲突 |
| context-compression | 设计和评估长时间运行的会话的压缩策略 |
架构技能
这些技能涵盖构建有效智能体系统的模式和结构。
| 技能 | 描述 |
|---|---|
| multi-agent-patterns | 掌握编排器、点对点和分层多智能体架构 |
| memory-systems | 设计短期、长期和基于图的记忆架构 |
| tool-design | 构建智能体可以有效使用的工具 |
| filesystem-context | 使用文件系统进行动态上下文发现、工具输出卸载和计划持久化 |
| hosted-agents | 新增 使用沙盒虚拟机、预构建镜像、多人支持和多客户端接口构建后台编码智能体 |
运维技能
这些技能解决智能体系统的持续运行和优化问题。
| 技能 | 描述 |
|---|---|
| context-optimization | 应用压缩、掩码和缓存策略 |
| evaluation | 为智能体系统构建评估框架 |
| advanced-evaluation | 掌握LLM作为评判者的技术:直接评分、成对比较、评分标准生成和偏差缓解 |
开发方法论
这些技能涵盖构建LLM驱动项目的元级实践。
| 技能 | 描述 |
|---|---|
| project-development | 从构思到部署设计和构建LLM项目,包括任务-模型匹配分析、管道架构和结构化输出设计 |
认知架构技能
这些技能涵盖智能体系统的形式化认知建模。
| 技能 | 描述 |
|---|---|
| bdi-mental-states | 新增 使用形式化BDI本体模式将外部RDF上下文转换为智能体心理状态(信念、愿望、意图),用于审慎推理和可解释性 |
设计理念
渐进式披露
每个技能都为高效使用上下文而构建。在启动时,智能体只加载技能名称和描述。只有当技能被激活用于相关任务时,才会加载完整内容。
平台无关性
这些技能专注于可转移的原则,而不是供应商特定的实现。这些模式适用于Claude Code、Cursor以及任何支持技能或允许自定义指令的智能体平台。
概念基础与实践示例
脚本和示例使用Python伪代码演示概念,可在不同环境中工作,无需安装特定依赖项。
使用方法
与Claude Code一起使用
该仓库是一个Claude Code插件市场,包含上下文工程技能,Claude会根据您的任务上下文自动发现和激活这些技能。
安装
步骤1:添加市场
在Claude Code中运行此命令,将该仓库注册为插件源:
/plugin marketplace add muratcankoylan/Agent-Skills-for-Context-Engineering
步骤2:安装插件
选项A - 浏览并安装:
- 选择
浏览并安装插件 - 选择
context-engineering-marketplace - 选择
context-engineering - 选择
立即安装
选项B - 通过命令直接安装:
/plugin install context-engineering@context-engineering-marketplace
这会将所有13个技能安装为单个插件。技能会根据您的任务上下文自动激活。
###技能触发器
| 技能 | 触发条件 |
|---|---|
context-fundamentals |
"understand context", "explain context windows", "design agent architecture" |
context-degradation |
"diagnose context problems", "fix lost-in-middle", "debug agent failures" |
context-compression |
"compress context", "summarize conversation", "reduce token usage" |
context-optimization |
"optimize context", "reduce token costs", "implement KV-cache" |
multi-agent-patterns |
"design multi-agent system", "implement supervisor pattern" |
memory-systems |
"implement agent memory", "build knowledge graph", "track entities" |
tool-design |
"design agent tools", "reduce tool complexity", "implement MCP tools" |
filesystem-context |
"offload context to files", "dynamic context discovery", "agent scratch pad", "file-based context" |
hosted-agents |
"build background agent", "create hosted coding agent", "sandboxed execution", "multiplayer agent", "Modal sandboxes" |
evaluation |
"evaluate agent performance", "build test framework", "measure quality" |
advanced-evaluation |
"implement LLM-as-judge", "compare model outputs", "mitigate bias" |
project-development |
"start LLM project", "design batch pipeline", "evaluate task-model fit" |
bdi-mental-states |
"model agent mental states", "implement BDI architecture", "transform RDF to beliefs", "build cognitive agent" |
适用于 Cursor(开放插件)
本仓库已收录于 Cursor 插件目录。
.plugin/plugin.json 清单遵循开放插件标准,因此该仓库也可与任何兼容的代理工具(Codex、GitHub Copilot 等)配合使用。
使用单个技能
如需使用单个技能而不安装完整插件,可将其 SKILL.md 直接复制到项目的 .claude/skills/ 目录:
# 示例:仅添加 context-fundamentals 技能
mkdir -p .claude/skills
curl -o .claude/skills/context-fundamentals.md \
https://raw.githubusercontent.com/muratcankoylan/Agent-Skills-for-Context-Engineering/main/skills/context-fundamentals/SKILL.md
可用技能:context-fundamentals、context-degradation、context-compression、context-optimization、multi-agent-patterns、memory-systems、tool-design、filesystem-context、hosted-agents、evaluation、advanced-evaluation、project-development、bdi-mental-states
自定义实现
可从任何技能中提取原则和模式,并将其实现到您的代理框架中。这些技能刻意保持与平台无关的特性。
示例
examples 文件夹包含完整的系统设计,展示了多个技能如何在实践中协同工作。
| 示例 | 描述 | 应用的技能 |
|---|---|---|
| digital-brain-skill | 新增 为创始人和创作者打造的个人操作系统。完整的 Claude Code 技能,包含 6 个模块、4 个自动化脚本 | context-fundamentals, context-optimization, memory-systems, tool-design, multi-agent-patterns, evaluation, project-development |
| x-to-book-system | 监控 X 账号并生成每日综合书籍的多代理系统 | multi-agent-patterns, memory-systems, context-optimization, tool-design, evaluation |
| llm-as-judge-skills | 生产就绪的 LLM 评估工具,包含 TypeScript 实现,19 个通过测试 | advanced-evaluation, tool-design, context-fundamentals, evaluation |
| book-sft-pipeline | 训练模型以任何作者的风格写作。包括 Gertrude Stein 案例研究,在 Pangram 上获得 70% 人类评分,总成本 $2 | project-development, context-compression, multi-agent-patterns, evaluation |
每个示例包含:
- 完整的 PRD 及架构决策
- 技能映射,展示哪些概念影响了每个决策
- 实现指南
Digital Brain Skill 示例
digital-brain-skill 示例是一个完整的个人操作系统,展示了全面的技能应用:
- 渐进式展示(Progressive Disclosure):3 级加载(SKILL.md → MODULE.md → 数据文件)
- 模块隔离(Module Isolation):6 个独立模块(身份、内容、知识、网络、运营、代理)
- 追加式内存(Append-Only Memory):使用模式优先行的 JSONL 文件,便于代理解析
- 自动化脚本(Automation Scripts):4 个整合工具(weekly_review、content_ideas、stale_contacts、idea_to_draft)
包含详细的可追溯性文档 HOW-SKILLS-BUILT-THIS.md,将每个架构决策映射到特定的技能原则。
LLM-as-Judge Skills 示例
llm-as-judge-skills 示例是一个完整的 TypeScript 实现,展示了:
- 直接评分(Direct Scoring):根据加权标准和评分规则评估响应
- 成对比较(Pairwise Comparison):比较响应并缓解位置偏差
- 评分规则生成(Rubric Generation):创建领域特定的评估标准
- EvaluatorAgent:整合所有评估能力的高级代理
Book SFT Pipeline 示例
book-sft-pipeline 示例展示了训练小型模型(8B)以任何作者风格写作:
- 智能分段(Intelligent Segmentation):双层分块与重叠,最大化训练样本
- 提示多样性(Prompt Diversity):15+ 模板防止记忆并强制风格学习
- Tinker 集成(Tinker Integration):完整的 LoRA 训练工作流,总成本 $2
- 验证方法论(Validation Methodology):现代场景测试证明风格迁移优于内容记忆
与上下文工程技能集成:project-development、context-compression、multi-agent-patterns、evaluation。
Star 历史
结构
每个技能遵循 Agent Skills 规范:
skill-name/
├── SKILL.md # 必需:说明 + 元数据
├── scripts/ # 可选:演示概念的可执行代码
└── references/ # 可选:额外文档和资源
请参阅 template 文件夹了解规范的技能结构。
贡献指南
本仓库采用 Agent Skills 开放开发模式。欢迎来自更广泛生态系统的贡献。在贡献时,请遵循以下原则:
- 遵循技能模板结构
- 提供清晰、可操作的指令
- 在适当的地方包含可工作的示例
- 记录权衡取舍和潜在问题
- 将 SKILL.md 保持在 500 行以内以获得最佳性能
欢迎与 Muratcan Koylan 联系,讨论合作机会或任何咨询。
许可证
MIT 许可证 - 详见 LICENSE 文件。
参考资料
这些技能的原则来源于领先人工智能实验室和框架开发者的研究和生产经验。每项技能都包含支撑其建议的基础研究和案例研究参考。
版本历史
v2.0.02026/03/17v1.1.02025/12/24常见问题
相似工具推荐
stable-diffusion-webui
stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。
everything-claude-code
everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上
ComfyUI
ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。
NextChat
NextChat 是一款轻量且极速的 AI 助手,旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性,以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发,NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。 这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言,它也提供了便捷的自托管方案,支持一键部署到 Vercel 或 Zeabur 等平台。 NextChat 的核心亮点在于其广泛的模型兼容性,原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型,让用户在一个界面即可自由切换不同 AI 能力。此外,它还率先支持 MCP(Model Context Protocol)协议,增强了上下文处理能力。针对企业用户,NextChat 提供专业版解决方案,具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能,满足公司对数据隐私和个性化管理的高标准要求。
ML-For-Beginners
ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程,旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周,包含 26 节精炼课程和 52 道配套测验,内容涵盖从基础概念到实际应用的完整流程,有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。 无论是希望转型的开发者、需要补充算法背景的研究人员,还是对人工智能充满好奇的普通爱好者,都能从中受益。课程不仅提供了清晰的理论讲解,还强调动手实践,让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持,通过自动化机制提供了包括简体中文在内的 50 多种语言版本,极大地降低了全球不同背景用户的学习门槛。此外,项目采用开源协作模式,社区活跃且内容持续更新,确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路,ML-For-Beginners 将是理想的起点。
ragflow
RAGFlow 是一款领先的开源检索增强生成(RAG)引擎,旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体(Agent)能力相结合,不仅支持从各类文档中高效提取知识,还能让模型基于这些知识进行逻辑推理和任务执行。 在大模型应用中,幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构(如表格、图表及混合排版),显著提升了信息检索的准确度,从而有效减少模型“胡编乱造”的现象,确保回答既有据可依又具备时效性。其内置的智能体机制更进一步,使系统不仅能回答问题,还能自主规划步骤解决复杂问题。 这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统,还是致力于探索大模型在垂直领域落地的创新者,都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口,既降低了非算法背景用户的上手门槛,也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目,它正成为连接通用大模型与行业专有知识之间的重要桥梁。