claude-skills
claude-skills 是一个专为 AI 编程助手打造的开源技能库,旨在为 Claude Code、Cursor、Gemini CLI 等 11 种主流编码代理注入垂直领域的专业智慧。它解决了通用大模型在特定业务场景(如工程架构、市场营销、合规审计及高管决策)中缺乏深度专业知识的问题,让 AI 不仅能写代码,更能像行业专家一样思考和执行复杂任务。
该工具非常适合开发者、技术负责人、产品经理以及需要利用 AI 处理跨领域工作的专业人士使用。其核心亮点在于模块化的设计:每个技能包都包含结构化的工作流指令(SKILL.md)、305 个仅依赖标准库的 Python 实用脚本(无需额外安装依赖),以及专业的参考文档模板。此外,claude-skills 独创了“技能、代理、角色”三层协作体系,分别定义执行步骤、任务目标与思维人格,用户可灵活组合这三者以应对从单一代码审查到模拟初创公司 CTO 决策等各类复杂场景。作为一个拥有超过 5200 颗星的热门项目,它提供了一站式的解决方案,让用户能轻松将通用的 coding agent 升级为懂业务、守规范的全能型数字员工。
使用场景
某初创公司技术负责人需要在两天内完成核心支付模块的安全审计与合规检查,以应对即将到来的融资尽职调查。
没有 claude-skills 时
- 领域知识缺失:通用 AI 助手仅能给出泛泛的安全建议,缺乏针对金融支付场景的具体合规标准(如 PCI-DSS)和深度代码漏洞扫描能力。
- 工作流割裂:工程师需手动编写提示词来模拟安全专家、法律顾问和 CTO 三种角色,反复切换上下文,导致沟通成本极高且逻辑不连贯。
- 执行效率低下:缺乏预置的自动化脚本,所有检查步骤(如依赖项扫描、加密算法验证)均需人工逐行确认,耗时数天仍难以覆盖全部风险点。
- 输出质量不稳定:生成的报告格式混乱,缺乏专业的决策框架,无法直接用于向董事会或投资方汇报。
使用 claude-skills 后
- 即插即用专家能力:直接激活
skill-security-auditor和ra-qm-skills,AI 立即具备金融级安全审计与合规检查的专业知识库,精准定位支付逻辑漏洞。 - 多角色协同编排:通过组合
c-level-skills中的 CTO 人格与安全技能,自动构建从代码审查到战略风险评估的完整闭环,无需人工干预角色切换。 - 自动化高效执行:调用内置的 305 个 Python 工具脚本,一键完成依赖扫描、加密强度测试及合规清单核对,将原本数天的工作量压缩至数小时。
- 标准化专业交付:基于预定义的决策框架自动生成结构清晰、数据详实的尽职调查报告,直接满足投资机构的审核要求。
claude-skills 通过将分散的领域专家经验封装为可复用技能包,让单一开发者瞬间拥有整个专家团队的生产力与专业度。
运行环境要求
- Linux
- macOS
- Windows
未说明
未说明

快速开始
Claude 代码技能与插件 — 适用于所有编码工具的代理技能
233 个可直接用于生产的 Claude 代码技能、插件及代理技能,覆盖 11 款 AI 编码工具。
最全面的开源 Claude 代码技能与代理插件库——同样兼容 OpenAI Codex、Gemini CLI、Cursor 等 7 款编码代理。可复用的专业知识包涵盖工程、DevOps、营销、合规、C 级顾问等多个领域。
兼容: Claude 代码 · OpenAI Codex · Gemini CLI · OpenClaw · Cursor · Aider · Windsurf · Kilo Code · OpenCode · Augment · Antigravity
5,200+ GitHub 星标——最全面的开源 Claude 代码技能与代理插件库。
什么是 Claude 代码技能与代理插件?
Claude 代码技能(也称为代理技能或编码代理插件)是模块化的指令包,为 AI 编码代理提供其默认不具备的专业领域知识。每个技能包含:
- SKILL.md — 结构化指令、工作流程和决策框架
- Python 工具 — 305 个 CLI 脚本(全部仅使用标准库,无需安装任何第三方包)
- 参考文档 — 模板、检查清单及领域特定知识
一个仓库,十一种平台。 可原生作为 Claude 代码插件、Codex 代理技能、Gemini CLI 技能使用,并可通过 scripts/convert.sh 转换为另外 8 种工具。所有 305 个 Python 工具均可在任何支持 Python 的环境中运行。
技能 vs 代理 vs 角色
| 技能 | 代理 | 角色 | |
|---|---|---|---|
| 目的 | 如何执行一项任务 | 应该执行什么任务 | 是谁在思考 |
| 范围 | 单一领域 | 单一领域 | 跨领域 |
| 语气 | 中立 | 专业 | 带有人格特质 |
| 示例 | “按照这些步骤进行 SEO” | “执行安全审计” | “以初创公司 CTO 的视角思考” |
三者相辅相成。请参阅 编排 了解如何将它们结合使用。
快速安装
Gemini CLI(新)
# 克隆仓库
git clone https://github.com/alirezarezvani/claude-skills.git
cd claude-skills
# 运行安装脚本
./scripts/gemini-install.sh
# 开始使用技能
> activate_skill(name="senior-architect")
Claude 代码(推荐)
# 添加市场
/plugin marketplace add alirezarezvani/claude-skills
# 按领域安装
/plugin install engineering-skills@claude-code-skills # 24 项核心工程技能
/plugin install engineering-advanced-skills@claude-code-skills # 25 项强大技能
/plugin install product-skills@claude-code-skills # 12 项产品技能
/plugin install marketing-skills@claude-code-skills # 43 项营销技能
/plugin install ra-qm-skills@claude-code-skills # 12 项监管/质量相关技能
/plugin install pm-skills@claude-code-skills # 6 项项目管理技能
/plugin install c-level-skills@claude-code-skills # 28 项 C 级顾问技能(涵盖整个高管团队)
/plugin install business-growth-skills@claude-code-skills # 4 项业务增长技能
/plugin install finance-skills@claude-code-skills # 2 项金融技能(分析师 + SaaS 指标)
# 或单独安装某项技能
/plugin install skill-security-auditor@claude-code-skills # 安全扫描器
/plugin install playwright-pro@claude-code-skills # Playwright 测试工具包
/plugin install self-improving-agent@claude-code-skills # 自动记忆整理
/plugin install content-creator@claude-code-skills # 单独的一项技能
OpenAI Codex
npx agent-skills-cli add alirezarezvani/claude-skills --agent codex
# 或:克隆仓库 + ./scripts/codex-install.sh
OpenClaw
bash <(curl -s https://raw.githubusercontent.com/alirezarezvani/claude-skills/main/scripts/openclaw-install.sh)
手动安装
git clone https://github.com/alirezarezvani/claude-skills.git
# 将任意技能文件夹复制到 ~/.claude/skills/(Claude 代码)或 ~/.codex/skills/(Codex)
多工具支持(新)
只需一条命令,即可将所有 156 项技能转换为 7 款 AI 编码工具:
| 工具 | 格式 | 安装方式 |
|---|---|---|
| Cursor | .mdc 规则 |
./scripts/install.sh --tool cursor --target . |
| Aider | CONVENTIONS.md |
./scripts/install.sh --tool aider --target . |
| Kilo Code | .kilocode/rules/ |
./scripts/install.sh --tool kilocode --target . |
| Windsurf | .windsurf/skills/ |
./scripts/install.sh --tool windsurf --target . |
| OpenCode | .opencode/skills/ |
./scripts/install.sh --tool opencode --target . |
| Augment | .augment/rules/ |
./scripts/install.sh --tool augment --target . |
| Antigravity | ~/.gemini/antigravity/skills/ |
./scripts/install.sh --tool antigravity |
操作流程:
# 1. 将所有技能转换为各工具的原生格式(耗时约 15 秒)
./scripts/convert.sh --tool all
# 2. 安装到您的项目中(需确认)
./scripts/install.sh --tool cursor --target /path/to/project
# 或使用 --force 跳过确认:
./scripts/install.sh --tool aider --target . --force
# 3. 验证
find .cursor/rules -name "*.mdc" | wc -l # 应显示 156 个
每款工具都将获得:
- ✅ 所有 156 项技能均已转换为原生格式
- ✅ 每个工具专属的 README,包含安装、验证和更新步骤
- ✅ 在适用情况下支持脚本、参考文献和模板
- ✅ 无需手动转换
运行 ./scripts/convert.sh --tool all 即可在本地生成各工具专用的输出文件。
技能概览
9 个领域共 233 项技能:
| 领域 | 技能 | 亮点 | 详情 |
|---|---|---|---|
| 🔧 工程 — 核心 | 37 | 架构、前端、后端、全栈、QA、DevOps、SecOps、AI/ML、数据、Playwright、自我提升代理、安全套件(6)、a11y 审计 | engineering-team/ |
| 🎭 Playwright Pro | 9+3 | 测试生成、修复不稳定测试、Cypress/Selenium 迁移、TestRail、BrowserStack、55 个模板 | engineering-team/playwright-pro |
| 🧠 自我提升代理 | 5+2 | 自动记忆整理、模式推广、技能提取、记忆健康 | engineering-team/self-improving-agent |
| ⚡ 工程 — 强大 | 43 | 代理设计师、RAG 架构师、数据库设计师、CI/CD 构建者、安全审计员、MCP 构建者、AgentHub、Helm 图表、Terraform、自我评估 | engineering/ |
| 🎯 产品 | 15 | 产品经理、敏捷 PO、战略家、UX 研究员、UI 设计、着陆页、SaaS 脚手架、分析、实验设计师、需求挖掘、路线图沟通者、代码到 PRD | product-team/ |
| 📣 市场营销 | 44 | 7 个子集:内容(8)、SEO(5)、CRO(6)、渠道(6)、增长(4)、情报(4)、销售(2)+ 上下文基础 + 协调路由。32 个 Python 工具。 | marketing-skill/ |
| 📋 项目管理 | 9 | 高级 PM、Scrum 主管、Jira、Confluence、Atlassian 管理员、模板 | project-management/ |
| 🏥 监管与质量管理 | 14 | ISO 13485、MDR 2017/745、FDA、ISO 27001、GDPR、CAPA、风险管理 | ra-qm-team/ |
| 💼 C 级顾问 | 34 | 全 C 级团队(10 个角色)+ 协调 + 董事会会议 + 文化与协作 | c-level-advisor/ |
| 📈 商业与增长 | 5 | 客户成功、销售工程师、收入运营、合同与提案 | business-growth/ |
| 💰 财务 | 4 | 财务分析师(DCF、预算、预测)、SaaS 指标教练(ARR、MRR、 churn、LTV、CAC) | finance/ |
角色形象
预配置的代理身份,配备精选的技能组合、工作流程和独特的沟通风格。角色形象不仅仅是“使用这些技能”——它们定义了代理如何思考、优先排序以及沟通。
| 角色形象 | 领域 | 最适合 |
|---|---|---|
| 初创公司 CTO | 工程 + 战略 | 架构决策、技术栈选择、团队建设、技术尽职调查 |
| 增长型市场营销人员 | 市场营销 + 增长 | 内容驱动增长、发布策略、渠道优化、自筹资金营销 |
| 单人创始人 | 跨领域 | 单人创业、副业项目、MVP 构建、身兼多职 |
使用方法:
# Claude Code
cp agents/personas/startup-cto.md ~/.claude/agents/
# 任何工具
./scripts/convert.sh --tool cursor # 也可转换角色形象
详情请参阅 agents/personas/。您也可以使用 TEMPLATE.md 创建自己的角色形象。
协调编排
一种轻量级协议,用于协调跨领域工作的角色形象、技能和代理。无需框架支持。
四种模式:
| 模式 | 是什么 | 何时使用 |
|---|---|---|
| 单人冲刺 | 在项目不同阶段切换角色形象 | 副业项目、MVP、单人创始人 |
| 领域深度探索 | 一个角色形象 + 多重叠加技能 | 架构评审、合规审计 |
| 多代理交接 | 角色形象互相审查彼此的输出 | 高风险决策、发布准备 |
| 技能链 | 顺序执行的技能,无需角色形象 | 内容流水线、可重复检查清单 |
示例:6 周产品发布
第 1–2 周:startup-cto + aws-solution-architect + senior-frontend → 构建
第 3–4 周:growth-marketer + launch-strategy + copywriting + seo-audit → 准备
第 5–6 周:solo-founder + email-sequence + analytics-tracking → 发布并迭代
完整协议及示例请参阅 orchestration/ORCHESTRATION.md。
POWERFUL 等级
25 项高级技能,具备深入且生产级的能力:
| 技能 | 功能 |
|---|---|
| agent-designer | 多代理编排、工具 Schema、性能评估 |
| agent-workflow-designer | 顺序、并行、路由器、编排器和评估者模式 |
| rag-architect | RAG 流水线构建者、分块优化器、检索评估者 |
| database-designer | 模式分析器、ERD 生成、索引优化器、迁移生成器 |
| database-schema-designer | 需求 → 迁移、类型、种子数据、RLS 政策 |
| migration-architect | 迁移计划者、兼容性检查器、回滚生成器 |
| skill-security-auditor | 🔒 安全关卡 — 在安装前扫描技能是否存在恶意代码 |
| ci-cd-pipeline-builder | 分析技术栈 → 生成 GitHub Actions / GitLab CI 配置 |
| mcp-server-builder | 根据 OpenAPI 规范构建 MCP 服务器 |
| pr-review-expert | 影响范围分析、安全扫描、覆盖率变化 |
| api-design-reviewer | REST API 语法检查器、破坏性变更检测器、设计评分卡 |
| api-test-suite-builder | 扫描 API 路由 → 生成完整的测试套件 |
| dependency-auditor | 多语言扫描器、许可证合规、升级计划 |
| release-manager | 更改日志生成器、语义版本号递增器、就绪性检查器 |
| observability-designer | SLO 设计者、告警优化器、仪表盘生成器 |
| performance-profiler | Node/Python/Go 性能分析、包分析、负载测试 |
| monorepo-navigator | Turborepo/Nx/pnpm 工作区管理和影响分析 |
| changelog-generator | 将 Conventional Commits 转换为结构化的更改日志 |
| codebase-onboarding | 根据代码库分析自动生成入职文档 |
| runbook-generator | 根据代码库生成包含命令的操作手册 |
| git-worktree-manager | 并行开发,隔离端口、同步环境 |
| env-secrets-manager | .env 管理、泄漏检测、轮换流程 |
| incident-commander | 事件响应手册、严重程度分类器、PIR 生成器 |
| tech-debt-tracker | 代码债务扫描器、优先级排序器、趋势仪表盘 |
| interview-system-designer | 面试流程设计者、题库管理者、校准器 |
🔒 技能安全审计员
v2.0.0 新增功能——在安装任何技能之前先对其进行安全风险审计:
python3 engineering/skill-security-auditor/scripts/skill_security_auditor.py /path/to/skill/
扫描内容包括:命令注入、代码执行、数据外泄、提示注入、依赖供应链风险、权限提升。返回结果为 PASS / WARN / FAIL,并提供修复建议。
无依赖。 只要能运行 Python 的地方即可使用。
最近增强的技能
为以下项目添加了生产级升级:
engineering/git-worktree-manager— 工作树生命周期 + 清理自动化脚本engineering/mcp-server-builder— OpenAPI 转 MCP 脚手架 + 清单验证器engineering/changelog-generator— 发布说明生成器 + conventional commit 语法检查器engineering/ci-cd-pipeline-builder— 技术栈检测器 + 流水线生成器marketing-skill/prompt-engineer-toolkit— 提示词 A/B 测试器 + 提示词版本/差异管理器
每个项目现在都附带 scripts/ 目录、提取出的 references/ 文件以及以使用为中心的 README.md。
使用示例
架构评审
使用资深架构师技能,评审我们的微服务架构,
并找出前 3 个可扩展性风险。
内容创作
使用内容创作者技能,撰写一篇关于 AI 增强开发的博客文章。
针对“Claude Code 教程”这一关键词进行 SEO 优化。
合规审计
使用 MDR-745 专家技能,审查我们的技术文档中是否存在 MDR 附件 II 的合规性漏洞。
Python 分析工具
技能包中包含 305 个纯标准库的 CLI 工具(均已验证):
# SaaS 健康检查
python3 finance/saas-metrics-coach/scripts/metrics_calculator.py --mrr 80000 --customers 200 --churned 3 --json
# 品牌声音分析
python3 marketing-skill/content-production/scripts/brand_voice_analyzer.py article.txt
# 技术债务评分
python3 c-level-advisor/cto-advisor/scripts/tech_debt_analyzer.py /path/to/codebase
# RICE 优先级排序
python3 product-team/product-manager-toolkit/scripts/rice_prioritizer.py features.csv
# 安全审计
python3 engineering/skill-security-auditor/scripts/skill_security_auditor.py /path/to/skill/
# 登陆页(TSX + Tailwind)
python3 product-team/landing-page-generator/scripts/landing_page_scaffolder.py config.json --format tsx
相关项目
| 项目 | 描述 |
|---|---|
| Claude Code 技能与智能体工厂 | 大规模构建技能的方法论 |
| Claude Code 密库 | 包含 60 多个提示模板的生产力工具集 |
| 产品经理技能 | 高级 PM 智能体,涵盖 6 个知识领域、12 种模板和 30 多种框架——需求挖掘、战略规划、交付管理、SaaS 指标分析、职业辅导、AI 产品设计 |
常见问题解答
如何安装 Claude Code 插件?
先通过 /plugin marketplace add alirezarezvani/claude-skills 添加市场,再用 /plugin install <name>@claude-code-skills 安装任意技能包。
这些技能是否适用于 OpenAI Codex、Cursor、Windsurf 或 Aider?
是的。这些技能原生支持 11 种工具:Claude Code、OpenAI Codex、Gemini CLI、OpenClaw、Cursor、Aider、Windsurf、Kilo Code、OpenCode、Augment 和 Antigravity。运行 ./scripts/convert.sh --tool all 可将技能转换为所有工具兼容的格式,然后使用 ./scripts/install.sh --tool <name> 进行安装。详细信息请参阅 多工具集成。
更新是否会破坏我的安装? 不会。我们遵循语义版本控制,并在补丁版本中保持向后兼容性。现有脚本参数、插件源路径和 SKILL.md 结构在补丁版本中绝不会更改。每次发布的具体细节请参阅 CHANGELOG。
Python 工具是否无依赖?
是的。全部 305 个 Python CLI 工具仅使用标准库,无需任何 pip 安装。每个脚本都经过验证,可以正常运行 --help 命令。
如何创建自己的 Claude Code 技能?
每个技能都是一个包含 SKILL.md(元数据 + 使用说明)、可选的 scripts/、references/ 和 assets/ 的文件夹。有关分步指南,请参阅 技能与智能体工厂。
贡献
我们欢迎任何形式的贡献!请参阅 CONTRIBUTING.md 获取相关指南。
快速建议:
- 在尚未充分覆盖的领域添加新技能
- 改进现有 Python 工具
- 为脚本增加测试覆盖率
- 将技能翻译成非英语语言
许可证
MIT — 详情请参阅 LICENSE。
星标历史
由 Alireza Rezvani 构建 · Medium · Twitter
版本历史
v2.0.02026/03/04常见问题
相似工具推荐
openclaw
OpenClaw 是一款专为个人打造的本地化 AI 助手,旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚,能够直接接入你日常使用的各类通讯渠道,包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息,OpenClaw 都能即时响应,甚至支持在 macOS、iOS 和 Android 设备上进行语音交互,并提供实时的画布渲染功能供你操控。 这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地,用户无需依赖云端服务即可享受快速、私密的智能辅助,真正实现了“你的数据,你做主”。其独特的技术亮点在于强大的网关架构,将控制平面与核心助手分离,确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者,以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力(支持 macOS、Linux 及 Windows WSL2),即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你
stable-diffusion-webui
stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。
everything-claude-code
everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上
ComfyUI
ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。
gemini-cli
gemini-cli 是一款由谷歌推出的开源 AI 命令行工具,它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言,它提供了一条从输入提示词到获取模型响应的最短路径,无需切换窗口即可享受智能辅助。 这款工具主要解决了开发过程中频繁上下文切换的痛点,让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用,还是执行复杂的 Git 操作,gemini-cli 都能通过自然语言指令高效处理。 它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口,具备出色的逻辑推理能力;内置 Google 搜索、文件操作及 Shell 命令执行等实用工具;更独特的是,它支持 MCP(模型上下文协议),允许用户灵活扩展自定义集成,连接如图像生成等外部能力。此外,个人谷歌账号即可享受免费的额度支持,且项目基于 Apache 2.0 协议完全开源,是提升终端工作效率的理想助手。
markitdown
MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具,专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片(含 OCR)、音频(含语音转录)、HTML 乃至 YouTube 链接等多种格式的解析,能够精准提取文档中的标题、列表、表格和链接等关键结构信息。 在人工智能应用日益普及的今天,大语言模型(LLM)虽擅长处理文本,却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点,它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式,成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外,它还提供了 MCP(模型上下文协议)服务器,可无缝集成到 Claude Desktop 等 LLM 应用中。 这款工具特别适合开发者、数据科学家及 AI 研究人员使用,尤其是那些需要构建文档检索增强生成(RAG)系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性,但其核心优势在于为机器
