DevDocs
DevDocs 是一款完全免费且注重隐私的基于用户界面的技术文档 MCP 服务器,专为程序员和软件开发人员打造。它能轻松集成到 Cursor、Windsurf、Cline、Roo Code 及 Claude Desktop 等主流 AI 编程环境中,让开发者在熟悉的工具里直接获取最新的技术资料。
面对技术文档分散庞大、而大模型训练数据往往滞后的痛点,DevDocs 有效解决了开发者需耗费数周时间查阅文档、理解细节并克服技术债务的难题。它将原本漫长的调研过程压缩至数小时,帮助用户快速掌握任何新技术并投入实际开发。
这款工具特别适合企业软件工程师、独立开发者(Indie Hackers)、爬虫工程师以及需要协作的开发团队。无论是构建新产品还是维护内部知识库,DevDocs 都能成为得力的助手。
其核心技术亮点在于智能爬取能力:支持 1 至 5 层的深度控制,能自动发现并映射网站子链接结构;具备并行处理与智能缓存机制,大幅提升抓取效率;同时支持懒加载网页,并能将清洗后的内容以 Markdown 或 JSON 格式输出,便于大模型微调或直接用于 AI 问答。通过内置的 MCP 服务,DevDocs 让静态文档转化为可交互的智能资源,显著提升研发效能。
使用场景
某后端团队急需将遗留系统迁移至最新的 Rust Web 框架,但面对分散且更新频繁的官方文档,资深工程师也感到无从下手。
没有 DevDocs 时
- 信息检索低效:开发者需手动在数十个文档页面间跳转,花费数天时间梳理架构概念和 API 细节,严重拖慢项目启动速度。
- 知识断层风险:依赖大模型自带的过时训练数据,生成的代码常因版本不匹配而报错,导致反复调试和返工。
- 上下文割裂:难以将分散的配置指南、最佳实践和错误处理逻辑整合成统一的知识库,团队协作时沟通成本极高。
- 爬虫开发负担:若尝试自建抓取工具,需额外编写复杂的去重、反爬和深度遍历逻辑,偏离了核心业务开发目标。
使用 DevDocs 后
- 一键全量获取:只需输入文档网址,DevDocs 即可智能遍历并抓取多达 5 层深度的所有内容,将数周的调研工作压缩至几小时。
- 实时精准赋能:通过 MCP 服务器将最新文档直接接入 Cursor 或 Claude,AI 助手基于实时数据生成的代码准确可用,彻底消除版本幻觉。
- 结构化知识沉淀:自动清洗并输出为 Markdown 或 JSON 格式,将杂乱的网页内容转化为逻辑清晰的结构化数据,便于团队随时查询引用。
- 零码集成体验:无需编写任何爬虫脚本,内置的并发处理和缓存机制即可稳定运行,让团队专注于业务逻辑而非数据收集。
DevDocs 通过将分散的技术文档转化为可被 AI 即时理解的私有知识库,真正实现了从“查阅文档”到“驱动开发”的效率飞跃。
运行环境要求
- Linux
- macOS
- Windows (实验性支持,需 WSL 2)
未说明
未说明

快速开始
DevDocs by CyberAGI 🚀
[!WARNING] 📌 DevDocs 状态: 未公开维护。CyberAGI 拥有增强的内部版本——公共版本即将发布。如有任何问题,请联系 info@cyberagi.ai
将数周的文档研究转化为数小时的高效开发
适合人群 • 功能 • 为什么选择 DevDocs • 快速入门 • 脚本及其用途 • 与 FireCrawl 对比 • Discord 社区 • DevDocs 路线图
🚀 技术合作伙伴
🎯 适合人群
🏢 企业软件开发者
无需花费数周阅读文档和处理技术债务。让 DevDocs 承担繁重的文档理解工作,您可以更快地实现任何技术。
🕸️ 网页爬虫开发者
通过智能发现子 URL(最多 5 层),抓取整个网站内容。无论是内部还是外部网站文档,都能通过智能爬取完美应对。
👥 开发团队
利用内置的 MCP 服务器和 Claude 集成进行智能数据查询,充分利用内部文档。将团队的知识库转化为可操作的资源。
🚀 独立开发者
DevDocs + VSCode (命令行) + 您的想法 = 使用任何技术快速交付产品。在构建下一个大项目时,再也不用陷入文档的泥潭了。
✨ 功能
🧠 智能爬取
- 智能深度控制:可选择 1–5 层爬取深度
- 自动链接发现:查找并分类所有相关内容
- 选择性爬取:精准提取所需内容
- 子 URL 检测:自动发现并映射网站结构
⚡ 性能与速度
- 并行处理:同时爬取多个页面
- 智能缓存:避免重复内容浪费时间
- 懒加载支持:轻松应对现代 Web 应用程序
- 速率限制:尊重目标服务器,不会造成过载
🎯 内容处理
- 纯净提取:去除冗余信息
- 多种格式:导出为 MD 或 JSON 格式,便于 LLM 微调
- 结构化输出:逻辑清晰的内容组织
- MCP 服务器集成:直接用于 AI 处理
🛡️ 企业级特性
- 错误恢复:失败后自动重试
- 完整日志记录:追踪每一步操作
- API 访问:可与您的工具集成
- 团队管理:支持多用户和角色权限
🤔 为什么选择 DevDocs?
存在的问题
文档无处不在,而现有的 LLM 在知识更新方面严重滞后。即使是资深工程师,阅读、理解和实现这些文档也需要数周的时间。我们将其缩短到几小时。
我们的解决方案
DevDocs 将文档带到您面前。只需指向任何技术文档的 URL,它就会:
- 发现与该技术相关的所有页面
- 提取有意义的内容,去除冗余信息
- 将信息逻辑化整理,并存储在 MCP 服务器中,供您的 LLM 查询
- 以干净、可搜索的格式呈现,支持 MD 或 JSON 导出,方便 LLM 的微调
🔥 我们希望全球任何人都能利用最先进的 LLM 技术,快速构建出色的产品。
💰 定价对比
| 特性 | DevDocs | Firecrawl |
|---|---|---|
| 免费层级 | 无限页面 | 无 |
| 起始价格 | 永久免费 | $16/月 |
| 企业计划 | 自定义 | $333/月 |
| 爬取速度 | 1000/min | 20/min |
| 深度级别 | 最高 5 层 | 有限 |
| 团队席位 | 无限 | 1–5 席 |
| 导出格式 | MD、JSON、LLM 兼容 MCP 服务器 | 格式有限 |
| API 访问 | 即将推出 | 有限 |
| 模型上下文协议集成 | ✅ | ❌ |
| 支持 | Discord 优先支持 | 标准支持 |
| 自托管(免费使用) | ✅ | ❌ |
🚀 快速入门
DevDocs 采用 Docker 部署,设计简单易用,新用户几乎无需复杂配置。
前置条件
- 已在系统上安装 Docker
- Git 用于克隆仓库
使用 Docker 快速启动(推荐)
适用于 Mac/Linux 用户:
# 克隆仓库
git clone https://github.com/cyberagiinc/DevDocs.git
# 进入项目目录
cd DevDocs
# 配置环境变量
# 复制模板文件到 .env
cp .env.template .env
# 确保 .env 中的 NEXT_PUBLIC_BACKEND_URL 设置正确(例如 http://localhost:24125)
# 这样前端(在浏览器中运行)才能与后端服务通信。
# 使用 Docker 启动所有服务
./docker-start.sh
适用于 Windows 用户:实验阶段(尚未测试)
# 克隆仓库
git clone https://github.com/cyberagiinc/DevDocs.git
# 进入项目目录
cd DevDocs
# 配置环境变量
# 复制模板文件到 .env
copy .env.template .env
# 确保 .env 中的 NEXT_PUBLIC_BACKEND_URL 设置正确(例如 http://localhost:24125)
# 这样前端(在浏览器中运行)就能与后端服务通信。
# 前置条件:安装 WSL 2 和 Docker Desktop
# Docker Desktop for Windows 需要 WSL 2。请确保已先安装并运行 WSL 2。
# 1. 安装 WSL 2:按照微软官方指南操作:https://learn.microsoft.com/en-us/windows/wsl/install
# 2. 安装 Docker Desktop for Windows:从 Docker 官网下载并安装。Docker Desktop 包含 Docker Compose。
# 使用 Docker 启动所有服务
docker-start.bat
Windows 用户注意事项
如果遇到权限问题,可能需要以管理员身份运行脚本,或者手动为 logs、storage 和 crawl_results 目录设置权限。脚本使用
icacls命令来设置权限,在某些 Windows 系统上可能需要提升权限。
在 Windows 上手动设置权限:
如果需要手动设置权限,可以通过 Windows 图形界面或命令行完成:
使用 Windows 资源管理器:
- 右键单击每个目录(logs、storage、crawl_results)
- 选择“属性”
- 切换到“安全”选项卡
- 单击“编辑”以更改权限
- 单击“添加”以添加用户/组
- 输入“Everyone”,然后单击“检查名称”
- 单击“确定”
- 在列表中选中“Everyone”
- 在“允许”下勾选“完全控制”
- 单击“应用”并“确定”
使用命令提示符(以管理员身份):
icacls logs /grant Everyone:F /T icacls storage /grant Everyone:F /T icacls crawl_results /grant Everyone:F /T
关于 Windows 上 docker-compose.yml 的说明
如果您在使用 docker-compose.yml 文件时遇到问题(例如“顶级对象必须是映射”错误),
docker-start.bat脚本会自动修复该文件,确保其格式和编码正确。每次运行脚本时都会进行此修复,因此您无需手动修改文件。
此单一命令将:
- 创建所有必要的目录
- 设置适当的权限
- 构建并启动所有 Docker 容器
- 监控服务以确保其正常运行
访问 DevDocs
服务启动后:
- 前端 UI:http://localhost:3001
- 后端 API:http://localhost:24125
- Crawl4AI 服务:http://localhost:11235
日志与监控
使用 Docker 时,日志可通过以下方式访问:
- 容器日志(推荐用于调试):
# 查看特定容器的日志 docker logs devdocs-frontend docker logs devdocs-backend docker logs devdocs-mcp docker logs devdocs-crawl4ai # 实时跟踪日志 docker logs -f devdocs-backend
要停止所有服务,请在运行 docker-start 的终端中按 Ctrl+C。
📜 脚本及其用途
DevDocs 包含多种实用脚本,用于开发、测试和维护工作。以下是快速参考:
启动脚本
start.sh/start.bat/start.ps1- 启动所有服务(前端、后端、MCP),适用于本地开发。docker-start.sh/docker-start.bat- 使用 Docker 容器启动所有服务。
MCP 服务器脚本
check_mcp_health.sh- 验证 MCP 服务器的健康状况和配置状态。restart_and_test_mcp.sh- 重启包含更新 MCP 配置的 Docker 容器,并测试连接性。
Crawl4AI 脚本
check_crawl4ai.sh- 检查 Crawl4AI 服务的状态和健康状况。debug_crawl4ai.sh- 以详细日志模式运行 Crawl4AI,便于故障排除。test_crawl4ai.py- 对 Crawl4AI 服务执行测试,验证其功能。test_from_container.sh- 在 Docker 容器内测试 Crawl4AI 服务。
通用脚本
view_result.sh- 以格式化方式显示爬取结果。find_empty_folders.sh- 查找项目结构中的空目录。analyze_empty_folders.sh- 分析空目录,并按风险等级分类。verify_reorganization.sh- 验证代码重构是否成功。
这些脚本组织在以下目录中:
- 根目录:常用操作的主要脚本
scripts/general/:通用工具脚本scripts/docker/:Docker 特定脚本scripts/mcp/:MCP 服务器管理脚本scripts/test/:测试和验证脚本
🌍 专为开发者打造,由开发者提供支持
DevDocs 不仅仅是一个工具——它是您的文档伴侣,能够:
- 节省时间:将数周的研究缩短至数小时
- 提升理解:获取清晰、有序的文档
- 促进创新:借助任何技术更快地构建
- 支持团队协作:高效共享知识
- 兼容 LLM:现代需求需要现代化解决方案,将 Devdocs 与 LLM 结合使用极其简单直观。只需少量配置,即可同时运行 Devdocs 和 Claude 应用程序,后者会识别 Devdocs 的 MCP 服务器,随时准备基于您的数据进行对话。
🛠️ 为 Rapid 软件开发设置 Cline/Roo Cline。
打开“模式”界面
- 在 Roo Code 中,点击 + 创建一个新的模式特定提示。
命名
- 为该模式命名(例如:
Research_MCP)。
- 为该模式命名(例如:
角色定义提示
提示
专长与个性:专长:开发者文档检索、技术综合及文档搜索。个性:系统化、注重细节且精确。提供结构清晰的答案,并明确引用文档章节。
行为准则:在解答任何关于 MCP 文档的查询时,务必使用目录工具和章节访问工具。保持回答的清晰性、准确性和可追溯性。
- 模式特定自定义指令提示
提示
1. 目录工具:返回完整或筛选后的文档主题列表。
2. 章节访问工具:获取特定文档章节的详细内容。
通用流程:
查询解析:解析用户查询,提取关键主题、关键词和上下文。根据查询内容识别可能相关的部分(如 API 配置、错误处理等)。
通过目录工具发现:使用目录工具在文档索引中搜索相关章节。根据标题和元数据中的匹配关键词进行筛选或扫描。
利用章节访问工具深入查找:对于每个识别出的 relevant 文档或章节,使用章节访问工具获取其内容。如果需要多个部分的内容,则请求所有相关章节以确保覆盖全面。
综合与答案生成:将检索到的内容整合成连贯完整的答案。引用章节标识符或文档路径以便追溯。验证是否已涵盖查询的所有方面。
错误处理:若未找到匹配章节,调整搜索参数并重试。如果查询仍然模糊不清,或没有相关文档可用,则应明确告知用户。
强制工具使用:
执行要求:每当收到需要从 MCP 服务器文档中获取信息的查询时,代理必须首先使用目录工具列出潜在的相关主题,然后使用章节访问工具获取必要的详细内容。
搜索与检索工作流:
解读与提炼:从用户查询中识别关键术语和数据点。
索引查询:立即使用目录工具获取相关文档章节列表。
目标性检索:针对每个有希望的章节,使用章节访问工具获取完整内容。
信息综合:合并检索到的内容,确保包含所有必要细节并清晰引用。
回退与澄清:如果初步搜索结果不充分,可根据需要调整查询参数并检索更多章节。
自定义指令加载:特定于 Research_MCP 模式的额外自定义指令可能会从工作区中的 .clinerules-research-mcp 文件中加载。这些指令可能包括基于不断变化的文档结构或查询类型的进一步优化或约束。
最终输出构建:最终答案应条理清晰,直接回应查询,并包含指向 MCP 文档的明确指针(如章节名称或标识符)。确保尽量减少冗余,同时涵盖所有必要细节。
🤝 加入我们的社区
🏆 成功案例
“DevDocs 将我们原本需要三周的实施周期缩短到了两天。它不仅仅是一个爬虫,更是一款开发加速器。”——《财富》100 强企业高级工程师
“借助 DevDocs 快速理解和实现新技术,我只用了原来一半的时间就上线了我的 SaaS 产品。”——成功的独立开发者
🛣️ DevDocs 路线图
本路线图概述了由 Crawl4AI 驱动的先进网页爬取平台 DevDocs 即将推出的增强功能和特性。每一项都旨在充分发挥 Crawl4AI 的能力,确保提供强大、高效且用户友好的网页爬取体验。
⸻
1. 针对动态内容的增强型爬虫逻辑
- 实现
wait_for_images=True,确保所有图片完全加载后再进行提取。 - 设置
scan_full_page=True,强制爬虫滚动整个页面,触发延迟加载的内容。 - 引入
scroll_delay参数,在每次滚动步骤之间添加延迟,使内容能够正常加载。 - 添加
wait_for参数,等待特定 DOM 元素表示内容加载已完成。
2. 浏览器池化的热加载
- 实施预热浏览器实例池,避免为每个任务单独启动新浏览器带来的开销。
- 使用
use_persistent_context=True保持会话数据跨任务传递,减少重复登录和设置的需求。
3. 更新 Docker 容器并集成最新 DevDocs 功能
- 更新 Docker 镜像,融入最新的 DevDocs 功能与优化。
- 包含用于保护 API 端点的环境变量(
CRAWL4AI_API_TOKEN)。 - 设置适当的内存限制和资源约束,以优化性能。
4. 多操作系统 Docker 实例支持
- 创建适用于不同架构(如
x86_64、ARM)的 Docker 镜像,以支持广泛的系统环境。 - 实施 CI/CD 流水线,在多种操作系统环境中构建并测试镜像,确保兼容性和稳定性。
5. 内存自适应爬取
- 集成 DevDocs 的
MemoryAdaptiveDispatcher,根据系统内存可用情况动态调整并发度。 - 实现内置速率限制,防止对目标网站造成过大压力,并避免内存不足错误。
6. UI 中的 PDF 上传与内容提取
- 利用 DevDocs 将页面导出为 PDF 并从中提取内容的功能(
pdf=True)。 - 开发前端组件,用于处理 PDF 上传、显示提取内容,并允许用户与数据交互。
7. 托管环境:持久化存储与增强用户体验
- 实施自带数据库解决方案,以私密方式存储数据、爬取结果和配置信息,实现跨会话保存。
- 设计直观的仪表盘和界面,供用户管理爬取任务、查看结果并配置设置。
- 确保设计响应迅速,并在各类浏览器中具备良好的可访问性。
星标历史
由 CyberAGI Inc 在 🇺🇸 用 ❤️ 制作
让软件开发再次变得更好 贡献到 DevDocs
常见问题
相似工具推荐
openclaw
OpenClaw 是一款专为个人打造的本地化 AI 助手,旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚,能够直接接入你日常使用的各类通讯渠道,包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息,OpenClaw 都能即时响应,甚至支持在 macOS、iOS 和 Android 设备上进行语音交互,并提供实时的画布渲染功能供你操控。 这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地,用户无需依赖云端服务即可享受快速、私密的智能辅助,真正实现了“你的数据,你做主”。其独特的技术亮点在于强大的网关架构,将控制平面与核心助手分离,确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者,以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力(支持 macOS、Linux 及 Windows WSL2),即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你
stable-diffusion-webui
stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。
everything-claude-code
everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上
opencode
OpenCode 是一款开源的 AI 编程助手(Coding Agent),旨在像一位智能搭档一样融入您的开发流程。它不仅仅是一个代码补全插件,而是一个能够理解项目上下文、自主规划任务并执行复杂编码操作的智能体。无论是生成全新功能、重构现有代码,还是排查难以定位的 Bug,OpenCode 都能通过自然语言交互高效完成,显著减少开发者在重复性劳动和上下文切换上的时间消耗。 这款工具专为软件开发者、工程师及技术研究人员设计,特别适合希望利用大模型能力来提升编码效率、加速原型开发或处理遗留代码维护的专业人群。其核心亮点在于完全开源的架构,这意味着用户可以审查代码逻辑、自定义行为策略,甚至私有化部署以保障数据安全,彻底打破了传统闭源 AI 助手的“黑盒”限制。 在技术体验上,OpenCode 提供了灵活的终端界面(Terminal UI)和正在测试中的桌面应用程序,支持 macOS、Windows 及 Linux 全平台。它兼容多种包管理工具,安装便捷,并能无缝集成到现有的开发环境中。无论您是追求极致控制权的资深极客,还是渴望提升产出的独立开发者,OpenCode 都提供了一个透明、可信
ComfyUI
ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。
gemini-cli
gemini-cli 是一款由谷歌推出的开源 AI 命令行工具,它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言,它提供了一条从输入提示词到获取模型响应的最短路径,无需切换窗口即可享受智能辅助。 这款工具主要解决了开发过程中频繁上下文切换的痛点,让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用,还是执行复杂的 Git 操作,gemini-cli 都能通过自然语言指令高效处理。 它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口,具备出色的逻辑推理能力;内置 Google 搜索、文件操作及 Shell 命令执行等实用工具;更独特的是,它支持 MCP(模型上下文协议),允许用户灵活扩展自定义集成,连接如图像生成等外部能力。此外,个人谷歌账号即可享受免费的额度支持,且项目基于 Apache 2.0 协议完全开源,是提升终端工作效率的理想助手。
