RAGHub

GitHub
1.7k 155 非常简单 1 次阅读 今天MIT语言模型图像开发框架其他Agent
AI 解读 由 AI 自动生成,仅供参考

RAGHub 是一个由社区驱动的检索增强生成(RAG)工具与资源目录,旨在帮助开发者在快速演进的 AI 生态中轻松导航。面对每天层出不穷的新框架和项目,判断哪些工具真正实用、哪些只是短暂炒作变得愈发困难。RAGHub 通过系统性地收录和更新各类 RAG 框架、评估优化方案、数据预处理工具及实战项目,为用户提供一个清晰、前沿的参考指南。

无论是刚接触 RAG 技术的新手,还是正在寻找最佳实践方案的资深工程师,都能在这里找到适合当前需求的技术选型建议。平台不仅列出了如 LangChain、Haystack 等主流框架,还持续追踪新兴项目,并附带活跃度指标与开源地址,方便用户快速评估其成熟度与社区支持情况。

RAGHub 特别适合 AI 应用开发者、研究人员以及希望将大模型与企业数据结合的技术团队使用。其最大亮点在于“社区共建”模式——任何人都可提交新工具或更新现有条目,确保内容始终贴近实际开发场景。如果你正为如何选择 RAG 技术栈而困扰,不妨把 RAGHub 当作你的第一站,高效获取经过筛选的高质量资源,少走弯路,更快落地智能应用。

使用场景

某初创团队正急于构建一款基于内部技术文档的智能客服机器人,需要在两周内完成从选型到原型上线的全流程。

没有 RAGHub 时

  • 选型如大海捞针:面对 GitHub 上成千上万个 RAG 项目,开发人员花费数天搜索关键词,却难以区分哪些是三个月前的过时方案,哪些是刚发布的创新框架。
  • 陷入“重复造轮子”陷阱:因缺乏权威目录参考,团队误选了一个仅包装旧概念的新工具,导致开发中途发现功能缺失,被迫推倒重来。
  • 评估成本极高:为了验证框架的活跃度和社区支持,工程师需手动检查每个项目的 Issue 关闭率、最后提交时间和 Star 增长趋势,效率极低。
  • 资源分散难整合:数据预处理、向量检索引擎和评估工具散落在不同论坛和博客中,缺乏系统化的分类指引,导致技术栈拼接困难。

使用 RAGHub 后

  • 精准锁定前沿工具:通过 RAGHub 的分类目录,团队迅速筛选出"1 小时前”仍有更新的 Dcup 和 LangChain 等高活跃度框架,直接锁定最新技术栈。
  • 规避炒作与过时风险:借助社区驱动的实时维护机制,团队清晰识别出哪些项目是真正的创新,哪些只是换皮炒作,避免了无效投入。
  • 一键获取关键指标:RAGHub 直接展示各框架的 Star 数、最后活动时间及官方链接,让技术决策从“凭感觉”变为“看数据”,选型时间缩短 80%。
  • 全链路资源一站式配齐:从数据准备框架到评估优化方案,RAGHub 提供了完整的生态地图,团队得以快速组合出最优解决方案并立即启动开发。

RAGHub 将混乱的 RAG 生态转化为清晰的导航图,帮助开发者在技术爆炸时代以最低成本做出最明智的架构决策。

运行环境要求

GPU

未说明

内存

未说明

依赖
notesRAGHub 本身不是一个可运行的软件工具,而是一个收录了多种 RAG(检索增强生成)框架、项目和资源的目录列表。因此,它没有统一的运行环境、依赖库或硬件需求。具体的环境要求取决于用户选择使用的列表中的某个特定工具(如 LangChain, LlamaIndex, Haystack 等)。
python未说明
RAGHub hero image

快速开始

RAGHub:检索增强生成(RAG)工具目录

欢迎来到RAGHub,这是一个不断更新的检索增强生成(RAG)生态系统中新兴框架、项目和资源的集合。这是一个由社区驱动的项目,面向r/RAG社区,旨在梳理快速发展的RAG工具与项目,推动该领域的边界不断拓展。

每天似乎都有新的工具或框架涌现,而如何选择合适的工具正逐渐从一门科学演变为一种艺术。三个月前的那个框架现在还适用吗?还是仅仅是一阵炒作,用新包装重新演绎旧概念?RAGHub的存在就是为了帮助您紧跟这些变化,为您提供RAG领域最新创新成果的展示平台。

如何贡献

这是一个社区共建的项目,我们欢迎所有人的参与和贡献!如果您希望添加新的框架、项目或资源,请查看我们的贡献指南,了解具体的操作步骤。

目录

RAG框架

名称 描述 官网 Github 星数 活跃度
Dcup 开源 RAG 即服务 通过可自托管的 RAG 流程,可在几分钟内将您的应用连接到用户数据。 官网 Github GitHub 1小时前
LangChain 使用大语言模型构建应用程序 官网 Github GitHub 9小时前
Scout 使用大语言模型/向量数据库/网页抓取构建应用 官网 Github GitHub 1小时前
Haystack 用于构建基于神经网络搜索引擎的框架 官网 Github GitHub 上周
LlamaIndex 构建数据驱动的大语言模型应用的框架 官网 Github GitHub 7小时前
BentoML 构建推理 API、大语言模型应用、多模型链和 RAG 官网 Github GitHub 1小时前
Contextual AI 端到端 RAG,包括文档理解、检索、 grounded 生成和评估 官网 GitHub GitHub 星数 --
LightRAG 简单快速的检索增强生成 官网 Github GitHub 1天前
Swarm by OpenAI 轻量级多智能体编排的教育性框架 - Github GitHub 1天前
Langroid 用 Python 轻松构建大语言模型驱动的应用程序的框架 官网 Github GitHub 10小时前
NeMo-Guardrails 为基于大语言模型的应用添加可编程护栏 官网 Github GitHub 上周
Swiftide 用 Rust 构建快速流式大语言模型应用的库 官网 GitHub GitHub 星数 1小时前
Korvus 将整个 RAG 流程整合到一条数据库查询中 官网 GitHub GitHub 星数 上月
semantic-router 使用语义向量路由大语言模型请求的框架 官网 GitHub GitHub 星数 4小时前
AWS Bedrock Knowledge Bases 用于构建、扩展和部署 RAG 驱动的应用的服务 官网 - - 1小时前
langflow 构建、扩展和部署 RAG 及多智能体 AI 应用 官网 Github GitHub 星数 1小时前
dspy 使用模块化编程构建语言模型应用 官网 GitHub GitHub 星数 13小时前
mem0 您的 AI 应用的记忆层 官网 GitHub GitHub 星数 2小时前
RAGLite 用于构建 RAG 应用的 Python 包 官网 GitHub GitHub 星数 18小时前
cognee 用于构建 GraphRAG 应用的记忆框架 官网 GitHub GitHub 星数 2小时前
ragbits 用于快速开发生成式 AI 应用的构建模块 官网 GitHub GitHub 星数 1小时前
Interchange 从文档上传到搜索的端到端 RAG API 官网 GitHub GitHub 1小时前
ZeroEntropy 重排序器、嵌入及端到端检索 API 官网 GitHub - 1小时前
memori 多智能体记忆引擎,赋予您的 AI 智能体类人记忆 官网 GitHub GitHub 星数 3天前

RAG 评估与优化框架

名称 描述 官网 GitHub 星星 活跃度
Trulens 通过可扩展的评估反馈功能,衡量并提升 LLM 应用的质量 官网 GitHub GitHub 星星 11小时前
Phoenix 面向实验、评估和故障排除设计的 AI 可观测性平台 官网 GitHub GitHub 星星 1 天前
ragas 评估并量化使用外部数据增强 LLM 上下文的 RAG 流水线性能 官网 GitHub GitHub 星星 3 小时前
LMUnit 针对自然语言单元测试评估优化的语言模型 官网 - - --
Deepchecks 持续验证 AI 和 ML 模型,检测数据漂移和模型问题 官网 GitHub GitHub 星星 8 分钟前
AutoRAG 端到端 RAG 优化:解析、分块、评估数据集创建及流水线部署 官网 GitHub GitHub 星星 1 小时前
evalmy.ai 经过微调的轻量级 RAG 评估服务 + Python 客户端库 官网 GitHub GitHub 星星 --
TextGrad 基于 LLM 的文本优化框架,专注于减少幻觉并改进提示语 官网 GitHub GitHub 星星 24 小时前
langfuse 跟踪、评估、提示管理及指标,用于调试和改进您的 LLM 应用。 官网 GitHub GitHub 星星 1 小时前
Vectara HHEM 用于 RAG 的幻觉评估模型 Huggingface -- -- --
StepsTrack 一款可观测性工具,用于跟踪、检查和可视化流水线中的每一步 - GitHub GitHub 星星 15 小时前
syftr 多目标端到端代理式 RAG 优化。 - GitHub GitHub 星星 1 小时前
zbench 用于检索和重排序的标注与评估框架 官网 GitHub - 1 小时前
rag-select 跨 RAG 工具产品对端到端 RAG 架构进行评估/优化。 官网 GitHub GitHub 星星 1 小时前

RAG 引擎

名称 描述 官网 GitHub 星数 活跃度
Agentset 开源的智能体式RAG平台。 官网 GitHub GitHub星数 1天前
Engramic 专注于长期记忆和高级上下文管理的RAG引擎 官网 Github GitHub星数 2小时前
TrustGraph 独立于LLM的智能体开发平台 官网 GitHub GitHub星数 2天前
R2R RAG领域的Elasticsearch,帮助您快速构建和部署可扩展的RAG解决方案 官网 GitHub GitHub星数 6小时前
RAGFlow 基于深度文档理解的开源RAG引擎 官网 GitHub GitHub星数 1小时前
Liquid Index 统一的RAG平台。一个API。您所需的所有工具 官网 - - 1小时前
Vertex AI Knowledge Engine 用于增强上下文的LLM应用的数据框架 官网 - - 1天前
Embedchain 在不到10行代码内实现LLM响应个性化的开源框架 官网 GitHub GitHub星数 上周
txtai 用于语义搜索、LLM编排和RAG工作流的一体化嵌入数据库 官网 GitHub GitHub星数 上周
dsRAG 非结构化数据的高性能检索引擎 - GitHub GitHub星数 上周
Flash-Rank 使用成对或列表排序重排器提高检索精度,再传递给LLM。 - GitHub GitHub星数 2周前
Graphlit 以API优先的平台,用于构建知识驱动的AI应用和智能体 官网 GitHub GitHub星数 8小时前
rag-citation 将RAG与自动引用生成结合,提升内容可信度 官网 GitHub GitHub星数 上周
PostgresML PostgreSQL + GPU,具备分块、嵌入、转换和排名等功能 官网 GitHub GitHub星数 昨天
chainlit 在几分钟内而非几周内构建生产就绪的对话式AI应用 官网 GitHub GitHub星数 24小时前
pathway 用于流处理、实时分析、LLM流水线和RAG的Python ETL框架。 官网 GitHub GitHub星数 7小时前
cognita 用于模块化、开源生产级应用的RAG框架。 官网 GitHub GitHub星数 2天前
FlashRAG 用于高效RAG研究的Python工具包 - GitHub GitHub星数 3小时前
RAGatouille 轻松在任何RAG管道中训练和使用先进的检索方法。 - GitHub GitHub星数 4个月前
pgai 一套仅在PostgreSQL中即可开发RAG、语义搜索及其他AI应用的工具套件 官网 GitHub GitHub星数 10小时前
Vectara 可信赖的RAG平台,用于快速构建AI助手和智能体。 官网 GitHub - -
mode 具有专家模型、智能聚类和小数据集高效检索功能的RAG框架。 - GitHub GitHub星数 2天前
haiku.rag 开源RAG框架,支持监控、CLI、搜索、问答、MCP,并可在SQLite上运行。 - Github GitHub星数 3小时前
ZeroEntropy AI 开放权重的重排序器、嵌入及端到端检索API 官网 Github - 3小时前

RAG 数据准备框架

名称 描述 官网 GitHub 星标 活跃度
CocoIndex 用于构建全新索引的 ETL 框架 官网 Github GitHub 1 小时前
Gitana.io 面向编辑审批的内容平台,支持将训练好的数据集定时部署到 RAG 向量数据库 官网 - - -
Chonkie 简洁、轻量且快速的 RAG 分块库 官网 GitHub GitHub 星标 1 小时前

RAG 项目

名称 描述 官网 GitHub 星数 活跃度
LlamaParse 原生支持生成式AI的文档解析平台 官网 GitHub GitHub星数 2天前
Langchain-extract 使用大语言模型从文本和文件中提取信息的Web服务器 官网 GitHub GitHub星数 4分钟前
Needle 开箱即用的生产级RAG流水线。 官网 GitHub GitHub星数 1小时前
Unstructured.io 构建用于标注、训练或生产环境的自定义预处理流水线 官网 GitHub GitHub星数 3天前
Verba 由Weaviate驱动的RAG聊天机器人 官网 GitHub GitHub星数 2周前
Unstract 无代码平台,用于部署API和ETL管道以结构化非结构化文档 官网 GitHub GitHub星数 4小时前
Humata.ai 跨所有文档文件提问 官网 - - 4小时前
Kiln 构建包含评估、RAG、智能体、微调和合成数据的AI系统 官网 GitHub GitHub星数 12小时前
Ragie.ai 为开发者提供的完全托管的RAG即服务。 官网 GitHub - 12小时前
Reducto 解析复杂文档并创建适合LLM使用的输入 官网 GitHub - 2周前
Midship 直接将文档数据提取到您的电子表格/ERP/CRM 官网 - - -
DocuPanda 将文档转换为结构化、标准化的字段和值集合 官网 - - -
contextual-doc-retrieval-opneai-reranker 使用GPT-4和Cohere进行查询扩展,并结合BM25进行重排序 - GitHub GitHub星数 上周
Raggenie 低代码平台,用于构建自定义的基于RAG的AI应用 官网 GitHub GitHub星数 10小时前
Chunkr 基于视觉模型的PDF分块和OCR,专为快速处理大规模数据集优化 官网 GitHub GitHub星数 11小时前
tldw 类似于NotebookLM的开源项目 官网 GitHub GitHub星数 昨天
Cerbos 面向RAG和LLM的访问控制。 官网 GitHub GitHub星数 14小时前
extractous 为您的AI应用提供极快的数据提取 官网 GitHub GitHub星数 -
SWIRL 面向工作场所的AI搜索与RAG。即时获取公司知识库中的AI洞察。 官网 GitHub GitHub星数 2周前
ChatDOC PDF Parser 高精度PDF解析,可将文档转化为适用于RAG系统的完美结构化数据。 官网 - - -
Gurubase 通过索引网站、PDF文档、YouTube视频和GitHub代码仓库,创建AI驱动的问答助手。 官网 GitHub GitHub星数 1天前
Archive Agent 开源语义文件追踪器,具备OCR + AI搜索功能。内置RAG引擎的智能索引器。 - GitHub GitHub星数 -
MidrasAI Colpali多模态检索模型的简单API。 - Github GitHub星数 6分钟前
EmbeddingBridge 用于嵌入的版本控制和迁移工具 - Github Github星数 -
Stream-Rag-Agent 面向Kafka的流式RAG代理 - Github -
zchunk 开源高效的基于LLM的分块方法 官网 Github - 2小时前
hydrot 一款面向企业文档的生产就绪型检索增强生成(RAG)系统,对Markdown内容提供一流的支持。采用微服务架构,实现水平扩展和灵活性。 - Github Github星数 -
Tensorlake 面向可引用、可追溯的RAG系统的文档解析。提取文本、表格和图像,同时保持复杂的布局,附带边界框坐标,并支持结构化输出 官网 Github Github星数 2天前

RAG 资源与站点

站点/文章 描述 链接
上下文检索 Anthropic 推出上下文检索功能 官网
Open-RAG 基于开源大语言模型的增强型检索增强推理 官网
ColPali 使用视觉语言模型实现高效文档检索 官网
RAG_Techniques 展示多种 RAG 系统的高级技术 官网
GenAI_Agents 各类 AI 代理技术的教程与实现 官网
RAG From Scratch LangChain 官方指南:从零开始构建 RAG 流程 官网

模型排行榜

名称 描述 链接
Artificial Analysis 大语言模型比较 官网
HuggingFace/mteb 嵌入模型排行榜 官网
Vectara 幻觉排行榜 大语言模型幻觉排行榜 官网

如果您正在寻找主流的 RAG 框架和技巧,请查看 Nir Diamant 的优秀仓库:RAG Techniques。该仓库专注于已在社区中获得广泛认可的成熟工具和方法。

许可证

本项目采用 MIT 许可证。详情请参阅 LICENSE 文件。

加入讨论

本项目是 r/RAG 社区的一部分。您有任何反馈或建议吗?欢迎随时提交问题、发起讨论,或加入我们的 Discord 服务器!我们希望将此仓库打造成为所有探索 RAG 生态系统的用户的宝贵资源,您的意见对我们至关重要。

常见问题

相似工具推荐

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。

162.1k|★★★☆☆|今天
开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上

139k|★★☆☆☆|今天
开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。

107.7k|★★☆☆☆|2天前
开发框架图像Agent

NextChat

NextChat 是一款轻量且极速的 AI 助手,旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性,以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发,NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。 这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言,它也提供了便捷的自托管方案,支持一键部署到 Vercel 或 Zeabur 等平台。 NextChat 的核心亮点在于其广泛的模型兼容性,原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型,让用户在一个界面即可自由切换不同 AI 能力。此外,它还率先支持 MCP(Model Context Protocol)协议,增强了上下文处理能力。针对企业用户,NextChat 提供专业版解决方案,具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能,满足公司对数据隐私和个性化管理的高标准要求。

87.6k|★★☆☆☆|今天
开发框架语言模型

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程,旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周,包含 26 节精炼课程和 52 道配套测验,内容涵盖从基础概念到实际应用的完整流程,有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。 无论是希望转型的开发者、需要补充算法背景的研究人员,还是对人工智能充满好奇的普通爱好者,都能从中受益。课程不仅提供了清晰的理论讲解,还强调动手实践,让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持,通过自动化机制提供了包括简体中文在内的 50 多种语言版本,极大地降低了全球不同背景用户的学习门槛。此外,项目采用开源协作模式,社区活跃且内容持续更新,确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路,ML-For-Beginners 将是理想的起点。

85k|★★☆☆☆|今天
图像数据工具视频

ragflow

RAGFlow 是一款领先的开源检索增强生成(RAG)引擎,旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体(Agent)能力相结合,不仅支持从各类文档中高效提取知识,还能让模型基于这些知识进行逻辑推理和任务执行。 在大模型应用中,幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构(如表格、图表及混合排版),显著提升了信息检索的准确度,从而有效减少模型“胡编乱造”的现象,确保回答既有据可依又具备时效性。其内置的智能体机制更进一步,使系统不仅能回答问题,还能自主规划步骤解决复杂问题。 这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统,还是致力于探索大模型在垂直领域落地的创新者,都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口,既降低了非算法背景用户的上手门槛,也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目,它正成为连接通用大模型与行业专有知识之间的重要桥梁。

77.1k|★★★☆☆|昨天
Agent图像开发框架