rag-zero-to-hero-guide

1.3k 325 非常简单 1 次阅读 4天前Apache-2.0语言模型开发框架其他

AI 解读由 AI 自动生成，仅供参考

rag-zero-to-hero-guide 是一份专为开发者打造的 RAG（检索增强生成）技术全景学习指南，旨在帮助用户从零基础快速进阶到高级应用。针对大语言模型普遍存在的知识滞后、事实幻觉及私有数据缺失等痛点，该指南通过系统化的课程与实战代码，清晰阐述了如何利用外部知识库增强模型能力，从而构建更精准、可靠的 AI 应用。

内容涵盖 RAG 的核心原理、架构流程、常见挑战及必备术语，并提供了从零手写实现到使用 LangChain、LlamaIndex 等主流框架落地的完整笔记。特色在于其不仅包含处理网页、YouTube 视频等多源数据的实战案例，还引入了基于 CrewAI 的代理式 RAG（Agentic RAG）前沿实践。此外，指南特别设置了评估专题，详细讲解如何利用 RAGAS 和 DeepEval 等工具量化检索与生成效果，有效解决模型“胡说八道”的难题。无论是希望入门 RAG 的初学者，还是寻求优化现有系统的资深工程师，都能从中获得结构清晰、即学即用的宝贵资源。

使用场景

某初创公司的后端工程师小李，接到任务要在两周内为公司内部知识库构建一个能准确回答员工关于技术文档和会议记录提问的智能问答系统。

没有 rag-zero-to-hero-guide 时

概念模糊导致选型困难：面对 LangChain、LlamaIndex 等众多框架，因不理解 RAG 的索引、检索、增强等核心步骤，花费数天试错仍无法确定技术路线。
从零实现陷阱多：尝试手动编写代码构建基础 RAG 时，在数据清洗和向量匹配环节频繁报错，缺乏从 Scratch 实现的参考范例，进度严重滞后。
效果评估无标准：系统上线后出现“胡言乱语”（幻觉）现象，但不知道如何使用专业指标量化检索质量或生成准确度，只能凭感觉盲目调优。
高级场景束手无策：当业务方提出需要解析 YouTube 培训视频或特定网页内容时，因缺乏针对非结构化数据的处理案例，功能开发陷入停滞。

使用 rag-zero-to-hero-guide 后

路径清晰快速上手：通过"RAG 路线图”和“必知术语”章节，迅速理清了从基础原理到高级架构的学习路径，当天就锁定了适合的技术栈。
代码复用效率倍增：直接参考"RAG from Scratch"和"LangChain 实战”中的 Notebook 代码，复用了成熟的数据处理流水线，将核心功能开发时间缩短至 3 天。
科学评估精准调优：利用指南中关于 RAGAS 和 DeepEval 的评估教程，建立了包含幻觉检测在内的自动化评估体系，快速定位并修复了检索不准的问题。
复杂需求轻松落地：依据"YouTube 视频 RAG"和"Agentic RAG"的具体案例，顺利扩展了系统能力，实现了对多媒体内容和多步推理任务的支持。

rag-zero-to-hero-guide 将原本需要数月摸索的 RAG 学习曲线压缩为几周的高效实战，帮助开发者从理论迷茫快速走向生产级应用落地。

运行环境要求

GPU

未说明

内存

未说明

依赖

notes该项目主要是一个学习指南和资源列表（包含教程文档和示例 Notebook），而非单一的独立软件包。因此 README 中未提供统一的系统环境、硬件或 Python 版本要求。具体的运行需求取决于用户选择运行的特定示例（如 LangChain 或 CrewAI 脚本）以及所选用的底层大模型和向量数据库。建议参考各个子项目（如 notebooks 文件夹中的具体代码）的头部注释或单独的安装说明来确定具体依赖。

python未说明

LangChain

Llama Index

CrewAI

RAGAS

DeepEval

FAISS

Chroma

Qdrant

PyMuPDF4LLM

FlashRAG

快速开始

👩🏼‍💻 RAG 从零到英雄指南

本仓库旨在提供一份全面的指南，帮助您从基础到进阶学习 RAG。

快速链接


🧱 RAG 基础课程	🚀 RAG 工具包	🩸 RAG 综述论文
✅ RAG 评估课程

RAG 基础课程

主题	描述	链接
什么是 RAG？	通过一个简单示例解释 RAG。	链接
为什么需要 RAG？	解释 LLM 的缺点以及 RAG 如何解决这些问题。	链接
RAG 是如何工作的？	详细说明 RAG 的各个步骤——索引、检索、增强和生成。	链接
RAG 的优势与挑战	讨论 RAG 的优势和挑战。	链接
RAG 必备术语	RAG 相关必备术语的定义。	链接
RAG 学习路线图	从基础到进阶学习 RAG 的详细路线图。	链接
RAG 开发者技术栈	涵盖构建 RAG 系统所使用的各种库。	链接
从零开始实现 RAG	不使用任何框架，从头开始实现 RAG。	链接
使用 LangChain 实现 RAG	使用 LangChain 框架实现 RAG。	链接
网站 RAG	使用 LangChain 框架实现针对网站内容的 RAG。	链接
YouTube 视频 RAG	使用 LangChain 框架实现基于 YouTube 视频字幕的 RAG。	链接
代理式 RAG	使用 CrewAI 框架实现的代理式 RAG 系统。	链接

RAG 评估课程

主题	描述	链接
RAG 评估指标简介	RAG 评估指标的简要概述	链接
RAG 检索器评估指标	详细解释 RAG 检索器的评估指标	链接
RAG 生成器评估指标	详细解释 RAG 生成器的评估指标	链接
使用 RAGAS 进行 RAG 评估	使用 RAGAS 库实现 RAG 评估指标	链接
使用 DeepEval 进行 RAG 评估	使用 DeepEval 库实现 RAG 评估指标	链接
检测 RAG 中的幻觉	使用 LLM 和 LettuceDetect 库检测 RAG 中的幻觉	链接

RAG 工具包

🔴框架🔴

库	描述	链接
LangChain	LangChain 是一个用于开发由大型语言模型（LLM）驱动的应用程序的框架。	链接
Llama Index	LlamaIndex 是一个适用于 LLM 应用程序的数据框架	链接
Haystack	Haystack 是一个端到端的 LLM 框架，允许您构建由 LLM、Transformer 模型、向量搜索等技术驱动的应用程序。	链接
fastRAG	一个用于高效且优化的检索增强生成流水线的研究框架，结合了最先进的 LLM 和信息检索技术。	链接
Llmware	一个用于构建企业级 RAG 流水线的统一框架，采用小型专用模型	链接

🟠研究🟠

库	描述	链接
FlashRAG	一个用于高效 RAG 研究的 Python 工具箱。该工具箱包含 36 个预处理过的基准 RAG 数据集和 16 种最先进的 RAG 算法。	链接

🟡数据提取 - 网页爬取🟡

库	描述	链接
Crawl4AI（网页爬取）	一款开源的、对 LLM 友好的网络爬虫和抓取工具	链接
ScrapeGraphAI（网页及文档）	一种利用 LLM 和直接图逻辑构建网页及本地文档（XML、HTML、JSON、Markdown 等）抓取管道的 Python 爬虫库。	链接
Crawlee（网页爬取）	一个用于网页爬取和浏览器自动化的库	链接

🟢数据提取 - 文档🟢

库	描述	链接
Docling（文档）	Docling 能够轻松快速地解析文档并将其导出为所需格式。	链接
Llama Parse（文档）	一种原生支持 GenAI 的文档解析器，能够为下游任何 LLM 场景（如 RAG、智能体）解析复杂的文档数据。	链接
PyMuPDF4LLM（文档）	PyMuPDF4LLM 库使您更容易以 LLM 和 RAG 环境所需的格式提取 PDF 内容。	链接
MegaParse（文档）	一种适用于各类文档的解析器	链接
ExtractThinker（文档）	一个专为 LLM 设计的文档智能库	链接

🔵向量数据库🔵

库	描述	链接
SQLite-Vec	一个可在任何地方运行的向量搜索 SQLite 扩展！	链接
FAISS	用于高效相似性搜索和稠密向量聚类的库。	链接
PGVector	面向 Postgres 的开源向量相似性搜索	链接
Chroma	原生支持 AI 的开源嵌入数据库。使用内存构建 Python 或 JavaScript LLM 应用程序的最快方式！	链接
Qdrant	面向下一代 AI 的高性能、大规模向量数据库和向量搜索引擎。	链接
Pincone	用于机器学习应用的向量数据库。	链接
Weaviate	Weaviate 是一款云原生、开源的向量数据库，功能强大、速度快且可扩展。	链接
Milvus	Milvus 是一款为可扩展向量近似最近邻搜索而构建的高性能、云原生向量数据库	链接

🟣分块🟣

库	描述	链接
Chonkie	一种轻量级、闪电般快速且易于使用的 RAG 分块库。毫不拖泥带水的 RAG 分块库。该库支持七种不同的分块策略。	链接

🟤重排序器🟤

库	描述	链接
Rerankers	一个轻量级、低依赖性的统一 API，可用于所有常见的重排序和交叉编码器模型。只需很少的代码库知识，即可添加任何新的重排序模型。	链接

🟠代理式 RAG🟠

库	描述	链接
CrewAI	用于编排角色扮演、自主 AI 代理的框架。	链接
Agno	构建具有记忆、知识、工具和推理能力的 AI 代理。可通过精美的代理 UI 与它们对话。	链接
LangGraph	将稳健的语言代理构建为图结构。	链接
AutoGen	一个用于构建 AI 代理系统的开源框架。	链接
R2R	具有 RESTful API 的代理式检索增强生成 (RAG)。R2R 提供多模态内容摄取、混合搜索功能、知识图谱以及全面的用户和文档管理。	链接
Vectara	构建代理式 RAG 应用程序。	链接

🟢图式 RAG🟢

库	描述	链接
GraphRAG	一个模块化的基于图的检索增强生成 (RAG) 系统。	链接
Nano GraphRAG	一个简单易用、便于修改的 GraphRAG 实现。	链接
FastGraph RAG	简化且可提示的 Fast GraphRAG 框架，专为可解释、高精度的代理驱动型检索工作流设计。	链接

🔴评估🔴

库	描述	链接
RAGChecker	用于诊断 RAG 的细粒度框架。	链接
BeyondLLM	Beyond LLM 提供了一套一体化工具，用于检索增强生成 (RAG) 系统的实验、评估和部署	链接
RAGAS	Ragas 是您评估和优化大型语言模型 (LLM) 应用程序的终极工具包。	链接
Giskard	面向 ML 和 LLM 系统的开源评估与测试工具。	链接
DeepEval	LLM（RAG）评估框架。	链接

RAG 综述论文

论文	类别	链接
大型语言模型的检索增强生成：综述	通用	链接
自然语言处理中的检索增强生成：综述	通用	链接
检索增强生成 (RAG) 的综合综述：演变、现状与未来方向	通用	链接
人工智能生成内容的检索增强生成：综述	通用	链接
RAG 与 LLM 的融合：迈向检索增强型大型语言模型	通用	链接
面向大型语言模型的检索增强文本生成综述	通用	链接
检索增强生成 (RAG) 及其超越：如何更明智地让您的 LLM 使用外部数据的综合综述	通用	链接
图式检索增强生成：综述	图式 RAG	链接
代理式检索增强生成：关于代理式 RAG 的综述	代理式 RAG	链接
检索增强生成的评估：综述	评估	链接
检索增强生成最佳实践探索	RAG 最佳实践	链接

RAG Zero to Hero Guide 快速上手指南

本指南基于 rag-zero-to-hero-guide 开源项目整理，旨在帮助开发者从零开始掌握检索增强生成（RAG）技术。该项目主要提供学习路径、教程笔记和工具清单，而非单一的 Python 包。以下是基于其核心内容的快速入门流程。

环境准备

在开始之前，请确保您的开发环境满足以下要求：

操作系统：Linux, macOS 或 Windows (推荐 WSL2)
Python 版本：Python 3.9 或更高版本
前置依赖：
- pip (Python 包管理工具)
- git (用于克隆仓库)
- API Key：准备 OpenAI API Key 或其他兼容的大模型 API Key（如 Azure OpenAI, Local LLM 等）

国内加速建议：推荐使用国内镜像源安装 Python 依赖，以提升下载速度：
export PIP_INDEX_URL=https://pypi.tuna.tsinghua.edu.cn/simple

安装步骤

由于本项目是一个包含教程代码和笔记的资源库，首先需要克隆仓库并安装基础运行依赖。

克隆项目仓库

git clone https://github.com/kalyan-kpl/rag-zero-to-hero-guide.git
cd rag-zero-to-hero-guide

创建虚拟环境（推荐）

python -m venv venv
source venv/bin/activate  # Windows 用户请使用: venv\Scripts\activate

安装核心框架依赖 根据教程路线，最基础的实现需要 LangChain 及其相关生态。执行以下命令安装核心组件：
```
pip install langchain langchain-community langchain-openai faiss-cpu tiktoken
```
若需运行特定进阶教程（如 Agentic RAG），可能还需额外安装：
```
# 用于智能体教程
pip install crewai

# 用于评估教程
pip install ragas deepeval
```

基本使用

本项目提供了从“零代码实现”到“框架实现”的多种路径。以下是最简单的 LangChain 基础 RAG 使用示例，对应仓库中 RAG Basics/notebooks/RAG_with_LangChain.ipynb 的核心逻辑。

1. 配置环境变量

在终端中设置您的 API Key：

export OPENAI_API_KEY="your-api-key-here"

2. 运行最小化 RAG 流程

创建一个名为 simple_rag.py 的文件，写入以下代码。该示例演示了文档加载、切片、向量化、检索及生成的完整闭环。

from langchain.document_loaders import TextLoader
from langchain.text_splitter import CharacterTextSplitter
from langchain.embeddings import OpenAIEmbeddings
from langchain.vectorstores import FAISS
from langchain.chat_models import ChatOpenAI
from langchain.chains import RetrievalQA

# 1. 准备数据 (此处创建一个临时文本文件作为示例)
with open("sample_doc.txt", "w", encoding="utf-8") as f:
    f.write("RAG (Retrieval-Augmented Generation) 是一种结合检索和生成的 AI 技术。\n")
    f.write("它通过从外部知识库检索相关信息来增强大语言模型的回答能力。\n")
    f.write("RAG 能有效减少大模型的幻觉问题，并提供最新的领域知识。")

# 2. 加载文档
loader = TextLoader("sample_doc.txt", encoding="utf-8")
documents = loader.load()

# 3. 文本切片
text_splitter = CharacterTextSplitter(chunk_size=100, chunk_overlap=0)
texts = text_splitter.split_documents(documents)

# 4. 初始化嵌入模型并构建向量库
embeddings = OpenAIEmbeddings()
db = FAISS.from_documents(texts, embeddings)

# 5. 初始化大语言模型
llm = ChatOpenAI(model_name="gpt-3.5-turbo", temperature=0)

# 6. 构建检索问答链
qa_chain = RetrievalQA.from_chain_type(
    llm=llm,
    chain_type="stuff",
    retriever=db.as_retriever()
)

# 7. 执行查询
query = "RAG 的主要优势是什么？"
result = qa_chain.run(query)

print(f"问题：{query}")
print(f"回答：{result}")

3. 运行脚本

python simple_rag.py

下一步学习

完成上述基础示例后，建议按照项目目录结构深入探索：

原理深入：阅读 RAG Basics 目录下的 Markdown 文档，理解 Indexing, Retrieval, Augmentation 等核心概念。
场景扩展：参考 notebooks 目录中的 Web_Page_RAG.ipynb (网页 RAG) 或 YouTube_Video_RAG.ipynb (视频转录 RAG)。
系统评估：使用 RAG Evaluation 章节提供的 RAGAS 或 DeepEval 笔记，学习如何量化评估您的 RAG 系统性能。

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

★ 349.3k|★★★☆☆|今天

Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|昨天

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 141.5k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 107.9k|★★☆☆☆|今天

开发框架图像Agent

LLMs-from-scratch

LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目，旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型（LLM）。它不仅是同名技术著作的官方代码库，更提供了一套完整的实践方案，涵盖模型开发、预训练及微调的全过程。该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型，却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码，用户能够透彻掌握 Transformer 架构、注意力机制等关键原理，从而真正理解大模型是如何“思考”的。此外，项目还包含了加载大型预训练权重进行微调的代码，帮助用户将理论知识延伸至实际应用。 LLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API，而是渴望探究模型构建细节的技术人员而言，这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计：将复杂的系统工程拆解为清晰的步骤，配合详细的图表与示例，让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础，还是为未来研发更大规模的模型做准备

★ 90.1k|★★★☆☆|今天

语言模型图像Agent

Deep-Live-Cam

Deep-Live-Cam 是一款专注于实时换脸与视频生成的开源工具，用户仅需一张静态照片，即可通过“一键操作”实现摄像头画面的即时变脸或制作深度伪造视频。它有效解决了传统换脸技术流程繁琐、对硬件配置要求极高以及难以实时预览的痛点，让高质量的数字内容创作变得触手可及。这款工具不仅适合开发者和技术研究人员探索算法边界，更因其极简的操作逻辑（仅需三步：选脸、选摄像头、启动），广泛适用于普通用户、内容创作者、设计师及直播主播。无论是为了动画角色定制、服装展示模特替换，还是制作趣味短视频和直播互动，Deep-Live-Cam 都能提供流畅的支持。其核心技术亮点在于强大的实时处理能力，支持口型遮罩（Mouth Mask）以保留使用者原始的嘴部动作，确保表情自然精准；同时具备“人脸映射”功能，可同时对画面中的多个主体应用不同面孔。此外，项目内置了严格的内容安全过滤机制，自动拦截涉及裸露、暴力等不当素材，并倡导用户在获得授权及明确标注的前提下合规使用，体现了技术发展与伦理责任的平衡。

★ 88.9k|★★★☆☆|今天

开发框架图像Agent