[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-KalyanKS-NLP--rag-zero-to-hero-guide":3,"tool-KalyanKS-NLP--rag-zero-to-hero-guide":61},[4,18,26,36,44,53],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":17},4358,"openclaw","openclaw\u002Fopenclaw","OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。\n\n这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。\n\nOpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你",349277,3,"2026-04-06T06:32:30",[13,14,15,16],"Agent","开发框架","图像","数据工具","ready",{"id":19,"name":20,"github_repo":21,"description_zh":22,"stars":23,"difficulty_score":10,"last_commit_at":24,"category_tags":25,"status":17},3808,"stable-diffusion-webui","AUTOMATIC1111\u002Fstable-diffusion-webui","stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。\n\n无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。",162132,"2026-04-05T11:01:52",[14,15,13],{"id":27,"name":28,"github_repo":29,"description_zh":30,"stars":31,"difficulty_score":32,"last_commit_at":33,"category_tags":34,"status":17},1381,"everything-claude-code","affaan-m\u002Feverything-claude-code","everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。\n\n通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。\n\n这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上",141543,2,"2026-04-06T11:32:54",[14,13,35],"语言模型",{"id":37,"name":38,"github_repo":39,"description_zh":40,"stars":41,"difficulty_score":32,"last_commit_at":42,"category_tags":43,"status":17},2271,"ComfyUI","Comfy-Org\u002FComfyUI","ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。\n\n这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。\n\n无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。",107888,"2026-04-06T11:32:50",[14,15,13],{"id":45,"name":46,"github_repo":47,"description_zh":48,"stars":49,"difficulty_score":32,"last_commit_at":50,"category_tags":51,"status":17},4721,"markitdown","microsoft\u002Fmarkitdown","MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。\n\n在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。\n\n这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器",93400,"2026-04-06T19:52:38",[52,14],"插件",{"id":54,"name":55,"github_repo":56,"description_zh":57,"stars":58,"difficulty_score":10,"last_commit_at":59,"category_tags":60,"status":17},4487,"LLMs-from-scratch","rasbt\u002FLLMs-from-scratch","LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目，旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型（LLM）。它不仅是同名技术著作的官方代码库，更提供了一套完整的实践方案，涵盖模型开发、预训练及微调的全过程。\n\n该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型，却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码，用户能够透彻掌握 Transformer 架构、注意力机制等关键原理，从而真正理解大模型是如何“思考”的。此外，项目还包含了加载大型预训练权重进行微调的代码，帮助用户将理论知识延伸至实际应用。\n\nLLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API，而是渴望探究模型构建细节的技术人员而言，这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计：将复杂的系统工程拆解为清晰的步骤，配合详细的图表与示例，让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础，还是为未来研发更大规模的模型做准备",90106,"2026-04-06T11:19:32",[35,15,13,14],{"id":62,"github_repo":63,"name":64,"description_en":65,"description_zh":66,"ai_summary_zh":66,"readme_en":67,"readme_zh":68,"quickstart_zh":69,"use_case_zh":70,"hero_image_url":71,"owner_login":72,"owner_name":73,"owner_avatar_url":74,"owner_bio":75,"owner_company":76,"owner_location":76,"owner_email":76,"owner_twitter":77,"owner_website":76,"owner_url":78,"languages":79,"stars":84,"forks":85,"last_commit_at":86,"license":87,"difficulty_score":88,"env_os":89,"env_gpu":90,"env_ram":90,"env_deps":91,"category_tags":104,"github_topics":106,"view_count":32,"oss_zip_url":76,"oss_zip_packed_at":76,"status":17,"created_at":114,"updated_at":115,"faqs":116,"releases":117},4602,"KalyanKS-NLP\u002Frag-zero-to-hero-guide","rag-zero-to-hero-guide","Comprehensive guide to learn RAG from basics to advanced. ","rag-zero-to-hero-guide 是一份专为开发者打造的 RAG（检索增强生成）技术全景学习指南，旨在帮助用户从零基础快速进阶到高级应用。针对大语言模型普遍存在的知识滞后、事实幻觉及私有数据缺失等痛点，该指南通过系统化的课程与实战代码，清晰阐述了如何利用外部知识库增强模型能力，从而构建更精准、可靠的 AI 应用。\n\n内容涵盖 RAG 的核心原理、架构流程、常见挑战及必备术语，并提供了从零手写实现到使用 LangChain、LlamaIndex 等主流框架落地的完整笔记。特色在于其不仅包含处理网页、YouTube 视频等多源数据的实战案例，还引入了基于 CrewAI 的代理式 RAG（Agentic RAG）前沿实践。此外，指南特别设置了评估专题，详细讲解如何利用 RAGAS 和 DeepEval 等工具量化检索与生成效果，有效解决模型“胡说八道”的难题。无论是希望入门 RAG 的初学者，还是寻求优化现有系统的资深工程师，都能从中获得结构清晰、即学即用的宝贵资源。","\u003Ch1 align =\"center\"> 👩🏼‍💻 RAG Zero to Hero Guide \u003C\u002Fh1>\nThis repository serves as a comprehensive guide to learn RAG from basics to advanced. \n\u003Cp align=\"center\">\n  \u003Ca href=\"https:\u002F\u002Fwww.linkedin.com\u002Fin\u002Fkalyanksnlp\u002F\">\n    \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FKalyanKS-NLP_rag-zero-to-hero-guide_readme_e4c42d093d16.png\" alt=\"LinkedIn\">\n  \u003C\u002Fa>\n  \u003Ca href=\"https:\u002F\u002Fx.com\u002Fkalyan_kpl\">\n    \u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FKalyan%20KS-%23000000.svg?logo=X&logoColor=white\" alt=\"Twitter\">\n  \u003C\u002Fa>\n   \u003Ca href=\"https:\u002F\u002Fwww.youtube.com\u002F@kalyanksnlp\">\n    \u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FKalyan%20KS-%23FF0000.svg?logo=YouTube&logoColor=white\" alt=\"Twitter\">\n  \u003C\u002Fa>\n\t\n\u003C\u002Fp>\n\n## Quick links\n||||\n|---|---|---|\n| [🧱 RAG Basics Course](#rag-basics-course) | [🚀 RAG Toolkit](#rag-toolkit) | [🩸 RAG Survey Papers](#rag-survey-papers) | \n| [✅ RAG Evaluation Course](#rag-evaluation-course) | | |\n\n## RAG Basics Course\n| Topic | Description | Link |\n|---------|-------------|------|\n| What is RAG? | Explain RAG in with a simple example.  | [Link](RAG%20Basics\u002FWhat_is_RAG.md)|\n| Why RAG? | Explain the drawbacks of LLMs and how RAG addresses them.|  [Link](RAG%20Basics\u002FWhy_RAG.md)|\n| How does RAG work? | Explain the different steps in RAG - Indexing, Retrieval, Augmentation and Generation.|  [Link](RAG%20Basics\u002FHow_does_RAG_work.md)|\n| RAG Benefits and Challenges | Discusses the benefits and challenges of RAG. |  [Link](RAG%20Basics\u002FRAG_Benefits_and_Challenges.md)|\n| RAG Must Know Terms| Definitions of RAG must know terms. |  [Link](RAG%20Basics\u002FRAG_must_know_terms.md)|\n| RAG Roadmap | Detailed roadmap to learn RAG from basics to advanced. |  [Link](RAG%20Basics\u002FRAG_Roadmap.md)|\n| RAG Developer's Stack | Covers the various libraries used to build RAG systems | [Link](RAG%20Basics\u002FRAG_Developer_Stack.md)|\n| RAG from Scratch | RAG implementation from scratch without any frameworks. | [Link](RAG%20Basics\u002Fnotebooks\u002FRAG_from_Scratch.ipynb)\n| RAG with LangChain | RAG implementation using LangChain framework. | [Link](RAG%20Basics\u002Fnotebooks\u002FRAG_with_LangChain.ipynb)\n| Website RAG | RAG over a website implemented using LangChain framework. | [Link](RAG%20Basics\u002Fnotebooks\u002FWeb_Page_RAG.ipynb)\n| YouTube Video RAG | RAG over a YouTube video transcript implemented using LangChain framework. | [Link](RAG%20Basics\u002Fnotebooks\u002FYouTube_Video_RAG.ipynb)\n| Agentic RAG | Agentic RAG system implemented using CrewAI framework. | [Link](RAG%20Basics\u002Fnotebooks\u002FAgenticRAG_with_CrewAI.ipynb)\n\n## RAG Evaluation Course\n| Topic | Description | Link |\n|---------|-------------|------|\n| RAG Evaluation Metrics Intro | Brief overview of RAG evaluation metrics  | [Link](RAG%20Evaluation\u002Frag_eval_intro.md) | \n| RAG Retriever Evaluation Metrics | Detailed explanation of RAG retriever evaluation metrics  | [Link](RAG%20Evaluation\u002Frag_retriever_metrics.md) | \n| RAG Generator Evaluation Metrics | Detailed explanation of RAG generator evaluation metrics | [Link](RAG%20Evaluation\u002Frag_generator_metrics.md) |\n| RAG Evaluation with RAGAS | Implementation of RAG evaluation metrics with RAGAS library | [Link](RAG%20Evaluation\u002Fnotebooks\u002FRAG_Evaluation_using_RAGAS.ipynb) |\n| RAG Evaluation with DeepEval | Implementation of RAG evaluation metrics with DeepEval library | [Link](RAG%20Evaluation\u002Fnotebooks\u002FRAG_Evaluation_using_DeepEval.ipynb) |\n| Detect Hallucination in RAG | Detection of hallucination in RAG using LLMs and LettuceDetect library | [Link](RAG%20Evaluation\u002Fnotebooks\u002FHallucination_RAG.ipynb) |\n\n\n## RAG Toolkit\n\n\u003Cp align = \"center\"> \u003Cb> 🔴Frameworks🔴 \u003C\u002Fb> \u003C\u002Fp>\n\n| Library | Description | Link |\n|---------|-------------|------|\n| LangChain | LangChain is a framework for developing applications powered by large language models (LLMs). | [Link](https:\u002F\u002Fgithub.com\u002Flangchain-ai\u002Flangchain) |\n| Llama Index | LlamaIndex is a data framework for your LLM applications | [Link](https:\u002F\u002Fgithub.com\u002Frun-llama\u002Fllama_index) |\n| Haystack | Haystack is an end-to-end LLM framework that allows you to build applications powered by LLMs, Transformer models, vector search and more. | [Link](https:\u002F\u002Fgithub.com\u002Fdeepset-ai\u002Fhaystack) |\n| fastRAG | Research framework for efficient and optimized retrieval augmented generative pipelines, incorporating state-of-the-art LLMs and Information Retrieval. | [Link](https:\u002F\u002Fgithub.com\u002FIntelLabs\u002FfastRAG) |\n| Llmware | Unified framework for building enterprise RAG pipelines with small, specialized models | [Link](https:\u002F\u002Fgithub.com\u002Fllmware-ai\u002Fllmware) |\n\n\u003Cp align = \"center\"> \u003Cb> 🟠Research🟠 \u003C\u002Fb> \u003C\u002Fp>\n\n| Library | Description | Link |\n|---------|-------------|------|\n| FlashRAG | A Python Toolkit for Efficient RAG Research. This toolkit includes 36 pre-processed benchmark RAG datasets and 16 state-of-the-art RAG algorithms. | [Link](https:\u002F\u002Fgithub.com\u002FRUC-NLPIR\u002FFlashRAG) |\n\n\u003Cp align = \"center\"> \u003Cb> 🟡Data Extraction - Web Scraping🟡 \u003C\u002Fb> \u003C\u002Fp>\n\n| Library | Description | Link |\n|---------|-------------|------|\n| Crawl4AI (Web Scraping) | Open-source LLM Friendly Web Crawler & Scrapper | [Link](https:\u002F\u002Fgithub.com\u002Funclecode\u002Fcrawl4ai) |\n| ScrapeGraphAI (Web & Document) | A web scraping Python library that uses LLM and direct graph logic to create scraping pipelines for websites and local documents (XML, HTML, JSON, Markdown, etc.). | [Link](https:\u002F\u002Fgithub.com\u002FScrapeGraphAI\u002FScrapegraph-ai) |\n| Crawlee (Web Scraping) | A web scraping and browser automation library | [Link](https:\u002F\u002Fgithub.com\u002Fapify\u002Fcrawlee-python) |\n\n\u003Cp align = \"center\"> \u003Cb> 🟢Data Extraction - Documents🟢 \u003C\u002Fb> \u003C\u002Fp>\n\n| Library | Description | Link |\n|---------|-------------|------|\n| Docling (Document) | Docling parses documents and exports them to the desired format with ease and speed. | [Link](https:\u002F\u002Fgithub.com\u002Fdocling-project\u002Fdocling) |\n| Llama Parse (Document) | GenAI-native document parser that can parse complex document data for any downstream LLM use case (RAG, agents). | [Link](https:\u002F\u002Fgithub.com\u002Frun-llama\u002Fllama_cloud_services) |\n| PyMuPDF4LLM (Document) | PyMuPDF4LLM library makes it easier to extract PDF content in the format you need for LLM & RAG environments. | [Link](https:\u002F\u002Fpymupdf.readthedocs.io\u002Fen\u002Flatest\u002Fpymupdf4llm\u002F) |\n| MegaParse (Document) | Parser for every type of documents | [Link](https:\u002F\u002Fgithub.com\u002Fquivrhq\u002Fmegaparse) |\n| ExtractThinker (Document) | Document Intelligence library for LLMs | [Link](https:\u002F\u002Fgithub.com\u002Fenoch3712\u002FExtractThinker) |\n\n\u003Cp align = \"center\"> \u003Cb> 🔵Vector Database🔵 \u003C\u002Fb> \u003C\u002Fp>\n\n| Library | Description | Link |\n|---------|-------------|------|\n| SQLite-Vec | A vector search SQLite extension that runs anywhere! | [Link](https:\u002F\u002Fgithub.com\u002Fasg017\u002Fsqlite-vec) |\n| FAISS | A library for efficient similarity search and clustering of dense vectors. | [Link](https:\u002F\u002Fgithub.com\u002Ffacebookresearch\u002Ffaiss) |\n| PGVector | Open-source vector similarity search for Postgres | [Link](https:\u002F\u002Fgithub.com\u002Fpgvector\u002Fpgvector) |\n| Chroma | The AI-native open-source embedding database. The fastest way to build Python or JavaScript LLM apps with memory! | [Link](https:\u002F\u002Fgithub.com\u002Fchroma-core\u002Fchroma) |\n| Qdrant | High-performance, massive-scale Vector Database and Vector Search Engine for the next generation of AI. | [Link](https:\u002F\u002Fgithub.com\u002Fqdrant\u002Fqdrant) |\n| Pincone | The vector database for machine learning applications. | [Link](https:\u002F\u002Fgithub.com\u002Fpinecone-io) |\n| Weaviate | Weaviate is a cloud-native, open source vector database that is robust, fast, and scalable. | [Link](https:\u002F\u002Fgithub.com\u002Fweaviate\u002Fweaviate) |\n| Milvus | Milvus is a high-performance, cloud-native vector database built for scalable vector ANN search | [Link](https:\u002F\u002Fgithub.com\u002Fmilvus-io\u002Fmilvus) |\n\n\u003Cp align = \"center\"> \u003Cb> 🟣Chunking🟣 \u003C\u002Fb> \u003C\u002Fp>\n\n| Library | Description | Link |\n|---------|-------------|------|\n| Chonkie | RAG chunking library that is lightweight, lightning-fast, and easy to use. The no-nonsense RAG chunking library. This library supports seven different chunking strategies. | [Link](https:\u002F\u002Fgithub.com\u002Fchonkie-ai\u002Fchonkie) |\n\n\u003Cp align = \"center\"> \u003Cb> 🟤Rerankers🟤 \u003C\u002Fb> \u003C\u002Fp>\n\n| Library | Description | Link |\n|---------|-------------|------|\n| Rerankers | A lightweight, low-dependency, unified API to use all common reranking and cross-encoder models. Any new reranking models can be added with very little knowledge of the codebase. | [Link](https:\u002F\u002Fgithub.com\u002FAnswerDotAI\u002Frerankers) |\n\n\u003Cp align = \"center\"> \u003Cb> 🟠Agentic RAG🟠 \u003C\u002Fb> \u003C\u002Fp>\n\n| Library | Description | Link |\n|---------|-------------|------|\n| CrewAI | Framework for orchestrating role-playing, autonomous AI agents. | [Link](https:\u002F\u002Fgithub.com\u002FcrewAIInc\u002FcrewAI) |\n| Agno | Build AI Agents with memory, knowledge, tools and reasoning. Chat with them using a beautiful Agent UI. | [Link](https:\u002F\u002Fgithub.com\u002Fagno-agi\u002Fagno) |\n| LangGraph | Build resilient language agents as graphs. | [Link](https:\u002F\u002Fgithub.com\u002Flangchain-ai\u002Flanggraph) |\n| AutoGen | An open-source framework for building AI agent systems. | [Link](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fautogen) |\n| R2R | Agentic Retrieval-Augmented Generation (RAG) with a RESTful API. R2R offers multimodal content ingestion, hybrid search functionality, knowledge graphs, and comprehensive user and document management.| [Link](https:\u002F\u002Fgithub.com\u002FSciPhi-AI\u002FR2R) |\n| Vectara | Build Agentic RAG applications. | [Link](https:\u002F\u002Fvectara.github.io\u002Fpy-vectara-agentic\u002Flatest\u002F) |\n\n\u003Cp align = \"center\"> \u003Cb> 🟢Graph RAG🟢 \u003C\u002Fb> \u003C\u002Fp>\n\n| Library | Description | Link |\n|---------|-------------|------|\n| GraphRAG | A modular graph-based Retrieval-Augmented Generation (RAG) system. | [Link](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fgraphrag) |\n| Nano GraphRAG | A simple, easy-to-hack GraphRAG implementation. | [Link](https:\u002F\u002Fgithub.com\u002Fgusye1234\u002Fnano-graphrag) |\n| FastGraph RAG | Streamlined and promptable Fast GraphRAG framework designed for interpretable, high-precision, agent-driven retrieval workflows. | [Link](https:\u002F\u002Fgithub.com\u002Fcirclemind-ai\u002Ffast-graphrag) |\n\n\u003Cp align = \"center\"> \u003Cb> 🔴Evaluation🔴 \u003C\u002Fb> \u003C\u002Fp>\n\n| Library | Description | Link |\n|---------|-------------|------|\n| RAGChecker | A Fine-grained Framework For Diagnosing RAG. | [Link](https:\u002F\u002Fgithub.com\u002Famazon-science\u002FRAGChecker) |\n| BeyondLLM | Beyond LLM offers an all-in-one toolkit for experimentation, evaluation, and deployment of Retrieval-Augmented Generation (RAG) systems | [Link](https:\u002F\u002Fgithub.com\u002Faiplanethub\u002Fbeyondllm) |\n| RAGAS | Ragas is your ultimate toolkit for evaluating and optimizing Large Language Model (LLM) applications. | [Link](https:\u002F\u002Fgithub.com\u002Fexplodinggradients\u002Fragas) |\n| Giskard | Open-Source Evaluation & Testing for ML & LLM systems. | [Link](https:\u002F\u002Fgithub.com\u002FGiskard-AI\u002Fgiskard) |\n| DeepEval | The LLM (RAG) Evaluation Framework. | [Link](https:\u002F\u002Fgithub.com\u002Fconfident-ai\u002Fdeepeval) |\n\n## RAG Survey Papers\n\n| Paper | Category | Link |\n|--------------------------------|------------------|------|\n| Retrieval-Augmented Generation for Large Language Models: A Survey | General | [Link](https:\u002F\u002Farxiv.org\u002Fabs\u002F2312.10997) |\n| Retrieval-Augmented Generation for Natural Language Processing: A Survey | General | [Link](https:\u002F\u002Farxiv.org\u002Fabs\u002F2407.13193) |\n| A Comprehensive Survey of Retrieval-Augmented Generation (RAG): Evolution, Current Landscape and Future Directions | General | [Link](https:\u002F\u002Farxiv.org\u002Fabs\u002F2410.12837) |\n| Retrieval-Augmented Generation for AI-Generated Content: A Survey | General | [Link](https:\u002F\u002Farxiv.org\u002Fabs\u002F2402.19473) |\n| A Survey on RAG Meeting LLMs: Towards Retrieval-Augmented Large Language Models | General | [Link](https:\u002F\u002Farxiv.org\u002Fabs\u002F2405.06211) |\n| A Survey on Retrieval-Augmented Text Generation for Large Language Models | General | [Link](https:\u002F\u002Farxiv.org\u002Fabs\u002F2404.10981) |\n| Retrieval Augmented Generation (RAG) and Beyond: A Comprehensive Survey on How to Make your LLMs use External Data More Wisely | General | [Link](https:\u002F\u002Farxiv.org\u002Fabs\u002F2409.14924) |\n| Graph Retrieval-Augmented Generation: A Survey | Graph RAG | [Link](https:\u002F\u002Farxiv.org\u002Fabs\u002F2408.08921) |\n| Agentic Retrieval-Augmented Generation: A Survey on Agentic RAG | Agentic RAG | [Link](https:\u002F\u002Farxiv.org\u002Fabs\u002F2501.09136) |\n| Evaluation of Retrieval-Augmented Generation: A Survey | Evaluation | [Link](https:\u002F\u002Farxiv.org\u002Fabs\u002F2405.07437) |\n| Searching for Best Practices in Retrieval-Augmented Generation | RAG Best Practices | [Link](https:\u002F\u002Farxiv.org\u002Fabs\u002F2407.01219) |\n\n\n\n\n","\u003Ch1 align =\"center\"> 👩🏼‍💻 RAG 从零到英雄指南 \u003C\u002Fh1>\n本仓库旨在提供一份全面的指南，帮助您从基础到进阶学习 RAG。\n\u003Cp align=\"center\">\n  \u003Ca href=\"https:\u002F\u002Fwww.linkedin.com\u002Fin\u002Fkalyanksnlp\u002F\">\n    \u003Cimg src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FKalyanKS-NLP_rag-zero-to-hero-guide_readme_e4c42d093d16.png\" alt=\"LinkedIn\">\n  \u003C\u002Fa>\n  \u003Ca href=\"https:\u002F\u002Fx.com\u002Fkalyan_kpl\">\n    \u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FKalyan%20KS-%23000000.svg?logo=X&logoColor=white\" alt=\"Twitter\">\n  \u003C\u002Fa>\n   \u003Ca href=\"https:\u002F\u002Fwww.youtube.com\u002F@kalyanksnlp\">\n    \u003Cimg src=\"https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FKalyan%20KS-%23FF0000.svg?logo=YouTube&logoColor=white\" alt=\"Twitter\">\n  \u003C\u002Fa>\n\t\n\u003C\u002Fp>\n\n## 快速链接\n||||\n|---|---|---|\n| [🧱 RAG 基础课程](#rag-basics-course) | [🚀 RAG 工具包](#rag-toolkit) | [🩸 RAG 综述论文](#rag-survey-papers) | \n| [✅ RAG 评估课程](#rag-evaluation-course) | | |\n\n## RAG 基础课程\n| 主题 | 描述 | 链接 |\n|---------|-------------|------|\n| 什么是 RAG？ | 通过一个简单示例解释 RAG。  | [链接](RAG%20Basics\u002FWhat_is_RAG.md)|\n| 为什么需要 RAG？ | 解释 LLM 的缺点以及 RAG 如何解决这些问题。|  [链接](RAG%20Basics\u002FWhy_RAG.md)|\n| RAG 是如何工作的？ | 详细说明 RAG 的各个步骤——索引、检索、增强和生成。|  [链接](RAG%20Basics\u002FHow_does_RAG_work.md)|\n| RAG 的优势与挑战 | 讨论 RAG 的优势和挑战。 |  [链接](RAG%20Basics\u002FRAG_Benefits_and_Challenges.md)|\n| RAG 必备术语 | RAG 相关必备术语的定义。 |  [链接](RAG%20Basics\u002FRAG_must_know_terms.md)|\n| RAG 学习路线图 | 从基础到进阶学习 RAG 的详细路线图。 |  [链接](RAG%20Basics\u002FRAG_Roadmap.md)|\n| RAG 开发者技术栈 | 涵盖构建 RAG 系统所使用的各种库。 | [链接](RAG%20Basics\u002FRAG_Developer_Stack.md)|\n| 从零开始实现 RAG | 不使用任何框架，从头开始实现 RAG。 | [链接](RAG%20Basics\u002Fnotebooks\u002FRAG_from_Scratch.ipynb)\n| 使用 LangChain 实现 RAG | 使用 LangChain 框架实现 RAG。 | [链接](RAG%20Basics\u002Fnotebooks\u002FRAG_with_LangChain.ipynb)\n| 网站 RAG | 使用 LangChain 框架实现针对网站内容的 RAG。 | [链接](RAG%20Basics\u002Fnotebooks\u002FWeb_Page_RAG.ipynb)\n| YouTube 视频 RAG | 使用 LangChain 框架实现基于 YouTube 视频字幕的 RAG。 | [链接](RAG%20Basics\u002Fnotebooks\u002FYouTube_Video_RAG.ipynb)\n| 代理式 RAG | 使用 CrewAI 框架实现的代理式 RAG 系统。 | [链接](RAG%20Basics\u002Fnotebooks\u002FAgenticRAG_with_CrewAI.ipynb)\n\n## RAG 评估课程\n| 主题 | 描述 | 链接 |\n|---------|-------------|------|\n| RAG 评估指标简介 | RAG 评估指标的简要概述  | [链接](RAG%20Evaluation\u002Frag_eval_intro.md) | \n| RAG 检索器评估指标 | 详细解释 RAG 检索器的评估指标  | [链接](RAG%20Evaluation\u002Frag_retriever_metrics.md) | \n| RAG 生成器评估指标 | 详细解释 RAG 生成器的评估指标 | [链接](RAG%20Evaluation\u002Frag_generator_metrics.md) |\n| 使用 RAGAS 进行 RAG 评估 | 使用 RAGAS 库实现 RAG 评估指标 | [链接](RAG%20Evaluation\u002Fnotebooks\u002FRAG_Evaluation_using_RAGAS.ipynb) |\n| 使用 DeepEval 进行 RAG 评估 | 使用 DeepEval 库实现 RAG 评估指标 | [链接](RAG%20Evaluation\u002Fnotebooks\u002FRAG_Evaluation_using_DeepEval.ipynb) |\n| 检测 RAG 中的幻觉 | 使用 LLM 和 LettuceDetect 库检测 RAG 中的幻觉 | [链接](RAG%20Evaluation\u002Fnotebooks\u002FHallucination_RAG.ipynb) |\n\n\n## RAG 工具包\n\n\u003Cp align = \"center\"> \u003Cb> 🔴框架🔴 \u003C\u002Fb> \u003C\u002Fp>\n\n| 库 | 描述 | 链接 |\n|---------|-------------|------|\n| LangChain | LangChain 是一个用于开发由大型语言模型（LLM）驱动的应用程序的框架。 | [链接](https:\u002F\u002Fgithub.com\u002Flangchain-ai\u002Flangchain) |\n| Llama Index | LlamaIndex 是一个适用于 LLM 应用程序的数据框架 | [链接](https:\u002F\u002Fgithub.com\u002Frun-llama\u002Fllama_index) |\n| Haystack | Haystack 是一个端到端的 LLM 框架，允许您构建由 LLM、Transformer 模型、向量搜索等技术驱动的应用程序。 | [链接](https:\u002F\u002Fgithub.com\u002Fdeepset-ai\u002Fhaystack) |\n| fastRAG | 一个用于高效且优化的检索增强生成流水线的研究框架，结合了最先进的 LLM 和信息检索技术。 | [链接](https:\u002F\u002Fgithub.com\u002FIntelLabs\u002FfastRAG) |\n| Llmware | 一个用于构建企业级 RAG 流水线的统一框架，采用小型专用模型 | [链接](https:\u002F\u002Fgithub.com\u002Fllmware-ai\u002Fllmware) |\n\n\u003Cp align = \"center\"> \u003Cb> 🟠研究🟠 \u003C\u002Fb> \u003C\u002Fp>\n\n| 库 | 描述 | 链接 |\n|---------|-------------|------|\n| FlashRAG | 一个用于高效 RAG 研究的 Python 工具箱。该工具箱包含 36 个预处理过的基准 RAG 数据集和 16 种最先进的 RAG 算法。 | [链接](https:\u002F\u002Fgithub.com\u002FRUC-NLPIR\u002FFlashRAG) |\n\n\u003Cp align = \"center\"> \u003Cb> 🟡数据提取 - 网页爬取🟡 \u003C\u002Fb> \u003C\u002Fp>\n\n| 库 | 描述 | 链接 |\n|---------|-------------|------|\n| Crawl4AI（网页爬取） | 一款开源的、对 LLM 友好的网络爬虫和抓取工具 | [链接](https:\u002F\u002Fgithub.com\u002Funclecode\u002Fcrawl4ai) |\n| ScrapeGraphAI（网页及文档） | 一种利用 LLM 和直接图逻辑构建网页及本地文档（XML、HTML、JSON、Markdown 等）抓取管道的 Python 爬虫库。 | [链接](https:\u002F\u002Fgithub.com\u002FScrapeGraphAI\u002FScrapegraph-ai) |\n| Crawlee（网页爬取） | 一个用于网页爬取和浏览器自动化的库 | [链接](https:\u002F\u002Fgithub.com\u002Fapify\u002Fcrawlee-python) |\n\n\u003Cp align = \"center\"> \u003Cb> 🟢数据提取 - 文档🟢 \u003C\u002Fb> \u003C\u002Fp>\n\n| 库 | 描述 | 链接 |\n|---------|-------------|------|\n| Docling（文档） | Docling 能够轻松快速地解析文档并将其导出为所需格式。 | [链接](https:\u002F\u002Fgithub.com\u002Fdocling-project\u002Fdocling) |\n| Llama Parse（文档） | 一种原生支持 GenAI 的文档解析器，能够为下游任何 LLM 场景（如 RAG、智能体）解析复杂的文档数据。 | [链接](https:\u002F\u002Fgithub.com\u002Frun-llama\u002Fllama_cloud_services) |\n| PyMuPDF4LLM（文档） | PyMuPDF4LLM 库使您更容易以 LLM 和 RAG 环境所需的格式提取 PDF 内容。 | [链接](https:\u002F\u002Fpymupdf.readthedocs.io\u002Fen\u002Flatest\u002Fpymupdf4llm\u002F) |\n| MegaParse（文档） | 一种适用于各类文档的解析器 | [链接](https:\u002F\u002Fgithub.com\u002Fquivrhq\u002Fmegaparse) |\n| ExtractThinker（文档） | 一个专为 LLM 设计的文档智能库 | [链接](https:\u002F\u002Fgithub.com\u002Fenoch3712\u002FExtractThinker) |\n\n\u003Cp align = \"center\"> \u003Cb> 🔵向量数据库🔵 \u003C\u002Fb> \u003C\u002Fp>\n\n| 库 | 描述 | 链接 |\n|---------|-------------|------|\n| SQLite-Vec | 一个可在任何地方运行的向量搜索 SQLite 扩展！ | [链接](https:\u002F\u002Fgithub.com\u002Fasg017\u002Fsqlite-vec) |\n| FAISS | 用于高效相似性搜索和稠密向量聚类的库。 | [链接](https:\u002F\u002Fgithub.com\u002Ffacebookresearch\u002Ffaiss) |\n| PGVector | 面向 Postgres 的开源向量相似性搜索 | [链接](https:\u002F\u002Fgithub.com\u002Fpgvector\u002Fpgvector) |\n| Chroma | 原生支持 AI 的开源嵌入数据库。使用内存构建 Python 或 JavaScript LLM 应用程序的最快方式！ | [链接](https:\u002F\u002Fgithub.com\u002Fchroma-core\u002Fchroma) |\n| Qdrant | 面向下一代 AI 的高性能、大规模向量数据库和向量搜索引擎。 | [链接](https:\u002F\u002Fgithub.com\u002Fqdrant\u002Fqdrant) |\n| Pincone | 用于机器学习应用的向量数据库。 | [链接](https:\u002F\u002Fgithub.com\u002Fpinecone-io) |\n| Weaviate | Weaviate 是一款云原生、开源的向量数据库，功能强大、速度快且可扩展。 | [链接](https:\u002F\u002Fgithub.com\u002Fweaviate\u002Fweaviate) |\n| Milvus | Milvus 是一款为可扩展向量近似最近邻搜索而构建的高性能、云原生向量数据库 | [链接](https:\u002F\u002Fgithub.com\u002Fmilvus-io\u002Fmilvus) |\n\n\u003Cp align = \"center\"> \u003Cb> 🟣分块🟣 \u003C\u002Fb> \u003C\u002Fp>\n\n| 库 | 描述 | 链接 |\n|---------|-------------|------|\n| Chonkie | 一种轻量级、闪电般快速且易于使用的 RAG 分块库。毫不拖泥带水的 RAG 分块库。该库支持七种不同的分块策略。 | [链接](https:\u002F\u002Fgithub.com\u002Fchonkie-ai\u002Fchonkie) |\n\n\u003Cp align = \"center\"> \u003Cb> 🟤重排序器🟤 \u003C\u002Fb> \u003C\u002Fp>\n\n| 库 | 描述 | 链接 |\n|---------|-------------|------|\n| Rerankers | 一个轻量级、低依赖性的统一 API，可用于所有常见的重排序和交叉编码器模型。只需很少的代码库知识，即可添加任何新的重排序模型。 | [链接](https:\u002F\u002Fgithub.com\u002FAnswerDotAI\u002Frerankers) |\n\n\u003Cp align = \"center\"> \u003Cb> 🟠代理式 RAG🟠 \u003C\u002Fb> \u003C\u002Fp>\n\n| 库 | 描述 | 链接 |\n|---------|-------------|------|\n| CrewAI | 用于编排角色扮演、自主 AI 代理的框架。 | [链接](https:\u002F\u002Fgithub.com\u002FcrewAIInc\u002FcrewAI) |\n| Agno | 构建具有记忆、知识、工具和推理能力的 AI 代理。可通过精美的代理 UI 与它们对话。 | [链接](https:\u002F\u002Fgithub.com\u002Fagno-agi\u002Fagno) |\n| LangGraph | 将稳健的语言代理构建为图结构。 | [链接](https:\u002F\u002Fgithub.com\u002Flangchain-ai\u002Flanggraph) |\n| AutoGen | 一个用于构建 AI 代理系统的开源框架。 | [链接](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fautogen) |\n| R2R | 具有 RESTful API 的代理式检索增强生成 (RAG)。R2R 提供多模态内容摄取、混合搜索功能、知识图谱以及全面的用户和文档管理。 | [链接](https:\u002F\u002Fgithub.com\u002FSciPhi-AI\u002FR2R) |\n| Vectara | 构建代理式 RAG 应用程序。 | [链接](https:\u002F\u002Fvectara.github.io\u002Fpy-vectara-agentic\u002Flatest\u002F) |\n\n\u003Cp align = \"center\"> \u003Cb> 🟢图式 RAG🟢 \u003C\u002Fb> \u003C\u002Fp>\n\n| 库 | 描述 | 链接 |\n|---------|-------------|------|\n| GraphRAG | 一个模块化的基于图的检索增强生成 (RAG) 系统。 | [链接](https:\u002F\u002Fgithub.com\u002Fmicrosoft\u002Fgraphrag) |\n| Nano GraphRAG | 一个简单易用、便于修改的 GraphRAG 实现。 | [链接](https:\u002F\u002Fgithub.com\u002Fgusye1234\u002Fnano-graphrag) |\n| FastGraph RAG | 简化且可提示的 Fast GraphRAG 框架，专为可解释、高精度的代理驱动型检索工作流设计。 | [链接](https:\u002F\u002Fgithub.com\u002Fcirclemind-ai\u002Ffast-graphrag) |\n\n\u003Cp align = \"center\"> \u003Cb> 🔴评估🔴 \u003C\u002Fb> \u003C\u002Fp>\n\n| 库 | 描述 | 链接 |\n|---------|-------------|------|\n| RAGChecker | 用于诊断 RAG 的细粒度框架。 | [链接](https:\u002F\u002Fgithub.com\u002Famazon-science\u002FRAGChecker) |\n| BeyondLLM | Beyond LLM 提供了一套一体化工具，用于检索增强生成 (RAG) 系统的实验、评估和部署 | [链接](https:\u002F\u002Fgithub.com\u002Faiplanethub\u002Fbeyondllm) |\n| RAGAS | Ragas 是您评估和优化大型语言模型 (LLM) 应用程序的终极工具包。 | [链接](https:\u002F\u002Fgithub.com\u002Fexplodinggradients\u002Fragas) |\n| Giskard | 面向 ML 和 LLM 系统的开源评估与测试工具。 | [链接](https:\u002F\u002Fgithub.com\u002FGiskard-AI\u002Fgiskard) |\n| DeepEval | LLM（RAG）评估框架。 | [链接](https:\u002F\u002Fgithub.com\u002Fconfident-ai\u002Fdeepeval) |\n\n## RAG 综述论文\n\n| 论文 | 类别 | 链接 |\n|--------------------------------|------------------|------|\n| 大型语言模型的检索增强生成：综述 | 通用 | [链接](https:\u002F\u002Farxiv.org\u002Fabs\u002F2312.10997) |\n| 自然语言处理中的检索增强生成：综述 | 通用 | [链接](https:\u002F\u002Farxiv.org\u002Fabs\u002F2407.13193) |\n| 检索增强生成 (RAG) 的综合综述：演变、现状与未来方向 | 通用 | [链接](https:\u002F\u002Farxiv.org\u002Fabs\u002F2410.12837) |\n| 人工智能生成内容的检索增强生成：综述 | 通用 | [链接](https:\u002F\u002Farxiv.org\u002Fabs\u002F2402.19473) |\n| RAG 与 LLM 的融合：迈向检索增强型大型语言模型 | 通用 | [链接](https:\u002F\u002Farxiv.org\u002Fabs\u002F2405.06211) |\n| 面向大型语言模型的检索增强文本生成综述 | 通用 | [链接](https:\u002F\u002Farxiv.org\u002Fabs\u002F2404.10981) |\n| 检索增强生成 (RAG) 及其超越：如何更明智地让您的 LLM 使用外部数据的综合综述 | 通用 | [链接](https:\u002F\u002Farxiv.org\u002Fabs\u002F2409.14924) |\n| 图式检索增强生成：综述 | 图式 RAG | [链接](https:\u002F\u002Farxiv.org\u002Fabs\u002F2408.08921) |\n| 代理式检索增强生成：关于代理式 RAG 的综述 | 代理式 RAG | [链接](https:\u002F\u002Farxiv.org\u002Fabs\u002F2501.09136) |\n| 检索增强生成的评估：综述 | 评估 | [链接](https:\u002F\u002Farxiv.org\u002Fabs\u002F2405.07437) |\n| 检索增强生成最佳实践探索 | RAG 最佳实践 | [链接](https:\u002F\u002Farxiv.org\u002Fabs\u002F2407.01219) |","# RAG Zero to Hero Guide 快速上手指南\n\n本指南基于 `rag-zero-to-hero-guide` 开源项目整理，旨在帮助开发者从零开始掌握检索增强生成（RAG）技术。该项目主要提供学习路径、教程笔记和工具清单，而非单一的 Python 包。以下是基于其核心内容的快速入门流程。\n\n## 环境准备\n\n在开始之前，请确保您的开发环境满足以下要求：\n\n*   **操作系统**：Linux, macOS 或 Windows (推荐 WSL2)\n*   **Python 版本**：Python 3.9 或更高版本\n*   **前置依赖**：\n    *   `pip` (Python 包管理工具)\n    *   `git` (用于克隆仓库)\n    *   API Key：准备 OpenAI API Key 或其他兼容的大模型 API Key（如 Azure OpenAI, Local LLM 等）\n\n> **国内加速建议**：\n> 推荐使用国内镜像源安装 Python 依赖，以提升下载速度：\n> ```bash\n> export PIP_INDEX_URL=https:\u002F\u002Fpypi.tuna.tsinghua.edu.cn\u002Fsimple\n> ```\n\n## 安装步骤\n\n由于本项目是一个包含教程代码和笔记的资源库，首先需要克隆仓库并安装基础运行依赖。\n\n1.  **克隆项目仓库**\n    ```bash\n    git clone https:\u002F\u002Fgithub.com\u002Fkalyan-kpl\u002Frag-zero-to-hero-guide.git\n    cd rag-zero-to-hero-guide\n    ```\n\n2.  **创建虚拟环境（推荐）**\n    ```bash\n    python -m venv venv\n    source venv\u002Fbin\u002Factivate  # Windows 用户请使用: venv\\Scripts\\activate\n    ```\n\n3.  **安装核心框架依赖**\n    根据教程路线，最基础的实现需要 `LangChain` 及其相关生态。执行以下命令安装核心组件：\n    ```bash\n    pip install langchain langchain-community langchain-openai faiss-cpu tiktoken\n    ```\n    \n    *若需运行特定进阶教程（如 Agentic RAG），可能还需额外安装：*\n    ```bash\n    # 用于智能体教程\n    pip install crewai\n    \n    # 用于评估教程\n    pip install ragas deepeval\n    ```\n\n## 基本使用\n\n本项目提供了从“零代码实现”到“框架实现”的多种路径。以下是最简单的 **LangChain 基础 RAG** 使用示例，对应仓库中 `RAG Basics\u002Fnotebooks\u002FRAG_with_LangChain.ipynb` 的核心逻辑。\n\n### 1. 配置环境变量\n在终端中设置您的 API Key：\n```bash\nexport OPENAI_API_KEY=\"your-api-key-here\"\n```\n\n### 2. 运行最小化 RAG 流程\n创建一个名为 `simple_rag.py` 的文件，写入以下代码。该示例演示了文档加载、切片、向量化、检索及生成的完整闭环。\n\n```python\nfrom langchain.document_loaders import TextLoader\nfrom langchain.text_splitter import CharacterTextSplitter\nfrom langchain.embeddings import OpenAIEmbeddings\nfrom langchain.vectorstores import FAISS\nfrom langchain.chat_models import ChatOpenAI\nfrom langchain.chains import RetrievalQA\n\n# 1. 准备数据 (此处创建一个临时文本文件作为示例)\nwith open(\"sample_doc.txt\", \"w\", encoding=\"utf-8\") as f:\n    f.write(\"RAG (Retrieval-Augmented Generation) 是一种结合检索和生成的 AI 技术。\\n\")\n    f.write(\"它通过从外部知识库检索相关信息来增强大语言模型的回答能力。\\n\")\n    f.write(\"RAG 能有效减少大模型的幻觉问题，并提供最新的领域知识。\")\n\n# 2. 加载文档\nloader = TextLoader(\"sample_doc.txt\", encoding=\"utf-8\")\ndocuments = loader.load()\n\n# 3. 文本切片\ntext_splitter = CharacterTextSplitter(chunk_size=100, chunk_overlap=0)\ntexts = text_splitter.split_documents(documents)\n\n# 4. 初始化嵌入模型并构建向量库\nembeddings = OpenAIEmbeddings()\ndb = FAISS.from_documents(texts, embeddings)\n\n# 5. 初始化大语言模型\nllm = ChatOpenAI(model_name=\"gpt-3.5-turbo\", temperature=0)\n\n# 6. 构建检索问答链\nqa_chain = RetrievalQA.from_chain_type(\n    llm=llm,\n    chain_type=\"stuff\",\n    retriever=db.as_retriever()\n)\n\n# 7. 执行查询\nquery = \"RAG 的主要优势是什么？\"\nresult = qa_chain.run(query)\n\nprint(f\"问题：{query}\")\nprint(f\"回答：{result}\")\n```\n\n### 3. 运行脚本\n```bash\npython simple_rag.py\n```\n\n### 下一步学习\n完成上述基础示例后，建议按照项目目录结构深入探索：\n*   **原理深入**：阅读 `RAG Basics` 目录下的 Markdown 文档，理解 Indexing, Retrieval, Augmentation 等核心概念。\n*   **场景扩展**：参考 `notebooks` 目录中的 `Web_Page_RAG.ipynb` (网页 RAG) 或 `YouTube_Video_RAG.ipynb` (视频转录 RAG)。\n*   **系统评估**：使用 `RAG Evaluation` 章节提供的 `RAGAS` 或 `DeepEval` 笔记，学习如何量化评估您的 RAG 系统性能。","某初创公司的后端工程师小李，接到任务要在两周内为公司内部知识库构建一个能准确回答员工关于技术文档和会议记录提问的智能问答系统。\n\n### 没有 rag-zero-to-hero-guide 时\n- **概念模糊导致选型困难**：面对 LangChain、LlamaIndex 等众多框架，因不理解 RAG 的索引、检索、增强等核心步骤，花费数天试错仍无法确定技术路线。\n- **从零实现陷阱多**：尝试手动编写代码构建基础 RAG 时，在数据清洗和向量匹配环节频繁报错，缺乏从 Scratch 实现的参考范例，进度严重滞后。\n- **效果评估无标准**：系统上线后出现“胡言乱语”（幻觉）现象，但不知道如何使用专业指标量化检索质量或生成准确度，只能凭感觉盲目调优。\n- **高级场景束手无策**：当业务方提出需要解析 YouTube 培训视频或特定网页内容时，因缺乏针对非结构化数据的处理案例，功能开发陷入停滞。\n\n### 使用 rag-zero-to-hero-guide 后\n- **路径清晰快速上手**：通过\"RAG 路线图”和“必知术语”章节，迅速理清了从基础原理到高级架构的学习路径，当天就锁定了适合的技术栈。\n- **代码复用效率倍增**：直接参考\"RAG from Scratch\"和\"LangChain 实战”中的 Notebook 代码，复用了成熟的数据处理流水线，将核心功能开发时间缩短至 3 天。\n- **科学评估精准调优**：利用指南中关于 RAGAS 和 DeepEval 的评估教程，建立了包含幻觉检测在内的自动化评估体系，快速定位并修复了检索不准的问题。\n- **复杂需求轻松落地**：依据\"YouTube 视频 RAG\"和\"Agentic RAG\"的具体案例，顺利扩展了系统能力，实现了对多媒体内容和多步推理任务的支持。\n\nrag-zero-to-hero-guide 将原本需要数月摸索的 RAG 学习曲线压缩为几周的高效实战，帮助开发者从理论迷茫快速走向生产级应用落地。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FKalyanKS-NLP_rag-zero-to-hero-guide_2325a02e.png","KalyanKS-NLP","Kalyan KS","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002FKalyanKS-NLP_ce1c9d8b.jpg","NLP Consultant & Researcher ||  7+ years of research experience with 1000+ citations ",null,"kalyan_kpl","https:\u002F\u002Fgithub.com\u002FKalyanKS-NLP",[80],{"name":81,"color":82,"percentage":83},"Jupyter Notebook","#DA5B0B",100,1293,325,"2026-04-02T17:04:06","Apache-2.0",1,"","未说明",{"notes":92,"python":90,"dependencies":93},"该项目主要是一个学习指南和资源列表（包含教程文档和示例 Notebook），而非单一的独立软件包。因此 README 中未提供统一的系统环境、硬件或 Python 版本要求。具体的运行需求取决于用户选择运行的特定示例（如 LangChain 或 CrewAI 脚本）以及所选用的底层大模型和向量数据库。建议参考各个子项目（如 notebooks 文件夹中的具体代码）的头部注释或单独的安装说明来确定具体依赖。",[94,95,96,97,98,99,100,101,102,103],"LangChain","Llama Index","CrewAI","RAGAS","DeepEval","FAISS","Chroma","Qdrant","PyMuPDF4LLM","FlashRAG",[35,14,105],"其他",[107,108,109,110,111,112,113],"ai-engineer","generative-ai","large-language-models","llm-engineer","llm-rag","llms","retrieval-augmented-generation","2026-03-27T02:49:30.150509","2026-04-07T04:11:24.039756",[],[]]