AutoRAG
AutoRAG 是一款专为检索增强生成(RAG)技术打造的开源自动化工具,旨在帮助用户快速找到最适合其特定数据和业务场景的 RAG 流程。在当前的 AI 应用中,面对琳琅满目的 RAG 模块与组合方案,开发者往往难以判断哪种配置在自己的数据上表现最佳,而手动构建并逐一评估所有可能性不仅耗时费力,门槛也极高。
AutoRAG 通过引入类似 AutoML 的自动化机制,完美解决了这一痛点。它允许用户利用自有评估数据,自动测试多种 RAG 模块组合,智能筛选出最优 pipeline,从而大幅降低试错成本。该工具特别适合 AI 开发者、研究人员以及希望优化大模型应用效果的技术团队使用。
其核心技术亮点在于提供了一套完整的闭环工作流:从数据解析、分块到问答对生成,再到基于 YAML 配置的自动化评估与可视化仪表盘监控,甚至支持一键部署最优方案。此外,AutoRAG 还兼容 Hugging Face Space 和 Google Colab,提供了丰富的教程与预置空间,让用户能够轻松上手,无需从零开始搭建复杂的评估体系,真正实现高效、精准的 RAG 系统优化。
使用场景
某电商公司的算法团队正致力于构建一个智能客服系统,需要让 AI 基于海量商品说明书和售后政策文档,准确回答用户的具体咨询。
没有 AutoRAG 时
- 盲目试错成本高:面对数十种检索器、分块策略和生成模型的组合,工程师只能凭经验手动搭建并逐一测试,耗时数周仍难确定最佳方案。
- 评估标准不统一:缺乏自动化的评估框架,不同 pipeline 的效果对比依赖人工抽检,主观性强且难以量化“哪个更适合自家数据”。
- 优化迭代缓慢:一旦业务数据更新或场景微调,重新调整参数和模块需要重复大量机械性工作,导致模型上线周期被严重拉长。
- 资源浪费严重:为了追求效果,往往默认堆砌高性能大模型和复杂检索逻辑,却忽略了针对特定数据集的轻量化最优解。
使用 AutoRAG 后
- 自动化寻优:AutoRAG 像 AutoML 一样自动遍历多种 RAG 模块组合,利用专属评估数据在几小时内即可锁定针对该电商数据的最佳 Pipeline。
- 量化决策依据:内置多维度的自动评估指标,直观展示不同配置下的准确率与召回率,让技术选型从“拍脑袋”变为“看数据”。
- 敏捷迭代部署:当新增促销规则文档时,只需重新运行配置,AutoRAG 能快速验证并输出新的最优策略,大幅缩短模型更新周期。
- 性价比最大化:通过自动搜索,发现了一套在保持高回答质量的同时,计算资源消耗更低的轻量级组合,显著降低了推理成本。
AutoRAG 将原本繁琐的 RAG 调优过程转化为自动化的数据驱动决策,帮助团队以最低成本快速落地最适合自身业务的最优检索增强生成方案。
运行环境要求
- 未说明
- 非必需
- 仅在运行本地模型(local models)时需要安装 GPU 版本(AutoRAG[gpu]),具体显卡型号、显存大小及 CUDA 版本未在文档中明确指定
未说明

快速开始
AutoRAG
一款用于自动为您的数据寻找最优 RAG 流程的 RAG 自动机器学习工具。

市面上有许多 RAG 流程和模块,但您并不清楚哪种流程最适合“您自己的数据”和“您的应用场景”。手动尝试并评估所有 RAG 模块既耗时又困难。然而,如果不进行这样的尝试,您将永远无法确定哪种 RAG 流程最符合您的实际需求。
AutoRAG 是一款专为“您的数据”寻找最优 RAG 流程的工具。您可以使用自己的评估数据自动评估多种 RAG 模块组合,并找到最适合您应用场景的 RAG 流程。
AutoRAG 提供了一种简单的方式来评估大量的 RAG 模块组合。立即试用,找到最适合您应用场景的 RAG 流程。
请查阅我们的 📖 文档!!
YouTube 教程
https://github.com/Marker-Inc-Korea/AutoRAG/assets/96727832/c0d23896-40c0-479f-a17b-aa2ec3183a26
默认静音,请开启声音以收听旁白
您也可以在 YouTube 上观看。
在 HuggingFace Space 中使用 AutoRAG 🚀
Colab 教程
目录
快速安装
我们建议使用 Python 3.10 或更高版本来运行 AutoRAG。
pip install AutoRAG
如果您希望使用本地模型,则需要安装 GPU 版本。
pip install "AutoRAG[gpu]"
或者,如果您只需要解析功能,可以使用解析版本:
pip install "AutoRAG[gpu,parse]"
数据生成


RAG 优化需要两种类型的数据:问答数据集和语料库数据集。
- 问答 数据集文件 (qa.parquet)
- 语料库 数据集文件 (corpus.parquet)
问答 数据集对于准确可靠的评估和优化至关重要。
语料库 数据集则直接关系到 RAG 的性能。这是因为 RAG 会利用语料库检索文档,并基于这些文档生成答案。
📌 支持的数据生成模块

快速入门
1. 解析
设置 YAML 文件
modules:
- module_type: langchain_parse
parse_method: pdfminer
您也可以同时使用多个解析模块。不过,在这种情况下,每次解析结果都需要返回一个新的进程。
开始解析
只需几行代码,即可解析您的原始文档。
from autorag.parser import Parser
parser = Parser(data_path_glob="your/data/path/*")
parser.start_parsing("your/path/to/parse_config.yaml")
2. 分块
设置 YAML 文件
modules:
- module_type: llama_index_chunk
chunk_method: Token
chunk_size: 1024
chunk_overlap: 24
add_file_name: en
您同样可以同时使用多个分块模块。在这种情况下,您需要先用一个语料库创建问答对,再将剩余的语料库映射到问答数据中。如果分块方法不同,检索基准也会有所差异,因此我们需要将其重新映射到问答数据集中。
开始分块
只需几行代码,即可对解析后的结果进行分块。
from autorag.chunker import Chunker
chunker = Chunker.from_parquet(parsed_data_path="your/parsed/data/path")
chunker.start_chunking("your/path/to/chunk_config.yaml")
3. QA 数据集创建
只需几行代码即可创建 QA 数据集。
import pandas as pd
from llama_index.llms.openai import OpenAI
from autorag.data.qa.filter.dontknow import dontknow_filter_rule_based
from autorag.data.qa.generation_gt.llama_index_gen_gt import (
make_basic_gen_gt,
make_concise_gen_gt,
)
from autorag.data.qa.schema import Raw, Corpus
from autorag.data.qa.query.llama_gen_query import factoid_query_gen
from autorag.data.qa.sample import random_single_hop
llm = OpenAI()
raw_df = pd.read_parquet("your/path/to/parsed.parquet")
raw_instance = Raw(raw_df)
corpus_df = pd.read_parquet("your/path/to/corpus.parquet")
corpus_instance = Corpus(corpus_df, raw_instance)
initial_qa = (
corpus_instance.sample(random_single_hop, n=3)
.map(
lambda df: df.reset_index(drop=True),
)
.make_retrieval_gt_contents()
.batch_apply(
factoid_query_gen, # 查询生成
llm=llm,
)
.batch_apply(
make_basic_gen_gt, # 答案生成(基础版)
llm=llm,
)
.batch_apply(
make_concise_gen_gt, # 答案生成(简洁版)
llm=llm,
)
.filter(
dontknow_filter_rule_based, # 过滤“不知道”情况
lang="en",
)
)
initial_qa.to_parquet('./qa.parquet', './corpus.parquet')
RAG 优化


AutoRAG 如何优化 RAG 流程?
以下是仅显示节点的 AutoRAG RAG 结构图。

以下是展示所有节点和模块的图像。


📌 支持 RAG 优化的节点与模块
指标
AutoRAG 中每个节点所使用的指标如下所示。


以下是 AutoRAG 所支持指标的详细信息。
快速入门
1. 设置 YAML 文件
首先,您需要为您的 RAG 优化设置配置 YAML 文件。
我们强烈建议初学者使用预先准备好的配置 YAML 文件。
以下是一个使用三个检索节点、prompt_maker 和 generator 节点的配置 YAML 文件示例。
node_lines:
- node_line_name: retrieve_node_line
nodes:
- node_type: lexical_retrieval
strategy:
metrics: [ retrieval_f1, retrieval_recall, retrieval_ndcg, retrieval_mrr ]
top_k: 3
modules:
- module_type: bm25
- node_type: semantic_retrieval
strategy:
metrics: [ retrieval_f1, retrieval_recall, retrieval_ndcg, retrieval_mrr ]
top_k: 3
modules:
- module_type: vectordb
vectordb: default
- node_type: hybrid_retrieval
strategy:
metrics: [ retrieval_f1, retrieval_recall, retrieval_ndcg, retrieval_mrr ]
top_k: 3
modules:
- module_type: hybrid_rrf
weight_range: (4,80)
- node_line_name: post_retrieve_node_line
nodes:
- node_type: prompt_maker # 设置提示生成器节点
strategy:
metrics: # 设置生成指标
- metric_name: meteor
- metric_name: rouge
- metric_name: sem_score
embedding_model: openai
modules:
- module_type: fstring
prompt: "阅读段落并回答给定的问题。 \n 问题:{query} \n 段落:{retrieved_contents} \n 答案:"
- node_type: generator # 设置生成器节点
strategy:
metrics: # 设置生成指标
- metric_name: meteor
- metric_name: rouge
- metric_name: sem_score
embedding_model: openai
modules:
- module_type: openai_llm
llm: gpt-4o-mini
batch: 16
2. 运行 AutoRAG
只需几行代码即可评估您的 RAG 流程。
from autorag.evaluator import Evaluator
evaluator = Evaluator(qa_data_path='your/path/to/qa.parquet', corpus_data_path='your/path/to/corpus.parquet')
evaluator.start_trial('your/path/to/config.yaml')
或者您也可以使用命令行界面:
autorag evaluate --config your/path/to/default_config.yaml --qa_data_path your/path/to/qa.parquet --corpus_data_path your/path/to/corpus.parquet
运行完成后,您当前目录下会生成多个文件和文件夹。
在以数字命名的试验文件夹中(如 0),您可以查看 summary.csv 文件,其中总结了评估结果以及适合您数据的最佳 RAG 流程。
更多详细信息,请参阅文件夹结构的说明: 这里。
3. 运行仪表板
您可以通过运行仪表板轻松查看结果。
autorag dashboard --trial_dir /your/path/to/trial_dir
示例仪表板

4. 部署您的最佳 RAG 流程
4-1. 直接作为代码运行
您可以直接从试验文件夹中使用最佳的 RAG 流程。试验文件夹是运行仪表板时使用的目录。(如 0、1、2、…)
from autorag.deploy import Runner
runner = Runner.from_trial_folder('/your/path/to/trial_dir')
runner.run('your question')
4-2. 作为 API 服务器运行
您可以将此流水线作为 API 服务器运行。
API 端点请参见此处。
import nest_asyncio
from autorag.deploy import ApiRunner
nest_asyncio.apply()
runner = ApiRunner.from_trial_folder('/your/path/to/trial_dir')
runner.run_api_server()
autorag run_api --trial_dir your/path/to/trial_dir --host 0.0.0.0 --port 8000
该命令行工具使用提取的配置 YAML 文件。如果您想了解更多,请参阅此处。
4-3. 作为 Web 界面运行
您也可以将此流水线作为 Web 界面运行。
Web 界面请参见此处。
autorag run_web --trial_path your/path/to/trial_path
示例 Web 界面
☎️ 常见问题解答
💻 硬件规格
🍯 技巧与窍门
☎️ 故障排除
感谢鸣谢
公司
个人
✨ 贡献者 ✨
感谢以下各位优秀人士:
贡献
我们正在以开源方式开发 AutoRAG。
因此,本项目欢迎各种贡献和建议。欢迎您参与其中。
此外,您还可以查阅我们的详细文档此处。
引用
@misc{kim2024autoragautomatedframeworkoptimization,
title={AutoRAG: Automated Framework for optimization of Retrieval Augmented Generation Pipeline},
author={Dongkyu Kim and Byoungwook Kim and Donggeon Han and Matouš Eibich},
year={2024},
eprint={2410.20878},
archivePrefix={arXiv},
primaryClass={cs.CL},
url={https://arxiv.org/abs/2410.20878},
}
版本历史
v0.3.222026/04/03v0.3.212025/11/14v0.3.202025/11/14v0.3.192025/10/13v0.3.182025/09/20v0.3.172025/08/31v0.3.162025/06/22v0.3.142025/03/03v0.3.132025/01/25v0.3.122024/12/09v0.3.112024/11/29v0.3.102024/11/20v0.3.92024/11/11v0.3.82024/10/30v0.3.72024/10/24v0.3.52024/10/13v0.3.42024/10/09v0.3.32024/10/05v0.3.22024/10/03v0.3.12024/10/02常见问题
相似工具推荐
openclaw
OpenClaw 是一款专为个人打造的本地化 AI 助手,旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚,能够直接接入你日常使用的各类通讯渠道,包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息,OpenClaw 都能即时响应,甚至支持在 macOS、iOS 和 Android 设备上进行语音交互,并提供实时的画布渲染功能供你操控。 这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地,用户无需依赖云端服务即可享受快速、私密的智能辅助,真正实现了“你的数据,你做主”。其独特的技术亮点在于强大的网关架构,将控制平面与核心助手分离,确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者,以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力(支持 macOS、Linux 及 Windows WSL2),即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你
stable-diffusion-webui
stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。
everything-claude-code
everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上
ComfyUI
ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。
gemini-cli
gemini-cli 是一款由谷歌推出的开源 AI 命令行工具,它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言,它提供了一条从输入提示词到获取模型响应的最短路径,无需切换窗口即可享受智能辅助。 这款工具主要解决了开发过程中频繁上下文切换的痛点,让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用,还是执行复杂的 Git 操作,gemini-cli 都能通过自然语言指令高效处理。 它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口,具备出色的逻辑推理能力;内置 Google 搜索、文件操作及 Shell 命令执行等实用工具;更独特的是,它支持 MCP(模型上下文协议),允许用户灵活扩展自定义集成,连接如图像生成等外部能力。此外,个人谷歌账号即可享受免费的额度支持,且项目基于 Apache 2.0 协议完全开源,是提升终端工作效率的理想助手。
markitdown
MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具,专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片(含 OCR)、音频(含语音转录)、HTML 乃至 YouTube 链接等多种格式的解析,能够精准提取文档中的标题、列表、表格和链接等关键结构信息。 在人工智能应用日益普及的今天,大语言模型(LLM)虽擅长处理文本,却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点,它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式,成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外,它还提供了 MCP(模型上下文协议)服务器,可无缝集成到 Claude Desktop 等 LLM 应用中。 这款工具特别适合开发者、数据科学家及 AI 研究人员使用,尤其是那些需要构建文档检索增强生成(RAG)系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性,但其核心优势在于为机器
