GraphGym

GitHub
1.9k 198 中等 1 次阅读 昨天NOASSERTION开发框架其他
AI 解读 由 AI 自动生成,仅供参考

GraphGym 是一个专为图神经网络(GNN)设计与评估打造的开源平台,源自斯坦福大学在 NeurIPS 2020 发表的亮点论文。它旨在解决 GNN 领域模型种类繁多、最佳架构难以确定以及实验复现困难等核心痛点。

对于刚入门的学习者,GraphGym 提供了标准化的实现流程,帮助快速理解 GNN 工作原理;对于希望将 GNN 应用于具体业务的开发者,它能并行启动数千次实验,自动筛选出最适合特定任务的最佳模型设计;对于科研人员,平台支持灵活注册自定义模块(如新的网络层或损失函数),便于公平地验证新提出的算法是否优于现有方案。

其技术亮点在于高度模块化的流水线设计,涵盖数据加载、模型构建、任务定义到性能评估的全环节。所有实验均可通过配置文件完整描述,确保了极高的可复现性。此外,GraphGym 具备强大的可扩展性,能自动管理大规模并行实验并生成分析报告。无论是初学者、领域专家还是资深研究员,都能利用 GraphGym 高效探索图神经网络的无限可能。

使用场景

某生物制药公司的算法团队正试图利用图神经网络(GNN)预测新合成分子的毒性,需要在数百种模型架构中找到最优解以加速药物筛选流程。

没有 GraphGym 时

  • 重复造轮子:每次尝试新的 GNN 层或损失函数,都需要手动重写数据加载、训练循环和评估指标等基础代码,开发效率极低。
  • 实验难以复现:超参数组合繁多,缺乏统一的配置文件管理,导致无法精确回溯某个特定实验的设置,结果不可靠。
  • 规模扩展受限:想要并行测试上千种模型变体时,需自行编写复杂的脚本调度任务,难以自动化生成对比分析报告。
  • 结论缺乏说服力:仅凭少数几次实验结果断言新模型优越,缺乏在大规模设计空间下的统计显著性验证,难以说服领域专家。

使用 GraphGym 后

  • 模块化快速迭代:只需在 contrib 目录注册自定义的分子特征提取层,即可立即接入标准化的全流程管道,专注核心创新。
  • 配置即实验:每个实验完全由 YAML 配置文件定义,轻松实现“一键复现”,确保所有结果均可追溯且透明。
  • 千级实验并行:通过简单命令即可并发启动数千个不同随机种子和架构的实验,并自动生成包含误差分析和趋势图的完整报告。
  • 科学严谨的评估:基于千万级模型 - 任务组合的设计空间采样,能 statistically 证明新架构在特定毒性预测任务上的泛化优势。

GraphGym 将原本需要数周的手工试错过程缩短为几天的高效自动化探索,让团队能从繁琐的工程细节中解放出来,专注于发现真正有效的药物预测模型。

运行环境要求

操作系统
  • Linux
GPU

可选(支持 CPU 或 NVIDIA GPU),具体显存大小未说明,支持 CUDA 9.2, 10.1, 10.2, 11.1

内存

未说明

依赖
notes建议使用 Conda 管理环境。默认后端为 DeepSNAP,也支持 PyTorch Geometric (PyG) 后端。运行批量实验时可根据硬件配置调整并发任务数。若使用 CPU 后端,需在配置文件中添加 'device: cpu'。
python3.7+
torch>=1.4.0
pytorch_geometric
torch-scatter
torch-sparse
torch-cluster
torch-spline-conv
GraphGym hero image

快速开始

GraphGym

GraphGym 是一个用于设计和评估图神经网络(GNN)的平台。 GraphGym 的提出源自论文 图神经网络的设计空间,作者为 Jiaxuan You、Rex Ying 和 Jure Leskovec,该论文入选 NeurIPS 2020 Spotlight

此外,您也可以参考 PyG,它是 GraphGym 与 PyTorch Geometric 紧密集成的版本。

主要特点

1. 高度模块化的 GNN 流程

  • 数据: 数据加载、数据划分
  • 模型: 模块化 GNN 实现
  • 任务: 节点级、边级、图级 GNN 任务
  • 评估: 准确率、ROC AUC 等

2. 可复现的实验配置

  • 每个实验都由 配置文件完整描述

3. 可扩展的实验管理

  • 轻松并行启动 数千个 GNN 实验
  • 自动生成跨随机种子和实验的分析报告及图表。

4. 灵活的用户自定义功能

  • 可轻松在 graphgym/contrib/注册您自己的模块,例如数据加载器、GNN 层、损失函数等。

最新动态

  • GraphGym 0.3.0 已发布。现在您可以通过 pip install graphgym 安装稳定版 GraphGym。
  • GraphGym 0.2.0 已发布。除了默认的 DeepSNAP 后端之外,GraphGym 现在也支持 PyTorch Geometric 后端。 您可以在 run_single_pyg.sh 中尝试:
cd run
bash run_single_pyg.sh 

示例应用场景

为什么选择 GraphGym?

简而言之: GraphGym 非常适合 GNN 初学者、领域专家以及 GNN 研究人员。

场景 1: 您是 GNN 初学者,希望理解 GNN 的工作原理。

您可能已经阅读过许多关于 GNN 的精彩论文,并尝试编写自己的 GNN 实现。然而,即使使用现有的 GNN 库,您仍然需要自己实现核心流程。GraphGym 是一个理想的起点,帮助您学习 标准化的 GNN 实现与评估方法


图 1: 模块化 GNN 实现。

场景 2: 您希望将 GNN 应用于您的实际项目中。

您可能知道,GNN 的模型组合多达数百种,而选择最佳模型却非常困难。更糟糕的是,我们在论文中表明(arXiv:2011.08843),不同任务的最佳 GNN 设计差异极大。GraphGym 提供了一个 简单接口,可并行尝试数千种 GNN,从而帮助您找到最适合特定任务的设计方案。经过对 1000 万种 GNN 模型与任务组合的分析,GraphGym 还推荐了一套“通用”的 GNN 设计空间。


图 2: 优选 GNN 设计指南。

(基于对 1000 万种 GNN 模型与任务组合的抽样分析。)

场景 3: 您是 GNN 研究者,希望创新 GNN 模型或提出新的 GNN 任务。

假设您提出了一种新的 GNN 层 ExampleConv。GraphGym 可以帮助您有力地证明 ExampleConvGCNConv 更优:在固定其他条件(包括计算成本)的情况下,从 1000 万种可能的模型-任务组合中随机抽样时,ExampleConv 胜出的概率更高。此外,GraphGym 还可以帮助您轻松进行超参数搜索,并直观展示哪些设计选择更为优越。总之,GraphGym 能够极大地促进您的 GNN 研究工作。


图 3: 对给定 GNN 设计维度的评估
(此处以 BatchNorm 为例)。

安装说明

系统要求

  • CPU 或 NVIDIA GPU、Linux 操作系统、Python 3
  • PyTorch 及其他 Python 包;以下提供这些依赖项的安装说明

1. Python 环境(可选): 建议使用 Conda 包管理器

conda create -n graphgym python=3.7
source activate graphgym

2. PyTorch: 请安装 PyTorch。我们已在 PyTorch 1.8.0 下验证了 GraphGym,它也应兼容 PyTorch 1.4.0 及以上版本。例如:

# CUDA 版本:cpu、cu92、cu101、cu102、cu111
pip install torch==1.8.0+cu101 -f https://download.pytorch.org/whl/torch_stable.html

3. PyTorch Geometric: 请按照其官方文档安装 PyTorch Geometric。例如:

# CUDA 版本:cpu、cu92、cu101、cu102、cu111

# TORCH版本:1.4.0、1.5.0、1.6.0、1.7.0、1.8.0
CUDA=cu101
TORCH=1.8.0
pip install torch-scatter -f https://pytorch-geometric.com/whl/torch-${TORCH}+${CUDA}.html
pip install torch-sparse -f https://pytorch-geometric.com/whl/torch-${TORCH}+${CUDA}.html
pip install torch-cluster -f https://pytorch-geometric.com/whl/torch-${TORCH}+${CUDA}.html
pip install torch-spline-conv -f https://pytorch-geometric.com/whl/torch-${TORCH}+${CUDA}.html
pip install torch-geometric

4. GraphGym及其他依赖:

git clone https://github.com/snap-stanford/GraphGym
cd GraphGym
pip install -r requirements.txt
pip install -e .  # 从最新版本安装
pip install graphgym # (可选)从PyPI稳定版安装

5. 测试安装

运行单个实验。 使用GraphGym的run_single.sh脚本运行一个测试GNN实验。 配置文件指定在example.yaml中。 该实验是关于Cora数据集上的节点分类任务(随机80/20划分训练集和验证集)。

cd run
bash run_single.sh # 运行单个实验

运行一批实验。 使用GraphGym的run_batch.sh脚本运行一批GNN实验。 配置文件分别指定在example.yaml(控制基本架构)和example.txt(控制网格搜索方式)中。 该实验在两个图分类数据集上,考察了推荐的GNN设计空间中的96种模型。 每个实验重复3次,并设置允许同时运行8个作业。 根据你的硬件条件,完成所有实验可能需要较长时间;你可以通过Ctrl-C终止实验(GraphGym会妥善关闭所有进程)。

cd run
bash run_batch.sh # 运行一批实验 

(可选) 使用CPU后端运行GraphGym。 GraphGym也支持CPU后端——你只需在.yaml文件中添加一行device: cpu即可。以下是一个示例。

cd run
bash run_single_cpu.sh # 使用CPU后端运行单个实验

(可选) 使用PyG后端运行GraphGym。 可以使用PyTorch Geometric(PyG)后端来运行GraphGym,对应的脚本为run_single_pyg.shrun_batch_pyg.sh,而不是默认的DeepSNAP后端。 PyG后端遵循原生PyG实现,效率略高于DeepSNAP后端。 目前,PyG后端仅支持用户提供的数据集划分,例如PyG原生数据集或OGB数据集。

cd run
bash run_single_pyg.sh # 使用PyG后端运行单个实验
bash run_batch_pyg.sh # 使用PyG后端运行一批实验 

GraphGym深入使用

1 运行单个GNN实验

完整示例见run/run_single.sh

1.1 指定配置文件。 在GraphGym中,一个实验完全由.yaml文件指定。 .yaml文件中未指定的配置将使用graphgym/config.py中的默认值填充。 例如,在run/configs/example.yaml中,包含了数据集、训练、模型、GNN等方面的配置。 每项配置的具体说明均在graphgym/config.py中定义。

1.2 启动实验。run/run_single.sh为例:

python main.py --cfg configs/example.yaml --repeat 3

可以通过--repeat参数指定重复使用的不同随机种子数量。

1.3 理解结果。 实验结果会自动保存到run/results/${CONFIG_NAME}/目录下; 在上述示例中,路径为run/results/example/。 不同随机种子的结果会保存在不同的子目录中,如run/results/example/2。 所有随机种子的汇总结果会自动生成在run/results/example/agg中, 包括各指标的均值及标准差_std。 训练/验证/测试结果还会进一步保存在子目录中,如run/results/example/agg/val; 其中,stats.json存储了每个epoch在所有随机种子上的汇总结果, best.json则存储了验证准确率最高时的epoch的结果。

2 运行一批 GNN 实验

完整示例在 run/run_batch.sh 中指定。

2.1 指定一个基础配置文件。 GraphGym 支持运行一批实验。首先,用户需要选择一个基础架构 --config。这一批实验将通过扰动基础架构中的某些配置来创建。

2.2(可选)指定用于控制计算预算的基础配置文件。 此外,GraphGym 允许用户选择一个基础架构来 控制网格搜索的计算预算,即 --config_budget。目前,计算预算以可训练参数的数量来衡量;通过自动调整 GNN 的隐藏层维度来实现这一控制。如果未提供 --config_budget,GraphGym 将不会控制计算预算。

2.3 指定一个网格文件。 网格文件描述了如何对基础配置文件进行扰动,从而生成这一批实验。例如,基础配置文件可能指定一个用于 Cora 节点分类任务的 3 层 GCN 实验。然后,网格文件会说明如何沿不同维度对该实验进行扰动,比如层数、模型架构、数据集、任务难度等。

2.4 根据上述信息生成这批实验的配置文件。 例如,在 run/run_batch.sh 中:

python configs_gen.py --config configs/${DIR}/${CONFIG}.yaml \
  --config_budget configs/${DIR}/${CONFIG}.yaml \
  --grid grids/${DIR}/${GRID}.txt \
  --out_dir configs

2.5 启动这一批实验。 例如,在 run/run_batch.sh 中:

bash parallel.sh configs/${CONFIG}_grid_${GRID} $REPEAT $MAX_JOBS

每个实验将重复 $REPEAT 次。我们实现了一个队列系统,按顺序启动所有作业,同时最多允许 $MAX_JOBS 个作业并行运行。实际上,我们的系统在处理数千个作业时表现非常出色。

2.6 理解实验结果。 实验结果将自动保存在目录 run/results/${CONFIG_NAME}_grid_${GRID_NAME}/ 中;在上面的例子中,就是 run/results/example_grid_example/。每次实验完成后,GraphGym 还会自动对不同模型的结果取平均,并保存在 run/results/example_grid_example/agg 中。其中,val.csv 表示每个模型配置在 最终 epoch 的验证准确率;val_best.csv 表示在平均验证误差最高的 epoch 下的结果;val_best_epoch.csv 表示在验证误差最高的 epoch 下,跨不同随机种子取平均后的结果。如果提供了测试集划分,则 test.csv 表示每个模型配置在 最终 epoch 的测试准确率;test_best.csv 表示在平均验证误差最高的 epoch 下的测试集结果;test_best_epoch.csv 表示在验证误差最高的 epoch 下,跨不同随机种子取平均后的测试集结果。

3 分析结果

我们提供了一个便捷工具,可以自动对一批实验进行概览,位于 analysis/example.ipynb

cd analysis
jupyter notebook
example.ipynb   # 自动提供一批实验的概览

4 用户自定义

GraphGym 的一大亮点是它允许用户轻松注册自己的自定义模块。支持的自定义模块位于目录 graphgym/contrib/ 中,包括:

在每个目录中,至少会提供一个示例,展示如何注册用户自定义模块。需要注意的是,新的用户自定义模块可能会带来新的配置项;在这种情况下,可以在 graphgym/contrib/config/ 中注册新的配置字段。

注:应用于您自己的数据集。 常见的用法是将 GraphGym 应用于您喜爱的数据集。为此,您可以参考 graphgym/contrib/loader/example.py 中的示例。GraphGym 目前接受 NetworkX 图或 PyG 数据集的列表。

使用案例:图神经网络的设计空间(NeurIPS 2020 Spotlight)

重现 图神经网络的设计空间 中的实验,作者为 Jiaxuan You、Rex Ying 和 Jure Leskovec,该论文入选 NeurIPS 2020 Spotlight。更多详情请参阅 论文项目主页

# 注意:我们已包含使用 GraphGym 得到的原始结果
# 如果您运行以下代码,这些结果将会被覆盖。
cd run/scripts/design/
bash run_design_round1.sh   # 第一轮实验,在包含 31.5 万种 GNN 设计的空间上进行
bash run_design_round2.sh   # 第二轮实验,在包含 96 种 GNN 设计的空间上进行
cd ../analysis
jupyter notebook
design_space.ipynb   # 重现论文中的所有分析

图 4:所提出的 GNN 设计空间和任务空间的概览。

使用案例:身份感知的图神经网络(AAAI 2021)

重现 身份感知的图神经网络 中的实验,作者为 Jiaxuan You、Jonathan Gomes-Selman、Rex Ying 和 Jure Leskovec,该论文入选 AAAI 2021。更多详情请参阅 论文项目主页


# 注意:我们在 analysis/idgnn.csv 中包含了 ID-GNN 的原始结果
cd run/scripts/IDGNN/
bash run_idgnn_node.sh   # 复现 ID-GNN 的节点级别结果
bash run_idgnn_edge.sh   # 复现 ID-GNN 的边级别结果
bash run_idgnn_graph.sh   # 复现 ID-GNN 的图级别结果

图5:身份感知图神经网络(ID-GNN)概览。

使用场景:关系多任务学习:建模数据与任务之间的关系(ICLR 2022 Spotlight)

复现 关系多任务学习:建模数据与任务之间的关系 中的实验,作者:Kaidi Cao*、Jiaxuan You*、Jure Leskovec,ICLR 2022

# 注意:我们在 analysis/idgnn.csv 中包含了 ID-GNN 的原始结果
git checkout meta_link
cd run/scripts/MetaLink/
bash run_metalink.sh.sh   # 复现 MetaLink 在图分类任务上的结果

图5:身份感知图神经网络(ID-GNN)概览。

使用场景:ROLAND:面向动态图的图学习框架(KDD 2022)

ROLAND:面向动态图的图学习框架,作者:Jiaxuan You、Tianyu Du、Jure Leskovec,KDD 2022。 ROLAND 基于 GraphGym 的实现进行了分支。请访问 ROLAND 的对应仓库

贡献者

Jiaxuan You 发起并主导了该项目,为整个 GraphGym 平台做出了主要贡献。 Rex Ying 负责特征增强模块的开发。 Jonathan Gomes Selman 使 GraphGym 支持 OGB 数据集。

GraphGym 的设计灵感来源于 pycls 框架。 GraphGym 默认采用 DeepSNAP 作为数据表示方式。 GraphGym 的部分功能依赖于 Pytorch Geometric 提供的能力。

参与贡献

我们热烈欢迎社区参与 GraphGym 的开发与贡献。 GraphGym 特别设计为便于简单地进行贡献和定制。 例如,您可以通过创建拉取请求,将您的模块提交到 graphgym/contrib/ 目录中。

引用 GraphGym

如果您认为 GraphGym 或我们的论文对您有所帮助,请引用我们的论文:

@InProceedings{you2020design,
  title = {图神经网络的设计空间},
  author = {You, Jiaxuan 和 Ying, Rex 和 Leskovec, Jure},
  booktitle = {NeurIPS},
  year = {2020}
}

版本历史

v0.4.02022/03/24
v0.3.12021/06/29

常见问题

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手,旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚,能够直接接入你日常使用的各类通讯渠道,包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息,OpenClaw 都能即时响应,甚至支持在 macOS、iOS 和 Android 设备上进行语音交互,并提供实时的画布渲染功能供你操控。 这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地,用户无需依赖云端服务即可享受快速、私密的智能辅助,真正实现了“你的数据,你做主”。其独特的技术亮点在于强大的网关架构,将控制平面与核心助手分离,确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者,以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力(支持 macOS、Linux 及 Windows WSL2),即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

349.3k|★★★☆☆|1周前
Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。

162.1k|★★★☆☆|1周前
开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上

156.8k|★★☆☆☆|今天
开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。

108.3k|★★☆☆☆|5天前
开发框架图像Agent

gemini-cli

gemini-cli 是一款由谷歌推出的开源 AI 命令行工具,它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言,它提供了一条从输入提示词到获取模型响应的最短路径,无需切换窗口即可享受智能辅助。 这款工具主要解决了开发过程中频繁上下文切换的痛点,让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用,还是执行复杂的 Git 操作,gemini-cli 都能通过自然语言指令高效处理。 它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口,具备出色的逻辑推理能力;内置 Google 搜索、文件操作及 Shell 命令执行等实用工具;更独特的是,它支持 MCP(模型上下文协议),允许用户灵活扩展自定义集成,连接如图像生成等外部能力。此外,个人谷歌账号即可享受免费的额度支持,且项目基于 Apache 2.0 协议完全开源,是提升终端工作效率的理想助手。

100.8k|★★☆☆☆|5天前
插件Agent图像

markitdown

MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具,专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片(含 OCR)、音频(含语音转录)、HTML 乃至 YouTube 链接等多种格式的解析,能够精准提取文档中的标题、列表、表格和链接等关键结构信息。 在人工智能应用日益普及的今天,大语言模型(LLM)虽擅长处理文本,却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点,它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式,成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外,它还提供了 MCP(模型上下文协议)服务器,可无缝集成到 Claude Desktop 等 LLM 应用中。 这款工具特别适合开发者、数据科学家及 AI 研究人员使用,尤其是那些需要构建文档检索增强生成(RAG)系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性,但其核心优势在于为机器

93.4k|★★☆☆☆|1周前
插件开发框架