ComfyUI-Manager

GitHub
14.1k 2.1k 简单 6 次阅读 2天前GPL-3.0图像插件
AI 解读 由 AI 自动生成,仅供参考

ComfyUI-Manager 是专为 ComfyUI 设计的核心扩展插件,旨在显著提升其易用性与扩展能力。它主要解决了用户在管理海量自定义节点时面临的安装繁琐、版本冲突及信息分散等痛点。通过 ComfyUI-Manager,用户可以轻松在图形界面中完成自定义节点的搜索、安装、卸载、启用与禁用操作,无需手动处理复杂的代码依赖或文件夹结构。此外,它还内置了资源中心(Hub)功能,方便用户一站式获取最新的模型信息与社区动态。

这款工具非常适合所有层级的 ComfyUI 使用者:对于设计师和普通用户,它降低了技术门槛,让创意工作流搭建更加流畅;对于开发者和研究人员,它提供了高效的节点测试与环境管理方案,支持通过 comfy-cli 进行自动化部署,并兼容 uv 加速安装。其独特的技术亮点包括对官方注册表的原生支持、自动化的安全数据迁移机制以及跨平台(Windows/Linux/macOS)的灵活安装策略。无论是构建个人创作工作室还是维护大型研发项目,ComfyUI-Manager 都是优化工作流不可或缺的得力助手。

使用场景

一位数字艺术家正在尝试复现 GitHub 上流行的最新 ComfyUI 工作流,该工作流依赖多个特定的自定义节点来实现复杂的图像生成效果。

没有 ComfyUI-Manager 时

  • 手动查找困难:需要逐个打开工作流文件查看缺失节点名称,再前往 GitHub 搜索对应的仓库地址,过程繁琐且容易出错。
  • 安装配置复杂:必须手动使用 Git 命令克隆代码到 custom_nodes 目录,若遇到依赖冲突或路径错误,需反复排查终端报错。
  • 版本管理混乱:当原作者更新节点修复 Bug 时,无法直观感知,只能手动重新拉取代码,极易因版本不匹配导致工作流崩溃。
  • 环境清理风险:想要移除某个测试过的节点时,需手动删除文件夹,稍有不慎就会误删其他重要文件或残留配置。

使用 ComfyUI-Manager 后

  • 一键自动补全:加载工作流时,ComfyUI-Manager 自动识别缺失节点,点击"Install Missing Custom Nodes"即可批量完成下载与安装。
  • 可视化操作便捷:内置扩展商店界面,支持直接搜索、安装、启用或禁用节点,无需接触命令行,大幅降低技术门槛。
  • 智能更新维护:提供统一的"Update All"功能,可一键将所有自定义节点升级至最新版,确保工作流稳定运行。
  • 安全卸载管理:在管理器列表中勾选即可干净移除不再需要的节点,自动处理相关文件,保持环境整洁有序。

ComfyUI-Manager 将原本耗时数小时的环境搭建与维护工作缩短为几分钟的点击操作,让创作者能专注于创意本身而非技术调试。

运行环境要求

操作系统
  • Windows
  • Linux
  • macOS
GPU

未说明 (作为 ComfyUI 的扩展插件,其 GPU 需求取决于主程序 ComfyUI 及所安装的具体自定义节点)

内存

未说明

依赖
notes1. 本工具是 ComfyUI 的管理器扩展,必须先安装 ComfyUI 主程序。 2. 必须安装 Git 以支持节点的克隆和更新。 3. 文件必须准确位于 `ComfyUI/custom_nodes/comfyui-manager` 目录下,不支持直接解压覆盖安装。 4. V3.38 版本起,用户数据迁移至受保护的系统路径(默认为 `<USER_DIRECTORY>/__manager/`)。 5. 提供便携式版本(Portable)的一键安装脚本。 6. 支持通过 `cm-cli` 在不启动 ComfyUI 的情况下使用管理器功能。
python3.8+ (README 提及需要 python 3,且 ComfyUI 通常要求 Python 3.8 或更高版本)
git
comfy-cli (可选,用于命令行安装)
uv (可选,需在 config.ini 中配置)
ComfyUI-Manager hero image

快速开始

ComfyUI 管理器

ComfyUI-Manager 是一个旨在提升 ComfyUI 易用性的扩展。它提供了管理功能,可以 安装、移除、禁用和启用 ComfyUI 的各种自定义节点。此外,该扩展还提供了一个中心枢纽功能以及便捷的操作,方便用户访问 ComfyUI 中的各类信息。

menu

注意事项

安装方法

安装[方法1](通用安装方式:仅安装 ComfyUI-Manager)

若要在已有的 ComfyUI 安装基础上添加 ComfyUI-Manager,可按以下步骤操作:

  1. 打开终端(cmd),进入 ComfyUI/custom_nodes 目录。
  2. 运行命令:git clone https://github.com/ltdrdata/ComfyUI-Manager comfyui-manager
  3. 重启 ComfyUI。

安装[方法2](便携版 ComfyUI 安装方式:仅安装 ComfyUI-Manager)

  1. 安装 Git:
  2. scripts/install-manager-for-portable-version.bat 文件下载到已安装的 "ComfyUI_windows_portable" 目录中。
    • 不要直接点击链接,请右键选择“另存为…”。
  3. 双击 install-manager-for-portable-version.bat 批处理文件。

portable-install

安装[方法3](通过 comfy-cli 安装:同时安装 ComfyUI 和 ComfyUI-Manager)

推荐使用:comfy-cli 提供了丰富的 CLI 功能来管理 ComfyUI。

  • 前提条件:Python 3、Git

Windows:

python -m venv venv
venv\Scripts\activate
pip install comfy-cli
comfy install

Linux/macOS:

python -m venv venv
. venv/bin/activate
pip install comfy-cli
comfy install

安装[方法4](适用于 Linux + venv 环境:安装 ComfyUI 和 ComfyUI-Manager)

若要在 Linux 系统上使用 venv 环境安装 ComfyUI 并集成 ComfyUI-Manager,可按以下步骤操作:

  • 前提条件:Python 3、python3-venv、Git
  1. scripts/install-comfyui-venv-linux.sh 文件下载到空的安装目录中。
    • 不要直接点击链接,右键选择“另存为…”。
    • ComfyUI 将被安装在指定目录的子目录中,而该目录将包含生成的可执行脚本。
  2. 运行命令:chmod +x install-comfyui-venv-linux.sh
  3. 运行命令:./install-comfyui-venv-linux.sh

安装注意事项

  • 必须遵守ComfyUI-Manager 文件必须准确放置在 ComfyUI/custom_nodes/comfyui-manager 路径下。
    • 不建议以压缩包形式进行安装。
  • 切勿:直接解压到 ComfyUI/custom_nodes 目录,导致 Manager 内容如 __init__.py 直接放置于此目录中。
    • 必须先从 ComfyUI/custom_nodes 中移除所有 ComfyUI-Manager 文件。
  • 切勿:解压后文件路径为 ComfyUI/custom_nodes/ComfyUI-Manager/ComfyUI-Manager
  • 切勿:解压后文件路径为 ComfyUI/custom_nodes/ComfyUI-Manager-main
    • 在这些情况下,虽然 ComfyUI-Manager 可能会运行,但它不会被 ComfyUI 识别,也无法进行更新,且存在重复安装的风险。请将其移除,并通过 git clone 方法正确安装。

根据您的系统配置,您可以运行 ./run_gpu.sh./run_cpu.sh 来启动 ComfyUI。

Colab 笔记本

本仓库提供了 Colab 笔记本,允许您安装并使用 ComfyUI,包括 ComfyUI-Manager。要使用 ComfyUI,请点击此链接:https://colab.research.google.com/github/ltdrdata/ComfyUI-Manager/blob/main/notebooks/comfyui_colab_with_manager.ipynb

  • 支持安装 ComfyUI。
  • 支持基本安装 ComfyUI-Manager。
  • 支持在重新启动 Colab 笔记本时自动安装自定义节点的依赖项。

使用方法

  1. 在主菜单中点击“管理器”按钮

    mainmenu

  2. 如果您点击“安装自定义节点”或“安装模型”,将打开一个安装对话框。

    menu

    • 有三种数据库模式:DB: 频道(1天缓存)DB: 本地DB: 频道(远程)

      • 频道(1天缓存)利用有效期为一天的频道缓存信息,快速显示列表。
        • 当没有缓存、缓存过期或通过频道(远程)获取外部信息时,这些信息会被更新。
        • 每次重新启动 ComfyUI 时,此模式始终设置为默认模式。
      • 本地使用存储在 ComfyUI-Manager 本地的信息。
        • 这些信息仅在您更新 ComfyUI-Manager 时才会更新。
        • 对于自定义节点开发者来说,在将节点注册到 custom-node-list.json 并进行测试时,应使用此模式。
      • 频道(远程)从远程频道获取信息,始终显示最新列表。
      • 如果由于网络错误无法检索,则会强制使用本地信息。
    • 获取更新菜单会在本地获取自定义节点的更新数据。实际更新则需在安装自定义节点菜单中点击更新按钮来应用。

  3. 点击“安装”或“尝试安装”按钮。

    node-install-dialog

    model-install-dialog

    • 已安装:该项目已安装。

    • 安装:点击此按钮将安装该项目。

    • 尝试安装:这是一个无法确认安装信息的自定义节点。点击该按钮以尝试安装。

    • 如果顶部出现红色背景的“频道”指示器,则表示当前并非默认频道。由于所持有的信息量与默认频道不同,许多自定义节点在此频道状态下可能不会显示。

      • 频道设置影响广泛,不仅会影响节点列表,还会影响“全部更新”等所有功能。
    • 背景为黄色的冲突节点会列出与相应扩展存在冲突的节点。这个问题需要由开发者解决,用户应注意,由于这些冲突,某些节点可能无法正常工作,因此需要相应地进行安装。

  4. 分享 menu share

menu

  • 通过管理器菜单中的“分享设置”,您可以配置主菜单中的“分享”按钮或上下文菜单上的“分享输出”按钮的行为。
    • :从主菜单中隐藏
    • 全部:显示一个对话框,用户可以在其中选择分享标题。

路径

自 V3.38 起,管理器使用受保护的系统路径以增强安全性。

  • * 如果不带任何选项运行,默认路径为 ComfyUI/user。 * 可以使用 --user-directory 来设置。
ComfyUI 版本 管理器路径
v0.3.76+(带有系统用户 API) <USER_DIRECTORY>/__manager/
较旧版本 <USER_DIRECTORY>/default/ComfyUI-Manager/
  • 基本配置文件:config.ini
  • 可配置的频道列表:channels.list
  • 可配置的 pip 替代项:pip_overrides.json
  • 可配置的 pip 黑名单:pip_blacklist.list
  • 可配置的 pip 自动修复:pip_auto_fix.list
  • 保存的快照文件:snapshots/
  • 启动脚本文件:startup-scripts/
  • 组件文件:components/

注意:有关升级详情,请参阅迁移指南

extra_model_paths.yaml 配置

以下设置基于标记为 is_default 的部分进行应用。

  • custom_nodes: 自定义节点的安装路径
    • 导入时无需遵循设置为 is_default 的路径,但这是 ComfyUI 节点管理器安装自定义节点的路径。
  • download_model_base: 模型下载路径

快照管理器

  • 当您按下“保存快照”或在“管理器菜单”上使用“全部更新”时,当前的安装状态快照会被保存。
    • 快照文件目录:<USER_DIRECTORY>/default/ComfyUI-Manager/snapshots
    • 您可以重命名快照文件。
  • 按下“恢复”按钮可恢复到相应快照的安装状态。
    • 但是,对于未由 Git 管理的自定义节点,快照支持并不完整。
  • 按下“恢复”后,将在下次启动 ComfyUI 时生效。
    • 所选的快照文件会保存在 <USER_DIRECTORY>/default/ComfyUI-Manager/startup-scripts/restore-snapshot.json 中,重启 ComfyUI 时会应用该快照,随后将其删除。

model-install-dialog

cm-cli:面向高级用户的命令行工具

  • 提供了一种工具,允许您在不运行 ComfyUI 的情况下使用 ComfyUI-Manager 的功能。
  • 更多详情请参阅 cm-cli 文档

如何将您的自定义节点注册到 ComfyUI-Manager 中

  • 将条目添加到位于 ComfyUI-Manager 根目录下的 custom-node-list.json 文件中,并提交拉取请求。
  • 注意:在进行更改后提交 PR 之前,请务必勾选“使用本地 DB”,并确保在“安装自定义节点”对话框中扩展列表能够正常加载。有时,缺少或多余的逗号会导致 JSON 语法错误。
  • 剩余的 JSON 文件将在未来通过脚本自动更新,因此您无需担心。

自定义节点支持指南

特殊用途文件(可选)

  • pyproject.toml - ComfyRegistry 的规范文件。
  • node_list.json - 当您的自定义节点 NODE_CLASS_MAPPINGS 模式不常规时,用于手动提供节点列表以供参考。(示例
  • requirements.txt - 安装时,此 pip 依赖项将自动安装。
  • install.py - 安装时,它会自动被调用。
  • 所有脚本均从相应自定义节点的根路径执行。

组件共享

  • 复制与粘贴

    • 演示页面
    • 从剪贴板粘贴组件时,支持以下 JSON 格式的文本。(text/plain)
      {
        "kind": "ComfyUI Components",
        "timestamp": <当前时间戳>,
        "components": 
          {
            <组件名称>: <组件节点数据>
          }
      }
      
    • <当前时间戳> 确保时间戳始终唯一。
      • “components” 应具有与存储在 <USER_DIRECTORY>/default/ComfyUI-Manager/components 中文件内容相同的结构。
        • <组件名称>:名称应采用 <前缀>::<节点名称> 的格式。
          • <组件节点数据>:为组节点的节点数据。
            • <version>:仅允许两种格式:major.minor.patchmajor.minor。(例如:1.02.2.1
            • <datetime>:保存的时间。
            • <packname>:如果 packname 不为空,则类别变为 packname/workflow,并保存在 <USER_DIRECTORY>/default/ComfyUI-Manager/components 中的 <packname>.pack 文件中。
            • <category>:如果没有类别或 packname,则保存在 components 类别中。
                "version":"1.0",
                "datetime": 1705390656516,
                "packname": "mypack",
                "category": "util/pipe",
            
  • 拖放

    • 拖放 .pack.json 文件会添加相应的组件。
    • 示例包:Impact.pack
  • 拖放或粘贴单个组件会添加一个节点。然而,当添加多个组件时,不会添加节点。

支持安装缺失节点

missing-menu

  • 当您点击菜单中的 Install Missing Custom Nodes 按钮时,它会显示一个包含当前工作流中不存在节点的扩展节点列表。

missing-list

配置

  • 您可以修改 config.ini 文件来应用 ComfyUI-Manager 的设置。

  • 配置选项:

    [default]
    git_exe = <手动指定 git 可执行文件的路径。若留空,则使用默认的 git 可执行文件路径。>
    use_uv = <使用 uv 替代 pip 进行依赖项安装。>
    default_cache_as_channel_url = <决定是否在启动时从 channel_url 指定的数据库获取数据。>
    bypass_ssl = <若出现 SSL 错误,将其设置为 True 以禁用 SSL。>
    file_logging = <配置是否创建 ComfyUI-Manager 使用的日志文件。>
    windows_selector_event_loop_policy = <若在 Windows 上发生事件循环错误,请将其设置为 True。>
    model_download_by_agent = <下载模型时,使用代理而非 torchvision_download_url。>
    downgrade_blacklist = <设置禁止降级的软件包列表。用逗号分隔列出。>
    security_level = <设置安全级别 => strong|normal|normal-|weak>
    always_lazy_install = <是否在非 Windows 环境下重启时也执行依赖项安装。>
    network_mode = <设置网络模式 => public|private|offline>
    
    • network_mode:
      • public:使用典型公共网络的环境。
      • private:使用封闭网络的环境,其中通过 channel_url 配置了私有节点数据库。(如有缓存则使用)
      • offline:使用离线网络且不进行任何外部连接的环境。(如有缓存则使用)

附加功能

  • 文件日志功能

    • 此功能默认启用,可通过在 config.ini 中将 file_logging = False 来禁用。
  • 修复节点(重新创建):右键点击节点并选择“修复节点(重新创建)”时,可以重新创建该节点。小部件的值会被重置,而连接会保留相同名称的连接。

    • 用于修复旧工作流中与自定义节点版本变更不兼容的节点错误。
  • 双击节点标题:您可以在 ComfyUI-Manager 菜单中设置节点的双击行为。

    • 复制所有连接复制输入连接:双击节点会复制最近节点的连接。

      • 此操作针对距离节点中心直线距离不超过1000像素范围内的最近节点。
      • 在“复制所有连接”的情况下,它会复制现有的输出,但由于不允许重复连接,原始节点的现有输出连接会被断开。
      • 此功能仅复制名称匹配的输入和输出。
    • 可能的输入连接:它会连接指定范围内最接近类型的所有输出。

      • 这种连接会链接到目标节点左侧位置的节点中最近的输出。
    • 可能的(左)+ 复制(右):当您双击标题的左半部分时,它会作为“可能的输入连接”运行;当您双击右半部分时,它会作为“复制所有连接”运行。

  • 阻止特定包降级

    • 将包名以逗号分隔列在 config.ini 文件的 downgrade_blacklist 部分。
      • 例如:
        downgrade_blacklist = diffusers, kornia
      
  • 自定义 pip 映射

    • 创建 pip_overrides.json 文件后,它会将特定 pip 包的安装方式更改为用户定义的安装方式。
      • 请参考 pip_overrides.json.template 文件。
  • 阻止安装特定 pip 包

    • 将包名每行一个列在 pip_blacklist.list 文件中。
  • 自动恢复 pip 安装

  • 如果您在 pip_auto_fix.list 中列出类似于 requirements.txt 的 pip 规范要求,它将在启动 ComfyUI 或在各种自定义节点安装过程中版本不匹配时自动恢复指定版本。

  • 可以使用 --index-url

  • 使用 aria2 作为下载器

环境变量

以下功能可以通过环境变量进行配置:

  • COMFYUI_PATH:ComfyUI 的安装路径
  • GITHUB_ENDPOINT:针对访问 GitHub 受限环境的反向代理配置
  • HF_ENDPOINT:针对访问 Hugging Face 受限环境的反向代理配置

示例 1:

https://github.com/ltdrdata/ComfyUI-Impact-Pack 重定向到 https://mirror.ghproxy.com/https://github.com/ltdrdata/ComfyUI-Impact-Pack

GITHUB_ENDPOINT=https://mirror.ghproxy.com/https://github.com

示例 2:

https://huggingface.co/path/to/somewhere 改为 https://some-hf-mirror.com/path/to/somewhere

HF_ENDPOINT=https://some-hf-mirror.com 

扫描器

当您运行 scan.sh 脚本时:

  • 它会更新 extension-node-map.json

    • 为此,它会将 custom-node-list.json 中列出的自定义节点拉取或克隆到 ~/.tmp/default
    • 若要跳过此步骤,请添加 --skip-update 选项。
    • 如果您想指定不同于 ~/.tmp/default 的路径,可以直接运行 python scanner.py [path],而不是 scan.sh
  • 它会更新 github-stats.json

    • 这会使用 GitHub API,因此请通过 export GITHUB_TOKEN=your_token_here 设置您的令牌,以避免快速达到速率限制而导致故障。
    • 若要跳过此步骤,请添加 --skip-stat-update 选项。
  • --skip-all 选项同时应用 --skip-update--skip-stat-update

故障排除

  • 如果您的 git.exe 安装在系统 Git 之外的特定位置,请先安装 ComfyUI-Manager 并运行 ComfyUI,然后在生成的 <USER_DIRECTORY>/default/ComfyUI-Manager/config.ini 文件中,在 git_exe = 后指定包含文件名的路径。
  • 如果更新 ComfyUI-Manager 本身失败,请进入 ComfyUI-Manager 目录并执行命令 git update-ref refs/remotes/origin/main a361cc1 && git fetch --all && git pull
  • 如果在 Windows 下出现错误信息 Overlapped Object has pending operation at deallocation on ComfyUI Manager load
    • 编辑 config.ini 文件:添加 windows_selector_event_loop_policy = True
  • 如果出现 SSL: CERTIFICATE_VERIFY_FAILED 错误。
    • 编辑 config.ini 文件:添加 bypass_ssl = True

安全策略

  • 编辑 config.ini 文件:添加 security_level = <LEVEL>

    • strong
      • 不允许 highmiddle 级别的高风险功能
    • normal
      • 不允许 high 级别风险功能
      • 允许 middle 级别风险功能
    • normal-
      • 如果指定了 --listen 且不以 127. 开头,则不允许 high 级别风险功能
      • 其他情况允许 middle 级别风险功能
    • weak
      • 所有功能均可使用
  • high 级别风险功能

    • 通过 git url 安装pip install
    • 安装未注册在“默认通道”的自定义节点
    • 修复自定义节点
  • middle 级别风险功能

    • 卸载/更新
    • 安装注册在“默认通道”的自定义节点
    • 恢复/移除快照
    • 重启
  • low 级别风险功能

    • 更新 ComfyUI

免责声明

  • 本扩展程序仅提供安装自定义节点的便利,并不保证其正常运行。

致谢

ComfyUI/ComfyUI - 一个功能强大且模块化的稳定扩散 GUI。

以及所有 ComfyUI 自定义节点开发者

常见问题

相似工具推荐

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。

162.1k|★★★☆☆|今天
开发框架图像Agent

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。

107.7k|★★☆☆☆|2天前
开发框架图像Agent

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程,旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周,包含 26 节精炼课程和 52 道配套测验,内容涵盖从基础概念到实际应用的完整流程,有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。 无论是希望转型的开发者、需要补充算法背景的研究人员,还是对人工智能充满好奇的普通爱好者,都能从中受益。课程不仅提供了清晰的理论讲解,还强调动手实践,让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持,通过自动化机制提供了包括简体中文在内的 50 多种语言版本,极大地降低了全球不同背景用户的学习门槛。此外,项目采用开源协作模式,社区活跃且内容持续更新,确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路,ML-For-Beginners 将是理想的起点。

85k|★★☆☆☆|今天
图像数据工具视频

ragflow

RAGFlow 是一款领先的开源检索增强生成(RAG)引擎,旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体(Agent)能力相结合,不仅支持从各类文档中高效提取知识,还能让模型基于这些知识进行逻辑推理和任务执行。 在大模型应用中,幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构(如表格、图表及混合排版),显著提升了信息检索的准确度,从而有效减少模型“胡编乱造”的现象,确保回答既有据可依又具备时效性。其内置的智能体机制更进一步,使系统不仅能回答问题,还能自主规划步骤解决复杂问题。 这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统,还是致力于探索大模型在垂直领域落地的创新者,都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口,既降低了非算法背景用户的上手门槛,也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目,它正成为连接通用大模型与行业专有知识之间的重要桥梁。

77.1k|★★★☆☆|昨天
Agent图像开发框架

PaddleOCR

PaddleOCR 是一款基于百度飞桨框架开发的高性能开源光学字符识别工具包。它的核心能力是将图片、PDF 等文档中的文字提取出来,转换成计算机可读取的结构化数据,让机器真正“看懂”图文内容。 面对海量纸质或电子文档,PaddleOCR 解决了人工录入效率低、数字化成本高的问题。尤其在人工智能领域,它扮演着连接图像与大型语言模型(LLM)的桥梁角色,能将视觉信息直接转化为文本输入,助力智能问答、文档分析等应用场景落地。 PaddleOCR 适合开发者、算法研究人员以及有文档自动化需求的普通用户。其技术优势十分明显:不仅支持全球 100 多种语言的识别,还能在 Windows、Linux、macOS 等多个系统上运行,并灵活适配 CPU、GPU、NPU 等各类硬件。作为一个轻量级且社区活跃的开源项目,PaddleOCR 既能满足快速集成的需求,也能支撑前沿的视觉语言研究,是处理文字识别任务的理想选择。

74.9k|★★★☆☆|今天
语言模型图像开发框架

tesseract

Tesseract 是一款历史悠久且备受推崇的开源光学字符识别(OCR)引擎,最初由惠普实验室开发,后由 Google 维护,目前由全球社区共同贡献。它的核心功能是将图片中的文字转化为可编辑、可搜索的文本数据,有效解决了从扫描件、照片或 PDF 文档中提取文字信息的难题,是数字化归档和信息自动化的重要基础工具。 在技术层面,Tesseract 展现了强大的适应能力。从版本 4 开始,它引入了基于长短期记忆网络(LSTM)的神经网络 OCR 引擎,显著提升了行识别的准确率;同时,为了兼顾旧有需求,它依然支持传统的字符模式识别引擎。Tesseract 原生支持 UTF-8 编码,开箱即用即可识别超过 100 种语言,并兼容 PNG、JPEG、TIFF 等多种常见图像格式。输出方面,它灵活支持纯文本、hOCR、PDF、TSV 等多种格式,方便后续数据处理。 Tesseract 主要面向开发者、研究人员以及需要构建文档处理流程的企业用户。由于它本身是一个命令行工具和库(libtesseract),不包含图形用户界面(GUI),因此最适合具备一定编程能力的技术人员集成到自动化脚本或应用程序中

73.3k|★★☆☆☆|3天前
开发框架图像