DeepKE

GitHub
4.4k 742 中等 1 次阅读 今天MIT数据工具音频语言模型视频开发框架图像
AI 解读 由 AI 自动生成,仅供参考

DeepKE 是一款基于深度学习的开源知识图谱构建工具包,专为从非结构化数据中高效提取实体、关系和属性而设计。它主要解决了传统方法在处理低资源场景、文档级复杂语境以及多模态数据时面临的提取难题,同时完美支持中文模式(cnSchema),降低了构建高质量知识图谱的技术门槛。

无论是人工智能领域的研究人员、算法工程师,还是希望快速落地知识图谱应用的开发者,都能通过 DeepKE 轻松上手。工具不仅提供了命名实体识别、关系抽取等核心功能的预训练模型,还集成了 LightNER、KnowPrompt 等多个前沿学术成果,支持用户直接调用或进行微调训练。

其独特的技术亮点在于对“低资源”和“文档级”抽取的深度优化,并率先推出了结合大语言模型(LLM)的 DeepKE-LLM 模块,让用户能利用大模型的强大能力进一步提升抽取效果。此外,项目提供了详细的文档、在线演示及 Docker 部署方案,兼容 Linux 与 Windows 环境,帮助用户快速搭建从数据处理到图谱生成的完整流程,是探索语义理解与知识工程领域的得力助手。

使用场景

某金融风控团队需要从每日海量的非结构化新闻舆情和财报文档中,自动提取企业间的担保、投资及高管任职关系,以构建实时的风险传导知识图谱。

没有 DeepKE 时

  • 人工标注成本极高:面对低资源场景(如特定行业的罕见事件),缺乏少量样本即可训练的模型,必须雇佣大量专家进行全量数据标注,耗时数周。
  • 文档级关系遗漏:传统工具仅能处理单句内的实体关系,当“母公司”与“子公司”出现在文档的不同段落时,系统无法识别这种长距离依赖,导致关键风险链路断裂。
  • 多模态数据闲置:财报中包含大量描述业务关系的图表,原有纯文本提取方案无法解析图片信息,造成高价值数据浪费。
  • 属性抽取困难:难以从复杂句式中的实体上进一步抽取“持股比例”、“任职时间”等细粒度属性,导致图谱节点信息单薄,无法支撑深度推理。

使用 DeepKE 后

  • 低资源快速冷启动:利用 DeepKE 的少样本学习(Few-shot)模块,仅需提供几十条标注数据,即可在半天内训练出高精度的行业专用关系提取模型。
  • 全域关系精准捕获:启用文档级提取功能,成功跨越段落界限,准确识别出分散在长篇研报中的复杂企业关联,图谱覆盖率提升 40%。
  • 多模态融合增强:通过多模态场景支持,直接解析财报插图中的股权结构,将图像信息转化为图谱三元组,补全了纯文本缺失的关键证据。
  • 细粒度属性自动化:一站式完成实体、关系及属性的联合抽取,自动填充节点的“持股比例”等动态属性,使风险量化计算成为可能。

DeepKE 通过解决低资源、文档级及多模态下的提取难题,将原本需要数周的知识图谱构建周期缩短至天级,显著提升了风控系统的实时响应能力。

运行环境要求

操作系统
  • Linux
  • Windows
GPU

未说明(支持多 GPU 训练,具体型号和显存取决于所选模型)

内存

未说明

依赖
notes强烈建议在 Linux 环境下使用;若在 Windows 上运行,文件路径需使用双反斜杠 '\';若无法访问 HuggingFace,建议使用 'wisemodel' 或 'modescape' 作为替代源;DeepKE-LLM 模块需要独立的 Python 3.9 环境;安装时需注意 pip 版本不超过 24.0。
python3.8 (DeepKE), 3.9 (DeepKE-LLM)
torch
transformers
accelerate
pytorch-pretrained-bert
tqdm
numpy
pandas
scikit-learn
spacy
nltk
DeepKE hero image

快速开始

Documentation PyPI GitHub Documentation Open In Colab

英文 | 简体中文

基于深度学习的知识抽取工具包
用于知识图谱构建

DeepKE 是一个用于知识图谱构建的知识抽取工具包,支持 实体关系属性 抽取的 cnSchema低资源文档级 以及 多模态 场景。我们为初学者提供了 文档在线演示论文幻灯片海报

如果您在安装 DeepKE 和 DeepKE-LLM 时遇到任何问题,请查看 提示 或及时提交 问题,我们将协助您解决问题!

目录


新闻动态

  • 2025年6月 我们将MCP服务工具集成到DeepKE中,支持通过大型语言模型(LLMs)作为工具调用者,对轻量级模型进行知识抽取。
  • 2024年12月 我们开源了OneKE知识抽取框架,支持跨多种场景的多智能体知识抽取。
  • 2024年4月 我们发布了一种新的中英双语、基于模式的信息抽取模型OneKE,该模型基于Chinese-Alpaca-2-13B。
  • 2024年2月 我们发布了一个大规模(0.32B tokens)、高质量的中英双语信息抽取(IE)指令数据集IEPile,并附带两套使用IEPile训练的模型:baichuan2-13b-iepile-lorallama2-13b-iepile-lora
  • 2023年9月 针对基于指令的知识图谱构建任务(Instruction based KGC),我们发布了名为InstructIE的中英双语信息抽取(IE)指令数据集,详情请参见这里
  • 2023年6月 我们更新了DeepKE-LLM,以支持使用KnowLMChatGLM、LLaMA系列、GPT系列等模型进行知识抽取
  • 2023年4月 我们新增了多个模型,包括CP-NER(IJCAI'23)ASP(EMNLP'22)PRGC(ACL'21)PURE(NAACL'21),提供了事件抽取能力(中文和英文),并兼容更高版本的Python包(如Transformers)。
  • 2023年2月 我们支持使用LLM(GPT-3)结合上下文学习(基于EasyInstruct)及数据生成,并新增了NER模型W2NER(AAAI'22)
往期新闻

预测演示

这里有一个预测演示。GIF文件由Terminalizer生成。获取代码


模型框架

  • DeepKE包含一个统一的框架,用于命名实体识别关系抽取属性抽取这三项知识抽取任务。
  • 每项任务都可以在不同的场景下实现。例如,我们可以实现标准低资源(少样本)文档级多模态的关系抽取。
  • 每个应用场景都由三个部分组成:数据,包括分词器、预处理模块和加载器;模型,包括模块、编码器和前向传播组件;核心,包括训练、评估和预测功能。

快速入门

DeepKE-LLM

在大模型时代,DeepKE-LLM采用了全新的环境依赖。

conda create -n deepke-llm python=3.9
conda activate deepke-llm

cd example/llm
pip install -r requirements.txt

请注意,requirements.txt文件位于example/llm文件夹内。

DeepKE-MCP-Tools

我们把MCP(模型调用协议)服务工具集成到DeepKE中,使大型语言模型(LLMs)能够作为工具调用者,对轻量级模型进行知识抽取。

  • MCP服务已经部署完毕,可通过URL访问。
  • 如需本地部署,请参考README,了解详细的操作步骤。

DeepKE

  • DeepKE 支持使用 pip install deepke 进行安装。
    以完全监督的关系抽取为例。
  • DeepKE 同时支持手动Docker 镜像两种环境配置方式,您可以选择适合的方式进行搭建。
  • 强烈建议在 Linux 环境中安装 DeepKE。

🔧手动环境配置

步骤1 下载基础代码

git clone --depth 1 https://github.com/zjunlp/DeepKE.git

步骤2 使用 Anaconda 创建虚拟环境并进入该环境。

conda create -n deepke python=3.8

conda activate deepke
  1. 使用源码安装 DeepKE

    pip install -r requirements.txt
    
    python setup.py install
    
    python setup.py develop
    
  2. 使用 pip 安装 DeepKE不推荐!

    pip install deepke
    
    • 请确保 pip 版本 ≤ 24.0

步骤3 进入任务目录

cd DeepKE/example/re/standard

步骤4 下载数据集,或按照标注说明获取数据

wget 121.41.117.246:8080/Data/re/standard/data.tar.gz

tar -xzvf data.tar.gz

支持多种数据格式,具体细节请参见各部分说明。

步骤5 训练(训练参数可在 conf 文件夹中修改)

我们支持通过 wandb 进行可视化调参。

python run.py

步骤6 预测(预测参数可在 conf 文件夹中修改)

predict.yaml 中修改已训练模型的路径。需使用模型的绝对路径,例如 xxx/checkpoints/2019-12-03_ 17-35-30/cnn_ epoch21.pth

python predict.py
  • ❗注意:如果遇到任何问题,请参考提示或提交 GitHub 问题。

🐳使用 Docker 镜像构建

步骤1 安装 Docker 客户端

安装 Docker 并启动 Docker 服务。

步骤2 拉取 Docker 镜像并运行容器

docker pull zjunlp/deepke:latest
docker run -it zjunlp/deepke:latest /bin/bash

剩余步骤与手动环境配置中的步骤3及以后相同。

  • ❗注意:您可以参考提示以加快安装速度

要求

DeepKE

python == 3.8

  • torch>=1.5,<=1.11
  • hydra-core==1.0.6
  • tensorboard==2.4.1
  • matplotlib==3.4.1
  • transformers==4.26.0
  • jieba==0.42.1
  • scikit-learn==0.24.1
  • seqeval==1.2.2
  • opt-einsum==3.3.0
  • wandb==0.12.7
  • ujson==5.6.0
  • huggingface_hub==0.11.0
  • tensorboardX==2.5.1
  • nltk==3.8
  • protobuf==3.20.1
  • numpy==1.21.0
  • ipdb==0.13.11
  • pytorch-crf==0.7.2
  • tqdm==4.66.1
  • openai==0.28.0
  • Jinja2==3.1.2
  • datasets==2.13.2
  • pyhocon==0.3.60

三大功能介绍

1. 命名实体识别

  • 命名实体识别旨在从非结构化文本中识别并分类出预定义类别的命名实体,如人名、组织机构、地点等。

  • 数据存储在 .txt 文件中。以下是一些示例(用户可以使用 DoccanoMarkTool 等工具进行标注,也可以利用 DeepKE 的弱监督方法自动获取数据):

    句子 人名 地点 组织机构
    本报北京9月4日讯记者杨涌报道:部分省区人民日报宣传发行工作座谈会9月3日在4日在京举行。 杨涌 北京 人民日报
    《红楼梦》由王扶林导演,周汝昌、王蒙、周岭等多位专家参与制作。 王扶林,周汝昌,王蒙,周岭
    秦始皇兵马俑位于陕西省西安市,是世界八大奇迹之一。 秦始皇 陕西省,西安市
  • 详细流程请参阅具体的 README:

    • STANDARD(完全监督)

      我们支持 LLM,并提供了现成的模型DeepKE-cnSchema-NER,无需训练即可提取 cnSchema 中的实体。

      步骤1 进入 DeepKE/example/ner/standard 目录,下载数据集。

      wget 121.41.117.246:8080/Data/ner/standard/data.tar.gz
      
      tar -xzvf data.tar.gz
      

      步骤2 训练

      数据集和参数可分别在 data 文件夹和 conf 文件夹中自定义。

      python run.py
      

      步骤3 预测

      python predict.py
      
    • FEW-SHOT(少样本学习)

      步骤1 进入 DeepKE/example/ner/few-shot 目录,下载数据集。

      wget 121.41.117.246:8080/Data/ner/few_shot/data.tar.gz
      
      tar -xzvf data.tar.gz
      

      步骤2 在低资源条件下进行训练

      模型加载和保存的目录以及配置参数均可在 conf 文件夹中自定义。

      python run.py +train=few_shot
      

      用户可以在 conf/train/few_shot.yaml 中修改 load_path 以使用已加载的模型。

      步骤3conf/config.yaml 中添加 - predict,并在 conf/predict.yaml 中将 loda_path 修改为模型路径,write_path 修改为预测结果保存路径,然后运行 python predict.py

      python predict.py
      
    • MULTIMODAL(多模态)

      步骤1 进入 DeepKE/example/ner/multimodal 目录,下载数据集。

      wget 121.41.117.246:8080/Data/ner/multimodal/data.tar.gz
      
      tar -xzvf data.tar.gz
      

      我们使用 RCNN 检测到的物体以及原始图像中的视觉定位对象作为视觉局部信息,其中 RCNN 通过 faster_rcnn 实现,视觉定位则通过 onestage_grounding 完成。

      步骤2 在多模态设置下进行训练

      • 数据集和参数可分别在 data 文件夹和 conf 文件夹中自定义。
      • 从上次训练的模型开始:将 conf/train.yaml 中的 load_path 修改为上次保存的模型路径。同时,训练日志的保存路径可通过 log_dir 自定义。
      python run.py
      

      步骤3 预测

      python predict.py
      

2. 关系抽取

  • 关系抽取是从非结构化文本中提取实体间语义关系的任务。

  • 数据存储在 .csv 文件中。部分示例如下(用户可以使用 DoccanoMarkTool 等工具对数据进行标注,也可以借助 DeepKE 的 弱监督方法 自动获取数据):

    句子 关系 头实体 头实体偏移量 尾实体 尾实体偏移量
    《岳父也是爹》是王军执导的电视剧,由马恩然、范明主演。 导演 岳父也是爹 1 王军 8
    《九玄珠》是在纵横中文网连载的一部小说,作者是龙马。 连载网站 九玄珠 1 纵横中文网 7
    提起杭州的美景,西湖总是第一个映入脑海的词语。 所在城市 西湖 8 杭州 2
  • !注意:如果一个关系涉及多种实体类型,可以在输入时将实体类型与关系名称前缀组合。

  • 详细流程请参阅相应的 README 文件。

    • 标准模式(全监督)

      我们支持大模型,并提供了现成的模型 DeepKE-cnSchema-RE,无需训练即可在 cnSchema 上抽取关系。

      步骤1 进入 DeepKE/example/re/standard 文件夹,下载数据集。

      wget 121.41.117.246:8080/Data/re/standard/data.tar.gz
      
      tar -xzvf data.tar.gz
      

      步骤2 训练

      数据集和参数可分别在 data 文件夹和 conf 文件夹中进行自定义。

      python run.py
      

      步骤3 预测

      python predict.py
      
    • 少样本学习

      步骤1 进入 DeepKE/example/re/few-shot,下载数据集。

      wget 121.41.117.246:8080/Data/re/few_shot/data.tar.gz
      
      tar -xzvf data.tar.gz
      

      步骤2 训练

      • 数据集和参数可分别在 data 文件夹和 conf 文件夹中进行自定义。
      • 如果上次训练过模型,可在 conf/train.yaml 中将 train_from_saved_model 修改为上次保存的模型路径;同时可通过 log_dir 自定义训练日志的保存路径。
      python run.py
      

      步骤3 预测

      python predict.py
      
    • 文档级关系抽取

      步骤1 进入 DeepKE/example/re/document,下载数据集。

      wget 121.41.117.246:8080/Data/re/document/data.tar.gz
      
      tar -xzvf data.tar.gz
      

      步骤2 训练

      • 数据集和参数可分别在 data 文件夹和 conf 文件夹中进行自定义。
      • 如果上次训练过模型,可在 conf/train.yaml 中将 train_from_saved_model 修改为上次保存的模型路径;同时可通过 log_dir 自定义训练日志的保存路径。
      python run.py
      

      步骤3 预测

      python predict.py
      
    • 多模态关系抽取

      步骤1 进入 DeepKE/example/re/multimodal,下载数据集。

      wget 121.41.117.246:8080/Data/re/multimodal/data.tar.gz
      
      tar -xzvf data.tar.gz
      

      我们利用 RCNN 检测到的物体以及从原始图像中获得的视觉定位信息作为视觉局部特征,其中 RCNN 使用 faster_rcnn,视觉定位则采用 onestage_grounding

      步骤2 训练

      • 数据集和参数可分别在 data 文件夹和 conf 文件夹中进行自定义。
      • 如果上次训练过模型,可在 conf/train.yaml 中将 load_path 修改为上次保存的模型路径;同时可通过 log_dir 自定义训练日志的保存路径。
      python run.py
      

      步骤3 预测

      python predict.py
      

3. 属性抽取

  • 属性抽取是从非结构化文本中提取实体属性的过程。

  • 数据存储在 .csv 文件中。部分示例如下:

    句子 属性 实体 实体偏移量 值偏移量
    张冬梅,女,汉族,1968年2月生,河南淇县人 民族 张冬梅 0 汉族 6
    诸葛亮,字孔明,三国时期杰出的军事家、文学家、发明家。 朝代 诸葛亮 0 三国时期 8
    2014年10月1日许鞍华执导的电影《黄金时代》上映 上映时间 黄金时代 19 2014年10月1日 0
  • 详细流程请参阅相应的 README 文件。

    • 标准模式(全监督)

      步骤1 进入 DeepKE/example/ae/standard 文件夹,下载数据集。

      wget 121.41.117.246:8080/Data/ae/standard/data.tar.gz
      
      tar -xzvf data.tar.gz
      

      步骤2 训练

      数据集和参数可分别在 data 文件夹和 conf 文件夹中进行自定义。

      python run.py
      

      步骤3 预测

      python predict.py
      

4. 事件抽取

  • 事件抽取是从非结构化文本中提取事件类型、事件触发词和事件论元的任务。
  • 数据存储在 .tsv 文件中,部分实例如下:
句子 事件类型 事件触发词 论元角色 论元
据《欧洲时报》报道,当地时间27日,法国巴黎卢浮宫博物馆员工因不满工作条件恶化而罢工,导致该博物馆也因此闭门谢客一天。 组织行为-罢工 罢工 罢工人员 法国巴黎卢浮宫博物馆员工
时间 当地时间27日
所属组织 法国巴黎卢浮宫博物馆
中国外运2019年上半年归母净利润增长17%:收购了少数股东股权 财经/交易-出售/收购 收购 出售方 少数股东
收购方 中国外运
交易物 股权
美国亚特兰大航展13日发生一起表演机坠机事故,飞行员弹射出舱并安全着陆,事故没有造成人员伤亡。 灾害/意外-坠机 坠机 时间 13日
地点 美国亚特兰
  • 详细流程请参阅具体的 README 文件。

    • STANDARD(完全监督)

      步骤1 进入 DeepKE/example/ee/standard 文件夹。下载数据集。

      wget 121.41.117.246:8080/Data/ee/DuEE.zip
      unzip DuEE.zip
      

      步骤2 训练

      数据集和参数可以分别在 data 文件夹和 conf 文件夹中进行自定义。

      python run.py
      

      步骤3 预测

      python predict.py
      

小贴士

1.使用最近的镜像, 在中国,清华大学 的镜像会加快 Anaconda 的安装速度;在中国,阿里云 的镜像会加快 pip install XXX 的速度

2.当遇到 ModuleNotFoundError: No module named 'past' 时,请运行 pip install future

3.在线安装预训练语言模型的速度较慢。建议提前下载预训练模型并将其保存在 pretrained 文件夹中。请阅读每个任务目录下的 README.md 文件,以了解保存预训练模型的具体要求。

4.DeepKE 的旧版本位于 deepke-v1.0 分支。用户可以通过切换分支来使用旧版本。旧版本已完全迁移到标准关系抽取任务中(example/re/standard)。

5.如果您想修改源代码,建议使用包含源代码的方式安装 DeepKE。否则,修改将无法生效。详情请参见 issue

6.更多与低资源知识抽取相关的工作可以在 低资源场景下的知识抽取:综述与展望 中找到。

7.请确保 requirements.txt 中所列依赖项的版本准确无误。

待办事项

在下一版本中,我们计划发布一个更强大的用于知识抽取的大型语言模型。

同时,我们将提供长期维护服务,以 修复漏洞解决各类问题 并满足 新需求。因此,如果您遇到任何问题,请随时向我们提交 issue。

阅读材料

数据高效的知识图谱构建,高效知识图谱构建 (CCKS 2022 教程) [幻灯片]

高效且稳健的知识图谱构建 (AACL-IJCNLP 2022 教程) [幻灯片]

PromptKG 家族:提示学习与知识图谱相关研究工作、工具包和论文列表 [资源]

低资源场景下的知识抽取:综述与展望 [综述][论文列表]

相关工具包

DoccanoMarkToolLabelStudio: 数据标注工具包

LambdaKG: 一个基于预训练语言模型的知识图谱嵌入库及基准测试平台

EasyInstruct: 一个易于使用的框架,用于指导大型语言模型

阅读材料:

数据高效的知识图谱构建,高效知识图谱构建 (CCKS 2022 教程) [幻灯片]

高效且稳健的知识图谱构建 (AACL-IJCNLP 2022 教程) [幻灯片]

PromptKG 家族:提示学习与知识图谱相关研究工作、工具包和论文列表 [资源]

低资源场景下的知识抽取:综述与展望 [综述][论文列表]

相关工具包:

DoccanoMarkToolLabelStudio: 数据标注工具包

LambdaKG: 一个基于预训练语言模型的知识图谱嵌入库及基准测试平台

EasyInstruct: 一个易于使用的框架,用于指导大型语言模型

引用

如果您在工作中使用了 DeepKE,请引用我们的论文:

@inproceedings{EMNLP2022_Demo_DeepKE,
  author    = {Ningyu Zhang and
               Xin Xu and
               Liankuan Tao and
               Haiyang Yu and
               Hongbin Ye and
               Shuofei Qiao and
               Xin Xie and
               Xiang Chen and
               Zhoubo Li and
               Lei Li},
  editor    = {Wanxiang Che and
               Ekaterina Shutova},
  title     = {DeepKE: {A} Deep Learning Based Knowledge Extraction Toolkit for Knowledge Base Population},
  booktitle = {{EMNLP} (Demos)},
  pages     = {98--108},
  publisher = {Association for Computational Linguistics},
  year      = {2022},
  url       = {https://aclanthology.org/2022.emnlp-demos.10}
}

贡献者

Ningyu Zhang, Haofen Wang, 黄飞, 熊飞宇, 陶连宽, 徐欣, 桂洪浩, 张振儒, 谭传奇, 陈强, 王晓涵, 席泽坤, 李新荣, 于海洋, 叶洪斌, 乔硕飞, 王鹏, 朱宇琪, 谢鑫, 陈翔, 李周波, 李磊, 梁晓专, 姚云志, 陈静, 朱宇琪, 罗雨洁, 邓淑敏, 张文, 郑国洲, 陈华军

社区贡献者:沈硕、邵周天、胡伟、thredreamseltociear、徐子文、黄睿、翁小龙

其他知识抽取开源项目

版本历史

2.2.72023/09/21
2.2.62023/08/05
2.2.42023/06/28
2.2.12023/04/14
2.22023/04/04
2.1.22023/01/01
2.1.12022/11/17
2.1.02022/08/28
2.0.22022/04/12

常见问题

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手,旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚,能够直接接入你日常使用的各类通讯渠道,包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息,OpenClaw 都能即时响应,甚至支持在 macOS、iOS 和 Android 设备上进行语音交互,并提供实时的画布渲染功能供你操控。 这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地,用户无需依赖云端服务即可享受快速、私密的智能辅助,真正实现了“你的数据,你做主”。其独特的技术亮点在于强大的网关架构,将控制平面与核心助手分离,确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者,以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力(支持 macOS、Linux 及 Windows WSL2),即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

349.3k|★★★☆☆|4天前
Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。

162.1k|★★★☆☆|5天前
开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上

149.5k|★★☆☆☆|今天
开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。

108.3k|★★☆☆☆|今天
开发框架图像Agent

gemini-cli

gemini-cli 是一款由谷歌推出的开源 AI 命令行工具,它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言,它提供了一条从输入提示词到获取模型响应的最短路径,无需切换窗口即可享受智能辅助。 这款工具主要解决了开发过程中频繁上下文切换的痛点,让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用,还是执行复杂的 Git 操作,gemini-cli 都能通过自然语言指令高效处理。 它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口,具备出色的逻辑推理能力;内置 Google 搜索、文件操作及 Shell 命令执行等实用工具;更独特的是,它支持 MCP(模型上下文协议),允许用户灵活扩展自定义集成,连接如图像生成等外部能力。此外,个人谷歌账号即可享受免费的额度支持,且项目基于 Apache 2.0 协议完全开源,是提升终端工作效率的理想助手。

100.8k|★★☆☆☆|昨天
插件Agent图像

markitdown

MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具,专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片(含 OCR)、音频(含语音转录)、HTML 乃至 YouTube 链接等多种格式的解析,能够精准提取文档中的标题、列表、表格和链接等关键结构信息。 在人工智能应用日益普及的今天,大语言模型(LLM)虽擅长处理文本,却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点,它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式,成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外,它还提供了 MCP(模型上下文协议)服务器,可无缝集成到 Claude Desktop 等 LLM 应用中。 这款工具特别适合开发者、数据科学家及 AI 研究人员使用,尤其是那些需要构建文档检索增强生成(RAG)系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性,但其核心优势在于为机器

93.4k|★★☆☆☆|4天前
插件开发框架