awesome-anomaly-detection

2.9k 512 困难 1 次阅读 3天前开发框架

AI 解读由 AI 自动生成，仅供参考

awesome-anomaly-detection 是一份精心整理的异常检测资源清单，旨在为相关领域的探索者提供一站式指引。它主要解决的是如何从海量数据中识别出不符合预期行为的“异常点”这一核心难题，涵盖了时间序列、图像及视频等多种数据类型的应用场景。无论是工业制造中的缺陷筛查、金融交易里的欺诈预警，还是系统运维时的故障诊断，这份清单都能帮助用户快速定位前沿的解决方案。

该资源特别适合人工智能研究人员、算法工程师以及数据科学家使用。对于刚入门的新手，它清晰梳理了异常检测（Anomaly Detection）、新颖性检测（Novelty Detection）与离群点检测（Outlier Detection）等易混淆概念的细微差别；对于资深从业者，它则汇总了从经典机器学习到最新深度学习架构的高质量综述论文与实战项目，包括针对单分类问题和分布外检测的专门研究。

awesome-anomaly-detection 的独特亮点在于其结构化的分类体系，将资源按时间序列、视频级、图像级（含分类、分割及分布外检测）进行细致划分，并持续收录 arXiv 上的最新学术成果。虽然它本身不是一个可直接运行的软件库，但作为连接理论与实践的桥梁，它能极大缩短技术调研周期，是构建高效异常检测系统不可或缺的导航图。

使用场景

某智能制造工厂的算法团队正致力于构建一套基于视觉的产线缺陷检测系统，需要从海量论文中筛选出适合处理“无缺陷样本训练、有缺陷样本未知”这一单分类问题的最佳模型。

没有 awesome-anomaly-detection 时

资源搜集如大海捞针：工程师需在 Google Scholar 和 arXiv 上手动搜索"Anomaly Detection"、"Novelty Detection"、"Out-of-Distribution"等多个异构术语，极易遗漏关键文献。
技术选型缺乏方向：面对时间序列、图像分类、像素级分割等不同任务类型，难以快速定位到针对特定数据类型（如视频流或静态图）的专用算法列表。
复现成本高昂：找到的论文往往缺少官方代码链接或对比基准，团队需花费数周时间验证算法是否支持无监督学习模式，导致项目启动严重滞后。
概念认知模糊：团队成员对“异常检测”与“新奇性检测”的细微差别理解不一，导致初期技术方案设计偏离实际业务需求（如误用有监督模型）。

使用 awesome-anomaly-detection 后

一站式资源聚合：直接获取按时间序列、视频级、图像级及分割任务分类的精选清单，瞬间掌握从经典 LSTM 到最新 Deep One-Class Classification 的核心资源。
精准匹配业务场景：利用目录结构快速锁定“图像异常分割”板块，直接找到适用于制造缺陷定位的 SOTA 模型，大幅缩短技术调研周期。
高效落地验证：每个条目均附带论文 PDF 及代码库链接，团队可立即复现基准模型，将原本数周的预研工作压缩至几天内完成。
统一技术语言：通过清晰的术语定义和分类图示，团队迅速对齐了对无监督异常检测的认知，确保了技术方案紧扣“仅用正常数据训练”的核心约束。

awesome-anomaly-detection 通过将分散的学术成果结构化，帮助工业界开发者在复杂的异常检测领域中快速完成从理论调研到模型落地的闭环。

运行环境要求

GPU

未说明

内存

未说明

依赖

notes该仓库是一个异常检测资源的精选列表（Awesome List），主要包含论文链接、项目主页和部分代码库的引用，本身不是一个可直接运行的单一软件工具。因此，README 中未提供具体的操作系统、GPU、内存、Python 版本或依赖库的安装需求。具体的环境要求需参考列表中各个独立项目（如 ALOCC, DeepAnT, MIDAS 等）各自的源代码仓库。

python未说明

快速开始

优秀的异常检测

一份精心整理的优秀异常检测资源列表。灵感来源于 awesome-architecture-search 和 awesome-automl。

最后更新：2021年11月22日

什么是异常检测？

异常检测是一种用于识别不符合预期行为的异常模式的技术，这些模式被称为离群点。通常，这被视为一个无监督学习问题，其中异常样本在事前并不已知，并且假设训练数据集的大部分由“正常”数据组成（在此及其他地方，“正常”一词意为 非异常，与高斯分布无关）。[Lukas Ruff 等人，2018；深度单类分类]

一般来说，异常检测也被称为 新颖性检测 或 离群点检测、伪造检测 和 分布外检测。

每个术语的含义略有不同。大多数情况下，在假设你没有异常数据的前提下，这一问题特别被称为 单类分类、单类分割。

而 新颖性检测 和 离群点检测 的含义又略有不同。下图展示了这两个术语的区别。

此外，目标数据通常有三种类型：(时间序列数据、图像数据、视频数据)
在时间序列数据中，目标是检测异常片段。
在图像和视频数据中，目标则是对异常图像进行分类或分割出异常区域，例如检测制造数据中的缺陷。

综述论文

深度学习在异常检测中的应用：综述 | [arXiv' 19] |[pdf]
深度学习中的异常实例检测：综述 | [arXiv' 20] |[pdf]
深度学习在异常检测中的应用：回顾 | [arXiv' 20] |[pdf]
深度与浅层异常检测的统一综述 | [arXiv' 20] |[pdf]
异常、新颖性、开放集及分布外检测的统一综述：解决方案与未来挑战 | [arXiv' 21] |[pdf]

时间序列异常检测 (还需进一步调研..)

时间序列异常检测 | [论文' 10] |[pdf]
长短期记忆网络在时间序列异常检测中的应用 | [ESANN' 15] |[pdf]
基于LSTM的系统调用语言建模及鲁棒集成方法在主机入侵检测系统设计中的应用 | [arXiv' 16] | [pdf]
时间序列异常检测；在噪声大、高度周期性的数据中利用有限特征和稀疏样本检测异常下降 | [arXiv' 17] | [pdf]
多变量非平稳时间序列中的异常检测用于自动DBMS诊断 | [ICMLA' 17] | [pdf]
真相终将大白：基于进程行为偏离的控制系统隐蔽攻击检测 | [ACM CCS '18] | [pdf]
DeepAnT：一种用于时间序列无监督异常检测的深度学习方法 | [IEEE Access' 18] | [pdf]
微软的时间序列异常检测服务 | [KDD' 19] | [pdf]
基于随机递归神经网络的多变量时间序列鲁棒异常检测 | [KDD' 19] | [pdf]
时间序列深度异常检测方法的系统性评估 | 审稿中 | [代码]
BeatGAN：利用对抗生成的时间序列检测异常节律 | [IJCAI 19] | [pdf]
MIDAS：基于微簇的边缘流异常检测器 | [AAAI' 20] | [pdf] | [代码]
基于时间层次单类网络的时间序列异常检测 | [NeurIPS' 20]
基于平滑诱导的序列变分自编码器的时间序列异常检测 | [TNNLS' 20]

视频级异常检测

基于时空自编码器的视频异常事件检测 | [ISNN' 17] | [pdf]
监控视频中的真实世界异常检测 | [arXiv' 18] | [pdf] [项目页面]
基于背景建模的交通监控无监督异常检测 | [CVPR Workshop' 18] | [pdf]
高性能道路交通异常检测的双模式车辆运动模式学习 | [CVPR Workshop' 18] | [pdf]
不需了解正常状态即可检测异常：一种用于无监督视频异常事件检测的两阶段方法 | [ACMMM' 18] | [链接]
改进视频异常检测的运动感知特征 | [BMVC' 19] | [pdf]
交通视频中基于时间戳的异常检测挑战 | [CVPRW' 19] | [pdf]
学习骨骼轨迹中的规律性以进行视频异常检测 | [CVPR' 19] | [pdf]
图卷积标签噪声清理器：训练即插即用的动作分类器用于异常检测 | [CVPR'19] | [pdf]
用于异常检测的图嵌入姿态聚类 | [CVPR' 20] | [pdf]
用于端到端视频异常检测的自训练深度序数回归 | [CVPR' 20] | [pdf]
用于异常检测的记忆引导正常性学习 | [CVPR' 20] | [pdf]
聚类驱动的深度自编码器用于视频异常检测 | [ECCV' 20] |[pdf]
CLAWS：利用聚类辅助弱监督学习并抑制正常性以进行异常事件检测 | [ECCV' 20] |[pdf]
完形填空助力：通过学习补全视频事件实现有效的视频异常检测 | [ACM MM' 20] | [pdf] | [代码]
使用视频级标签进行异常检测的自我推理框架 | [IEEE SPL' 20] | [pdf]
少样本场景自适应异常检测 | [ECCV' 20]
再次学习记忆引导正常性以进行异常检测 | [Arxiv' 20] | [pdf]
基于鲁棒时序特征幅度学习的弱监督视频异常检测 | [ICCV' 21] | [pdf] | [代码]

图像级异常检测

单类（异常）分类目标

高维分布的支持估计 [OC-SVM] | [神经计算期刊'01] | [pdf]
单类分类的最新趋势综述 | [AICS'09] | [pdf]
基于非线性降维的自编码器异常检测 | [MLSDA研讨会'14] | [链接]
新奇性检测综述 | [信号处理'14] | [链接]
基于变分自编码器的重建概率异常检测 | [SNU DMC技术'15] | [pdf]
基于深度学习的线性单类SVM进行高维大规模异常检测 | [模式识别'16] | [链接]
用于异常检测的迁移表示学习 | [ICML'16] | [pdf]
自编码器集成的离群点检测 | [SDM'17] | [pdf]
子空间并集中的可证明自表示离群点检测 | [CVPR'17] | [pdf]
[ALOCC] 用于新奇性检测的对抗学习单类分类器 | [CVPR'18] | [pdf] [代码]
为单类分类学习深度特征 | [arXiv'18] | [pdf] [代码]
基于GAN的有效异常检测 | [arXiv'18] | [pdf]
视觉目标识别中的层次化新奇性检测 | [CVPR'18] | [pdf]
深度单类分类 | [ICML'18] | [pdf]
可靠解码自编码器潜在空间用于单类学习图像检测场景 | [OAGM研讨会'18] | [pdf]
基于变分自编码器的q-空间新奇性检测 | [arXiv'18] | [pdf]
GANomaly：通过对抗训练的半监督异常检测 | [ACCV'18] | [pdf]
使用几何变换的深度异常检测 | [NIPS'18] | [pdf]
基于生成概率的新奇性检测与对抗自编码器 | [NIPS'18] | [pdf] [代码]
用于校准异常检测的损失框架 | [NIPS'18] | [pdf]
用于分布式聚类和离群点检测的实用算法 | [NIPS'18] | [pdf]
通过矩阵草图实现高效异常检测 | [NIPS'18] | [pdf]
对抗学习的异常检测 | [IEEE ICDM'18] | [pdf]
基于多假设预测的异常检测 | [ICML'19] | [pdf]
探索基于胶囊网络的深度异常检测方法 | [ICMLW'19] | [pdf]
潜在空间自回归用于新奇性检测 | [CVPR'19] | [pdf]
OCGAN：使用具有约束潜伏表示的GAN进行单类新奇性检测 | [CVPR'19] | [pdf]
使用同时编码器训练从污染图像数据中无监督学习异常检测 | [arXiv'19] | [pdf]
使用自监督学习可以提高模型鲁棒性和不确定性 | [NeurIPS'19] | [pdf] [代码]
通过判别网络的内点优先实现有效的端到端无监督离群点检测 | [NeurIPS'19] | [pdf] [代码]
基于分类的一般数据异常检测 | [ICLR'20] | [pdf]
用于无监督异常检测的鲁棒子空间恢复层 | [ICLR'20] | [pdf]
RaPP：沿投影路径重建的新奇性检测 | [ICLR'20] | [pdf]
通过模糊化进行新奇性检测 | [ICLR'20] | [pdf]
深度半监督异常检测 | [ICLR'20] | [pdf]
通过差分隐私实现鲁棒的异常检测和后门攻击检测 | [ICLR'20] | [pdf]
基于分类的一般数据异常检测 | [ICLR'20] | [pdf]
老而弥坚：重新定义对抗学习单类分类器训练范式 | [CVPR'20] | [pdf]
深度端到端单类分类器 | [IEEE TNNLS'20] | [pdf]
具有单纯形插值的镜像自编码器用于无监督异常检测 | [ECCV'20] | [pdf]
用于异常检测的反向传播梯度表示 | [ECCV'20]
CSI：基于分布漂移实例的对比学习进行新奇性检测 | [NeurIPS'20] | [pdf] | [代码]
深度无监督图像异常检测：信息论框架 | [arXiv'20] | [pdf]
正则化注意力网络用于视觉问答中的异常检测 | [AAAI'21] | [pdf]
用于异常检测的属性恢复框架 | [IEEE多媒体汇刊'21] | [pdf]
在预训练深度特征中建模正常数据分布以进行异常检测 | [ICPR'20] | [pdf] | [代码]
紧凑潜在空间下的判别式多级重建用于单类新奇性检测 | [ICPR'20] | [pdf]
通过插值高斯描述符进行深度单类分类 | [arXiv'21] | [pdf] | [代码]
多分辨率知识蒸馏用于异常检测 | [CVPR'21] | [pdf] | [代码]
Elsa：基于能量的学习用于半监督异常检测 | [BMVC'21] | [pdf] | [代码]

分布外(OOD)检测目标

一种用于检测神经网络中误分类和分布外样本的基准方法 | [ICLR' 17] | [pdf]
[ODIN] 提升神经网络中分布外图像检测的可靠性 | [ICLR' 18] | [pdf]
训练置信度校准分类器以检测分布外样本 | [ICLR' 18] | [pdf]
在神经网络中学习用于分布外检测的置信度 | [arXiv' 18] | [pdf]
使用多种语义标签表示进行分布外检测 | [NIPS' 18] | [pdf]
一种简单统一的框架，用于检测分布外样本和对抗攻击 | [NIPS' 18] | [pdf]
用于新奇性和异常检测的度量学习 | [BMVC' 18] | [pdf] [code]
基于离群点暴露的深度异常检测 | [ICLR' 19] | [pdf]
为什么ReLU网络会在远离训练数据的地方产生高置信度预测，以及如何缓解这一问题 | [CVPR' 19] | [pdf]
具有置信度控制的离群点暴露用于分布外检测 | [arXiv' 19] | [pdf] [code]
基于似然比的分布外检测 | [NeurIPS' 19] | [pdf]
使用可分解图模型在列联表中进行离群点检测 | [SJS' 19] | [pdf] [code]
基于似然的生成模型中的输入复杂度与分布外检测 | [ICLR' 20] | [pdf]
软标签会影响深度神经网络的分布外检测 | [ICML Workshop' 20] | [pdf]
广义ODIN：无需从分布外数据中学习即可检测分布外图像 | [CVPR' 20] | [pdf]
一种基于边界的分布外分类器，用于广义零样本学习 | [ECCV' 20] | [pdf]
关于分布外数据检测的可证明最坏情况保证 | [NeurIPS' 20] | [pdf] | [code]
关于分布外测试的价值：古德哈特定律的一个例子 | [NeurIPS' 20] | [pdf]
似然遗憾：变分自编码器的分布外检测分数 | [NeurIPS' 20] | [pdf]
OOD-MAML：用于少样本分布外检测和分类的元学习 | [NeurIPS' 20]
基于能量的分布外检测 | [NeurIPS' 20] | [pdf]
致力于最大化域内与分布外样本之间的表示差距 | [NeurIPS' 20]
为什么归一化流无法检测分布外数据 | [NeurIPS' 20] | [pdf] | [code]
通过分布与特征的层次结构理解基于深度可逆网络的异常检测 | [NeurIPS' 20] | [pdf]
深度生成模型下离群点检测的进一步分析 | [NeurIPS' 20]
CSI：基于对比学习的、针对分布漂移实例的新奇性检测 | [NeurIPS' 20] | [pdf] | [code]
SSD：一种用于自监督离群点检测的统一框架 | [ICLR' 21] [pdf] | [code]

无监督异常分割目标

拥挤场景中的异常检测与定位 | [TPAMI' 14] | [pdf]
基于稀疏表示的图像新奇性检测 | [IEEE IES' 14研讨会] | [链接]
通过卷积稀疏模型检测异常结构 | [IJCNN' 15] | [pdf]
拥挤场景中的实时异常检测与定位 | [CVPR' 15研讨会] | [pdf]
学习用于异常事件检测的外观和运动深度表征 | [BMVC' 15] | [pdf]
基于多尺度组稀疏模型的尺度不变异常检测 | [IEEE ICIP' 16] | [链接]
[AnoGAN] 使用生成对抗网络进行无监督异常检测以指导标记物发现 | [IPMI' 17] | [pdf]
Deep-Anomaly：用于拥挤场景中快速异常检测的全卷积神经网络 | [计算机视觉与图像理解期刊' 17] | [pdf]
使用卷积胜者通吃自编码器进行异常检测 | [BMVC' 17] | [pdf]
基于CNN的自相似性检测纳米纤维材料中的异常 | [Sensors' 17] | [pdf]
纳米纤维材料SEM图像中的缺陷检测 | [IEEE工业信息学汇刊' 17] | [pdf]
使用生成对抗网络检测视频中的异常事件 | [ICIP' 17] | [链接]
基于深度学习的无监督和半监督视频异常检测方法综述 | [arXiv' 18] | [pdf]
通过将结构相似性应用于自编码器改进无监督缺陷分割 | [arXiv' 18] | [pdf]
使用GAN和单类分类器检测与定位卫星图像伪造 | [IS&T EI' 18] | [pdf]
用于脑部MRI图像无监督异常分割的深度自编码模型 | [arXiv' 18] | [pdf]
AVID：对抗性视觉不规则检测 | [arXiv' 18] |[pdf]
MVTec AD——一个全面的真实世界无监督异常检测数据集 | [CVPR' 19] | [pdf]
利用解剖分割的认知不确定性进行视网膜OCT中的异常检测 | [IEEE TMI' 19] | [pdf]
无知的学生：基于判别潜在嵌入的学生-教师异常检测 | [CVPR' 20] | [pdf]
注意力引导的图像异常检测与定位 | [ECCV' 20] | [pdf]
使用P-Net编码结构-纹理关系以进行视网膜图像异常检测 | [ECCV' 20]
基于深度金字塔对应关系的子图像异常检测 | [arXiv' 20] | [pdf] | [代码]
Patch SVDD，用于异常检测与分割的补丁级SVDD | [arXiv' 20] | [pdf] | [代码]
通过深度特征重建进行无监督异常分割 | [Neurocomputing' 20]| [pdf] | [代码]
PaDiM：用于异常检测与定位的补丁分布建模框架 | [ICPR IML研讨会' 20]| [pdf] | [代码]
可解释的深度单类分类 | [ICLR' 21]| [pdf] | [代码]
用于高效无监督异常分割的半正交嵌入 | [arXiv' 21] [pdf]
针对医学图像的无监督异常检测与定位的约束对比分布学习 | [MICCAI' 21]| [pdf] | [代码]
多分辨率知识蒸馏用于异常检测 | [CVPR' 21]| [pdf]

联系与反馈

如果您对论文有任何建议，欢迎随时给我发邮件 :)

awesome-anomaly-detection 快速上手指南

awesome-anomaly-detection 并非一个可直接安装的单一软件包或库，而是一个精选的资源列表（Curated List），汇集了异常检测（Anomaly Detection）领域的论文、数据集、代码实现和技术综述。本指南将帮助开发者如何利用该列表快速入门并找到适合的工具。

环境准备

由于该仓库包含指向不同深度学习框架（如 PyTorch, TensorFlow）和具体算法实现的链接，建议准备以下通用开发环境：

操作系统: Linux (推荐 Ubuntu 18.04+), macOS 或 Windows (WSL2)
编程语言: Python 3.7 或更高版本
核心依赖:
- git: 用于克隆仓库和获取具体项目的代码
- pip 或 conda: 用于管理 Python 包
深度学习框架 (根据你选择的具体论文代码而定，通常需具备):
- PyTorch 或 TensorFlow
- CUDA & cuDNN (如需 GPU 加速)

提示: 国内开发者建议使用清华源或阿里源加速 pip/conda 包的下载。

安装步骤

本项目本身是一个文档集合，无需通过 pip install 安装。你需要克隆仓库以获取资源索引，然后根据需求去获取具体算法的代码。

克隆仓库 使用 git 将资源列表下载到本地：

git clone https://github.com/lukasruff/awesome-anomaly-detection.git
cd awesome-anomaly-detection

浏览与选择目标项目 打开目录中的 README.md 文件（或使用 Markdown 阅读器），根据你的数据类型查找对应章节：
- Time-series: 时间序列异常检测
- Video-level: 视频级异常检测
- Image-level: 图像级异常检测 (含分类、OOD 检测、分割)
获取具体算法代码 在列表中找到感兴趣的论文条目，点击其对应的 [code] 链接（通常指向 GitHub 仓库）。例如，若对 ALOCC 感兴趣：
```
# 示例：克隆具体的 ALOCC 算法仓库
git clone https://github.com/khalooei/ALOCC-CVPR2018.git
cd ALOCC-CVPR2018
```
安装具体项目的依赖 进入具体算法的目录后，按照该项目自带的 requirements.txt 或 setup.py 进行安装。国内用户推荐使用镜像源：
```
# 使用清华源安装依赖
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
```

基本使用

由于这是一个资源索引，"使用"的核心在于复现列表中推荐的算法。以下以通用的工作流为例，展示如何利用该列表找到一个模型并运行：

1. 确定任务类型

假设你需要处理工业缺陷检测（属于图像级异常分割），在列表中定位到 Image-level anomaly detection -> Anomaly Segmentation target。

2. 选择并下载模型

选择一个带有 [code] 标记且维护较好的项目（例如基于 GAN 或 Autoencoder 的方法）。

# 假设选择了某个开源实现
git clone <项目仓库地址>
cd <项目目录>

3. 准备数据

大多数异常检测算法采用无监督学习（Unsupervised Learning），训练时仅使用“正常”样本。

将正常样本放入 train/normal 目录。
将测试样本（含异常）放入 test 目录。
注：具体目录结构需参考所选项目的 README。

4. 运行训练与推理

执行该项目提供的训练脚本。以下是一个典型的 PyTorch 项目运行示例（命令因项目而异）：

# 训练模型 (仅使用正常数据)
python train.py --data_path ./data/train --model_type autoencoder

# 进行异常检测推理
python test.py --data_path ./data/test --checkpoint ./logs/best_model.pth

5. 查看结果

输出通常包含异常分数（Anomaly Score）或热力图（Heatmap），用于标识输入数据中的异常区域或离群点。

进阶建议:

对于初学者，建议先阅读列表顶部的 Survey Paper（综述论文），如 Deep Learning for Anomaly Detection: A Survey，以建立理论框架。
关注列表中标记为 [arXiv' 20] 或更新年份的项目，通常代表较新的 SOTA（State-of-the-Art）方法。

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

★ 349.3k|★★★☆☆|昨天

Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|昨天

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 142.7k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 107.9k|★★☆☆☆|今天

开发框架图像Agent

markitdown

MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器

★ 93.4k|★★☆☆☆|今天

插件开发框架

LLMs-from-scratch

LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目，旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型（LLM）。它不仅是同名技术著作的官方代码库，更提供了一套完整的实践方案，涵盖模型开发、预训练及微调的全过程。该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型，却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码，用户能够透彻掌握 Transformer 架构、注意力机制等关键原理，从而真正理解大模型是如何“思考”的。此外，项目还包含了加载大型预训练权重进行微调的代码，帮助用户将理论知识延伸至实际应用。 LLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API，而是渴望探究模型构建细节的技术人员而言，这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计：将复杂的系统工程拆解为清晰的步骤，配合详细的图表与示例，让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础，还是为未来研发更大规模的模型做准备

★ 90.1k|★★★☆☆|今天

语言模型图像Agent