Surface-Defect-Detection

GitHub
4k 598 中等 1 次阅读 2天前MIT图像数据工具开发框架
AI 解读 由 AI 自动生成,仅供参考

Surface-Defect-Detection 是一个专注于工业表面缺陷检测领域的开源资源库,旨在汇集该方向最重要的公开数据集与核心学术论文。随着机器视觉在 3C、汽车、半导体等制造业中逐步取代人工质检,如何精准识别微小瑕疵成为关键挑战。本项目正是为了解决这一痛点而生,它系统整理了自 2017 年以来的关键研究成果,并针对“小样本训练难”和“实时检测要求高”等行业共性难题提供了丰富的数据支持与理论参考。

资源库不仅涵盖了如 NEU-CLS 钢材表面缺陷等经典数据集,还提供了便捷的下载渠道,帮助使用者快速构建训练环境。对于任务需求,它清晰地将缺陷检测划分为分类(是什么)、定位(在哪里)和分割(有多少)三个层级,便于用户按需探索。无论是从事算法研发的工程师、深耕计算机视觉的研究人员,还是希望了解工业 AI 落地场景的技术决策者,都能从中获得极具价值的素材。通过持续更新的高质量内容,Surface-Defect-Detection 致力于降低行业入门门槛,推动深度学习技术在工业质检场景中的高效应用。

使用场景

某汽车零部件质检团队正致力于升级产线,利用机器视觉自动识别金属冲压件表面的划痕、凹坑等微小缺陷。

没有 Surface-Defect-Detection 时

  • 数据收集困难:团队需耗费数周时间在全球各大网站零散搜索工业缺陷数据集,且难以验证数据的权威性与标注质量。
  • 算法选型迷茫:面对层出不穷的深度学习论文,工程师缺乏系统性的综述指引,难以快速定位适合小样本或实时检测的关键算法。
  • 冷启动成本高:从零复现经典模型(如针对钢材表面的 NEU-CLS 基准测试)需要大量调试时间,导致项目初期进度严重滞后。
  • 场景适配性差:自行设计的成像方案往往因缺乏行业参考,导致光照不均或缺陷特征不明显,模型训练效果大打折扣。

使用 Surface-Defect-Detection 后

  • 一站式获取资源:直接下载该项目整合的 Google Drive/百度云高质量开源数据集(如 Severstal 钢铁缺陷库),立即启动模型训练。
  • 精准锁定前沿技术:通过项目整理的 2017 年至今的核心论文集,快速掌握解决“小样本”和“实时性”痛点的 SOTA 方案。
  • 加速基线构建:基于项目中提供的成熟分类、定位及分割任务基准,团队在两天内便完成了首个高精度验证模型的部署。
  • 优化成像策略:参考项目中关于不同材质表面成像特性的总结,迅速调整产线光源布局,显著提升了缺陷图像的对比度与清晰度。

Surface-Defect-Detection 通过聚合全球顶尖的数据与学术成果,将工业缺陷检测项目的研发周期从数月缩短至数周,成为连接理论研究与落地应用的高效桥梁。

运行环境要求

GPU

未说明

内存

未说明

依赖
notes该项目主要是一个表面缺陷检测的数据集和论文综述仓库,README 中未提供具体的代码运行环境、依赖库或安装指南。文中提到了深度学习中的小样本问题和实时性问题,并列举了多个数据集(如 NEU-CLS, elpv-dataset 等)的下载链接,但未包含可执行模型的特定硬件或软件版本要求。
python未说明
Surface-Defect-Detection hero image

快速开始

英文 | 简体中文

表面缺陷检测:数据集与论文 📌

GitHub Computer Vision in Action License Open Collective Forks Stars

📈 不断总结表面缺陷研究领域中具有重要意义的开源数据集和关键论文。 自2017年以来的重要关键论文已被收集并整理,可在 :open_file_folder: [Papers] 文件夹中查看。 🐋


数据集下载: Google Drive Google Drive | Baidu Cloud 百度云盘 o7p5

引言

目前,基于机器视觉的表面缺陷检测设备已广泛取代人工目视检查,应用于多个工业领域,包括3C、汽车、家电、机械制造、半导体与电子、化工、制药、航空航天、轻工等行业。传统的基于机器视觉的表面缺陷检测方法通常采用常规图像处理算法或人工设计特征结合分类器。一般来说,成像方案会根据被检表面或缺陷的不同特性来设计,合理的成像方案有助于获得光照均匀且能清晰反映物体表面缺陷的图像。近年来,许多基于深度学习的缺陷检测方法也在各类工业场景中得到广泛应用。

相较于计算机视觉中的清晰分类、检测和分割任务,表面缺陷检测的需求则更为通用。实际上,其需求可分为三个不同层次:“是什么缺陷”(分类)、“在哪里缺陷”(定位)以及“有多少缺陷”(计数)。

*** 本项目会持续更新,右上角收藏防丢失 Star :star: ~ ***

Star 防丢

喜欢这个项目吗?请考虑 :heart: 赞助本项目 以帮助长期维护!

目录

1. 表面缺陷检测中的关键问题

1)小样本问题

当前深度学习方法已被广泛应用于各类计算机视觉任务中,而表面缺陷检测通常被视为其在工业领域的具体应用之一。按照传统认知,深度学习方法难以直接应用于表面缺陷检测的原因在于,在真实的工业环境中,可用于训练的缺陷样本数量极其有限。

与ImageNet数据集中超过1400万张样本数据相比,表面缺陷检测所面临的核心问题正是小样本问题。在许多实际工业场景中,甚至只有寥寥几张或几十张缺陷图像。事实上,针对这一工业表面缺陷检测中的关键问题,目前主要有四种解决方案:

- 数据增强与生成

最常用的缺陷图像扩充方法是在原始缺陷样本上应用多种图像处理操作,如镜像、旋转、平移、扭曲、滤波和对比度调整等,从而生成更多样本。另一种更为常见的方法是数据合成,即将单个缺陷特征融合并叠加到正常(无缺陷)样本上,以形成带有缺陷的样本。

- 网络预训练与迁移学习

一般来说,使用少量样本训练深度学习网络容易导致过拟合,因此基于网络预训练或迁移学习的方法是目前处理小样本问题时最常用的方式之一。

- 合理的网络结构设计

通过设计合理的网络结构,也可以大幅降低对样本的需求。例如,基于压缩采样定理对小样本数据进行压缩与扩展,并利用卷积神经网络直接对压缩后的采样特征进行分类。相较于原始图像输入,压缩输入能够显著减少网络对样本的需求。此外,基于孪生网络的表面缺陷检测方法也可视为一种特殊的网络设计,同样能大幅降低对样本的需求。

- 无监督或半监督方法

在无监督模型中,仅使用正常样本进行训练,因此无需缺陷样本。而半监督方法则可以在仅有少量标注样本的情况下,利用未标注样本解决网络训练问题。

👆 返回目录 -->

2)实时性问题

基于深度学习的缺陷检测方法在工业应用中主要包括三个环节:数据标注模型训练模型推理。而在实际工业应用中,实时性主要关注的是模型推理阶段。目前,大多数缺陷检测方法更注重分类或识别的准确性,而对模型推理效率的关注相对较少。加速模型运行的方法有很多,例如模型量化和剪枝等。此外,尽管现有的深度学习模型普遍采用GPU作为通用计算单元(GPGPU),但随着技术的发展,FPGA被认为将成为一个极具吸引力的替代方案。

👆 返回目录 -->

2. 工业表面缺陷检测常用数据集

1)钢铁表面:NEU-CLS

NEU-CLS可用于分类和定位任务。

最新访问 🔗 - (#16)

由东北大学(NEU)发布的表面缺陷数据集收录了热轧钢带的六种典型表面缺陷,分别为氧化铁皮(RS)、斑块(Pa)、裂纹(Cr)、麻点表面(PS)、夹杂物(In)和划痕(Sc)。该数据集包含1,800张灰度图像,每种典型的表面缺陷各有300个样本。对于缺陷检测任务,数据集提供了标注信息,标明了每张图像中缺陷的类别和位置。对于每种缺陷,黄色框表示其边界位置,绿色标签则为类别得分。

Kaggle - Severstal:钢铁缺陷检测

Severstal:钢铁缺陷检测

Severstal公司在高效钢铁开采和生产方面处于领先地位。他们认为,冶金行业的未来需要在经济、生态和社会等多个层面同步发展,并且高度重视企业社会责任。该公司最近建立了国内最大的工业数据湖,存储了此前被废弃的数PB级数据。如今,Severstal正借助机器学习技术来提升自动化水平、提高生产效率并确保产品质量。

https://www.kaggle.com/c/severstal-steel-defect-detection


👆 返回目录 -->

2)太阳能电池板:elpv-dataset

从太阳能组件的EL图像中提取的功能性和缺陷性太阳能电池数据集。


该数据集包含2,624个样本,均为300×300像素、8位灰度图像,涵盖了来自44个不同太阳能组件的功能性和不同程度退化的缺陷性太阳能电池。标注中的缺陷分为内在型和外在型两类,已知会降低太阳能组件的发电效率。

所有图像均经过尺寸和视角的归一化处理。此外,在提取太阳能电池之前,还去除了拍摄EL图像时相机镜头造成的任何畸变。


👆 返回目录 -->

3)金属表面:KolektorSDD

该数据集由Kolektor集团提供并标注的有缺陷电枢换向器图像构成。具体而言,在电枢换向器的塑料封装表面观察到了微观裂纹或裂缝。每个换向器的表面被分割成八张不重叠的图像进行拍摄,所有图像均在受控环境中采集。


数据集包含:

  • 50个实物样本(有缺陷的电枢换向器)
  • 每个样本8个表面
  • 共计399张图像:
    -- 52张可见缺陷的图像
    -- 347张无缺陷的图像
  • 原始图像尺寸:
    -- 宽度:500像素
    -- 高度:1240至1270像素
  • 用于训练和评估的图像应调整为512×1408像素。

对于每个样本,缺陷仅在至少一张图像中可见;其中两个样本在两张图像上有缺陷,因此共有52张图像显示了缺陷。其余347张图像则作为无缺陷的负例。


👆 返回目录 -->

4)PCB检测:DeepPCB

     
测试图像示例                                         对应的模板图像

图1. PCB检测数据集。


👆 返回目录 -->

5)织物缺陷数据集:AITEX

该数据集包含245张4096×256像素的图像,涵盖了七种不同的织物结构。数据集中有140张无缺陷图像,每种织物各20张。此外,还有105张不同类型的织物缺陷图像(共12种),这些缺陷是纺织行业中常见的类型。图像的高分辨率允许用户使用不同的窗口大小,从而增加样本数量。在线数据集还包含了所有缺陷图像的分割掩膜,其中白色像素表示缺陷区域,其余部分为黑色。


👆 返回目录 -->

6)织物缺陷数据集(天池)

在实际的布料生产过程中,由于各种因素的影响,会出现污渍、破洞、毛絮等缺陷。为了保证产品质量,必须对布料进行缺陷检测。

织物缺陷检测是纺织工业生产和质量管理中的重要环节。目前,人工检测容易受到主观因素影响且一致性较差,长时间在强光下工作的检测人员视力也会受到很大影响。由于织物缺陷种类繁多、形态变化复杂,且难以观察和识别,因此织物缺陷的智能检测一直是困扰该行业的技术瓶颈多年的问题。

本数据集涵盖了纺织行业中各类重要的织物缺陷,每张图片都包含一个或多个缺陷。数据包括两种类型的平纹布和花式布。其中,约8000张平纹布数据用于初赛匹配,约12000张花式布数据用于半决赛。


👆 返回目录 -->

7)铝型材表面缺陷数据集(天池)

在铝型材的实际生产过程中,由于多种因素的影响,其表面会出现裂纹、剥落、划痕等缺陷,这将严重影响铝型材的质量。为确保产品质量,需要进行人工目视检查。然而,铝型材表面本身存在纹理,这些纹理与缺陷往往难以区分。

传统的手工目视检查方法存在诸多不足,不仅工作量大、无法及时准确判断表面缺陷,而且质量检测效率也难以控制。近年来,深度学习在图像识别等领域取得了快速发展。铝型材生产企业迫切希望利用最新的AI技术来革新现有的质量检测流程,自动完成质检任务,减少漏检现象,从而提高产品质量。借助AI技术,尤其是深度学习,铝型材生产管理者可以彻底摆脱对产品表面质量状况无法全面掌握的困境。

本次竞赛的数据集中包含了1万张来自实际生产中存在缺陷的铝型材监控图像,每张图像都包含一个或多个缺陷。用于机器学习的样本图像将明确标注图像中所含缺陷的类型。


👆 返回目录 -->

8)面向工业光学检测的弱监督学习(DAGM 2007)


数据集介绍:

  • 主要针对具有纹理背景上的各类缺陷。

  • 训练数据采用较弱的监督方式。

  • 包含十个数据集,前六个为训练数据集,后四个为测试数据集。

  • 每个数据集包含1000张“无缺陷”图像和150张“缺陷”图像,以灰度8位PNG格式保存。每个数据集由不同的纹理模型和缺陷模型生成。

  • “无缺陷”图像的背景纹理中没有任何缺陷,“缺陷”图像的背景纹理中恰好有一个标记的缺陷。

  • 所有数据集已被随机划分为大小相等的训练和测试子数据集。

  • 弱标签用椭圆表示,大致指示缺陷区域。


👆 返回目录 -->

9)建筑表面裂缝

CrackForest数据集是一个标注好的道路裂缝图像数据库,能够反映城市道路表面的整体状况。


图2. 桥梁裂缝(左)和路面裂缝。

👆 返回目录 -->

10)磁性瓷砖数据集

磁性瓷砖数据集由github用户abin24提供,可从 https://github.com/Charmve/Surface-Defect-Detection/tree/master/Magnetic-Tile-Defect 下载。该数据集曾用于其论文《磁性瓷砖表面缺陷显著性》,论文可通过 这里这里 查阅。

dataset

图3. 我们数据集的概览。

这也是论文《磁性瓷砖表面缺陷显著性》所使用的数据集。收集了6种常见的磁性瓷砖缺陷图像,并为其标注了像素级真实标签。

👆 返回目录 -->

11)RSDDs:轨道表面缺陷数据集

RSDDs数据集包含两类数据集:第一类是I型RSDDs数据集,拍摄于快速车道,包含67张具有挑战性的图像;第二类是II型RSDDs数据集,拍摄于普通/重载运输轨道,包含128张具有挑战性的图像。

这两类数据集中的每一张图像都至少包含一个缺陷,且背景复杂、噪声较多。

RSDDs数据集中这些缺陷均由轨道表面检测领域的专业人工观察者标记。



👆 返回目录 -->

12)Kylberg纹理数据集 v.1.0

图4. 来自28个纹理类别的示例补丁。

简要说明:

  • 共28个纹理类别,见图4。
  • 每个类别包含160个独特的纹理补丁。(另一种数据集版本对每个原始补丁进行12次旋转,即每个类别有160×12=1920个纹理补丁)。
  • 纹理补丁尺寸:576×576像素。
  • 文件格式:无损压缩的8位PNG。
  • 所有补丁均经过归一化处理,平均值为127,标准差为40。
  • 每个纹理类别对应一个目录。
  • 文件命名格式如下:“blanket1-d-p011-r180.png”,其中“blanket1”为类别名称,“d”为原始图像样本编号(可能值为a、b、c或d),“p011”为第11个补丁,“r180”表示补丁旋转了180度。

🔗 官方链接:http://www.cb.uu.se/~gustaf/texture/

👆 返回目录 -->

13)KTH-TIPS数据库

重复背景纹理的数据集,示例如下:


👆 返回目录 -->

14)自动扶梯踏板缺陷数据集

🔗 官方链接:https://aistudio.baidu.com/aistudio/datasetdetail/44820


👆 返回目录 -->

15)输电线路绝缘子数据集

该数据集中,“Normal_Insulators”包含600张无人机拍摄的正常绝缘子图像。“Defective_Insulators”则包含缺陷绝缘子,共计248张缺陷图像。数据集包括数据和标签。

🔗 官方链接:https://github.com/InsulatorData/InsulatorDataSet

👆 返回目录 -->

16)MVTEC ITODD

MVTec 工业 3D 物体检测数据集 (MVTec ITODD) 是一个公开数据集,用于 3D 物体检测和位姿估计,特别针对工业场景和应用。

该数据集包含:

  • 28 种物体和 3500 个带有这些物体实例标注的场景
  • 五个传感器(两个 3D 传感器和三个灰度相机)对每个场景进行观测

更多信息请参阅此 PDF 文件 🔍。

🔗 下载链接 https://www.mvtec.com/company/research/datasets/mvtec-itodd

👆 返回目录 -->

17)BSData - 实例分割与工业磨损预测数据集

该数据集包含 1104 张三通道图像,并配有 394 个关于“点蚀”表面损伤类型的图像标注。这些标注使用 labelme 标注工具完成,以 JSON 格式提供,因此可以转换为 VOC 和 COCO 格式。所有图像均来自两种 BSD 类型。

另一种 BSD 类型包含 325 张图像,分为两种尺寸。由于该类型的所有图像都是连续拍摄的,因此污损程度在不断变化。

此外,数据集还包含如上所述的 27 个点蚀发展序列,每个序列包含 69 张图像。

图 5. 左侧为图像示例,右侧为对应的 PNG 标注。

🔗 官方链接 https://github.com/2Obe/BSData

衷心感谢 @Beñat Gartzia 的推荐及您的关注!

👆 返回目录 -->

18)齿轮检测数据集

齿轮检测数据集 (GID) 是由百度(中国)公司举办的“全国人工智能创新应用大赛”所使用的竞赛数据集。它包含两千张灰度图像,共 28575 个标注,涉及三种真实来源的缺陷类型。每张图片的缺陷信息都记录在一个单独的 JSON 文件中,包括图像名称、标签类别、边界框以及用于分割的多边形。然而,标签类别并未明确说明具体缺陷类型,仅以数字表示,因此难以与其他相关数据集进行对比。

图 6. 验证测试图像及其标签示例。

🔗 官方链接 http://www.aiinnovation.com.cn/#/dataDetail?id=34

注意:该竞赛数据集不得用于商业用途。

👆 返回目录 -->

19)AeBAD 航空发动机叶片异常检测

下载链接:http://suo.nz/2IU48P

真实世界航空发动机叶片异常检测数据集 (AeBAD) 包含两个子数据集:单片叶片数据集 (AeBAD-S) 和叶片视频异常检测数据集 (AeBAD-V)。与现有数据集相比,AeBAD 具有两个特点:1.) 目标样本未对齐且尺度不同;2.) 测试集和训练集中的正常样本分布存在领域偏移,这种偏移主要由光照和视角的变化引起。

image

👆 返回目录 -->

20)BeanTech 异常检测(BTAD)

下载链接:http://suo.nz/2JEGEi

BTAD(BeanTech 异常检测)数据集是一个真实的工业异常检测数据集。该数据集共包含 2830 张 3 种工业产品的实际图像。

image

👆 返回目录 -->


3. 更多优质数据集资源汇总

我一直在收集表面缺陷检测数据集,但仍有许多未收录的数据集。对于本仓库尚未收录的数据集,您可以访问以下网站查看。同时,欢迎大家分享新的数据集,成为本仓库的贡献者。

欢迎贡献

来源 网址 推荐
Kaggle https://www.kaggle.com/datasets ⭐⭐⭐⭐⭐
Paper With Code https://paperwithcode.com/sota ⭐⭐⭐⭐⭐
AWS 开放数据注册表 https://registry.opendata.aws ⭐⭐⭐
微软研究院开放数据 https://msropendata.com ⭐⭐⭐
Awesome-public-datasets https://github.com/awesomedata/awesome-public-datasets ⭐⭐

👆 返回目录 -->


4. 表面缺陷检测相关论文

我收集了一些关于表面缺陷检测的文章。主要研究对象包括金属表面、LCD 屏幕、建筑物和输电线路等缺陷或异常物体。研究方法主要包括分类法、检测法、重建法和生成法。论文的电子版(PDF)已按日期命名并存放在“Paper”文件夹中。

前往 :open_file_folder: [论文]


👆 返回目录 -->

致谢

现在你可以看到这个仓库了,我们应该感谢最初将上述数据集开源的人们。他们为我们的学习和研究工作提供了极大的帮助。收集这个数据集的想法最初来源于阅读“AI算法修炼营(AI_SuanFa)”的SFXiang关于表面缺陷检测的文章,这促使我整理出一个更加全面的数据集。论文的收集则来自一位名为“庆志的小徒弟”的CSDN用户。这些论文截止到11月19日,之后我还会继续完善。希望大家踊跃贡献

最后,再次感谢上述数据集的开源贡献者们。

👆 返回目录 -->

下载

👆 返回目录 -->

通知

本项目最初是由许多优秀人士基于他们的论文或行业应用而贡献的。您只能将此数据集用于研究目的。

如果您有任何问题或想法,请随时与我联系:email: yidazhang1@gmail.com

🍮 社区


支持我们!

   支持

     通过成为赞助商来支持这个项目。您的姓名和/或 logo 将会出现在我们的主页上,并附带指向您网站的链接。🙏

赞助该项目

引用

使用以下 bibtex 格式引用本仓库:

@misc{Surface Defect Detection,
  title={Surface Defect Detection: Dataset and Papers},
  author={Charmve},
  year={2020.09},
  publisher={Github},
  journal={GitHub repository},
  howpublished={\url{https://github.com/Charmve/Surface-Defect-Detection}},
}

星标数量随时间变化

星标数量随时间变化


欢迎提出任何问题,如果你觉得有什么可以改进的地方,也请随时发起 PR!

🌟请给这个仓库加星🌟

Charmvemaiwei.ai 社区创建 | 部署于 Kaggle


* 更新于 2021年9月17日 @Charmve, 加星分叉

版本历史

v1.02020/12/11

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手,旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚,能够直接接入你日常使用的各类通讯渠道,包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息,OpenClaw 都能即时响应,甚至支持在 macOS、iOS 和 Android 设备上进行语音交互,并提供实时的画布渲染功能供你操控。 这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地,用户无需依赖云端服务即可享受快速、私密的智能辅助,真正实现了“你的数据,你做主”。其独特的技术亮点在于强大的网关架构,将控制平面与核心助手分离,确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者,以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力(支持 macOS、Linux 及 Windows WSL2),即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

349.3k|★★★☆☆|昨天
Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。

162.1k|★★★☆☆|2天前
开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上

142.7k|★★☆☆☆|今天
开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。

107.9k|★★☆☆☆|昨天
开发框架图像Agent

markitdown

MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具,专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片(含 OCR)、音频(含语音转录)、HTML 乃至 YouTube 链接等多种格式的解析,能够精准提取文档中的标题、列表、表格和链接等关键结构信息。 在人工智能应用日益普及的今天,大语言模型(LLM)虽擅长处理文本,却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点,它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式,成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外,它还提供了 MCP(模型上下文协议)服务器,可无缝集成到 Claude Desktop 等 LLM 应用中。 这款工具特别适合开发者、数据科学家及 AI 研究人员使用,尤其是那些需要构建文档检索增强生成(RAG)系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性,但其核心优势在于为机器

93.4k|★★☆☆☆|今天
插件开发框架

LLMs-from-scratch

LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目,旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型(LLM)。它不仅是同名技术著作的官方代码库,更提供了一套完整的实践方案,涵盖模型开发、预训练及微调的全过程。 该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型,却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码,用户能够透彻掌握 Transformer 架构、注意力机制等关键原理,从而真正理解大模型是如何“思考”的。此外,项目还包含了加载大型预训练权重进行微调的代码,帮助用户将理论知识延伸至实际应用。 LLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API,而是渴望探究模型构建细节的技术人员而言,这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计:将复杂的系统工程拆解为清晰的步骤,配合详细的图表与示例,让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础,还是为未来研发更大规模的模型做准备

90.1k|★★★☆☆|昨天
语言模型图像Agent