datasets

1.1k 127 非常简单 1 次阅读 3天前图像数据工具

AI 解读由 AI 自动生成，仅供参考

datasets 是一个专为深度学习打造的卫星与航空影像数据资源库，旨在解决遥感领域高质量标注数据分散、难以查找的痛点。它并非单一的数据集，而是一份精心整理的“导航地图”，汇集了全球多个权威开源项目、基准测试集及数据枢纽链接。

无论是需要训练模型的研究人员，还是开发地理空间应用的工程师，都能在这里快速定位所需资源。内容覆盖广泛，包括用于洪水监测的 Sentinel-1 雷达数据、用于地物分类的 Sentinel-2 光学影像，以及作物产量预测、超分辨率算法训练等特定场景的专业数据集。此外，它还整合了 AWS、Google Earth Engine 和 Microsoft Planetary Computer 等主流云平台的数据目录，方便用户直接访问海量云端数据。

其独特亮点在于极强的针对性与实用性：不仅按传感器类型（如 SAR 与光学）和应用场景（如变化检测、时间序列分析）进行了细致分类，还提供了从原始数据下载到代码示例（如 Python/Keras 加载教程）的一站式指引。如果你正在寻找可靠的遥感数据来启动或优化你的 AI 项目，datasets 将是不可或缺的起点。

使用场景

某农业科技公司数据团队正致力于开发基于卫星影像的作物产量预测模型，急需整合多源遥感数据以训练高精度深度学习算法。

没有 datasets 时

数据搜集极其耗时，工程师需手动在 AWS、Google Earth Engine 及各类论文附录中分散查找 Sentinel-1/2 数据，往往数周无法凑齐实验所需样本。
数据格式混乱且不统一，不同来源的影像分辨率、坐标系和预处理标准各异，导致大量时间浪费在清洗和对齐数据上，而非模型优化。
缺乏权威基准测试集，团队难以验证新算法的有效性，无法与业界最新成果（如 SEN12MS 或 M3LEO）进行公平对比，研发方向容易偏离。
特定任务数据稀缺，针对洪水监测或超分辨率等细分场景，很难找到带有高质量标注的现成数据集，迫使团队从零开始标注，成本高昂。

使用 datasets 后

一键获取丰富资源，通过索引直接定位到 mmflood 洪水数据集或 CYCleSS 作物产量数据，将数据准备周期从数周缩短至数小时。
标准化数据流无缝接入，直接调用已预处理的 Sentinel-2 COGs 或 SEN12MS 融合数据集，确保输入数据格式统一，让团队能立即投入模型训练。
依托权威基准快速迭代，利用 Radiant MLHub 或 Awesome_Satellite_Benchmark_Datasets 中的标准集进行评测，迅速明确模型性能差距并调整策略。
细分场景即时可用，针对变化检测或森林覆盖分析，直接复用专门的开源集合，大幅降低标注成本并加速原型验证。

datasets 通过聚合全球优质遥感数据资源，彻底消除了数据获取与预处理的壁垒，让开发者能专注于核心算法创新与应用落地。

运行环境要求

GPU

未说明

内存

未说明

依赖

notes该 README 内容并非针对名为 'datasets' 的可执行软件工具，而是一个卫星与航空影像深度学习数据集的汇总列表（Awesome List）。它提供了指向各种数据集、论文、代码库和数据枢纽（如 AWS, Google Earth Engine）的链接，因此不包含具体的操作系统、GPU、内存、Python 版本或依赖库等运行环境需求。用户需根据列表中具体选定的某个数据集或其关联的代码库去查询相应的环境要求。

python未说明

快速开始

用于卫星与航空影像深度学习的数据集。

👉 satellite-image-deep-learning.com 👈

如何使用本仓库： 如果您确切知道要查找的内容（例如，论文名称），可以使用 Control+F 在此页面中搜索（或直接在原始 Markdown 文件中搜索）。

数据集列表

地球观测数据库

awesome-satellite-imagery-datasets
Awesome_Satellite_Benchmark_Datasets
awesome-remote-sensing-change-detection -> 专门针对变化检测
Callisto-Dataset-Collection -> 使用哥白尼/哨兵数据集的集合
geospatial-data-catalogs -> AWS、Earth Engine、Planetary Computer 和 STAC Index 上可用的开源地理空间数据集列表
BED4RS
Satellite-Image-Time-Series-Datasets

遥感数据集中心

哨兵系列

作为欧盟哥白尼计划的一部分，多颗哨兵卫星正在采集影像 -> 参见维基百科。

哨兵-1（SAR）

用于哥白尼哨兵-1 卫星数据产品的 Xarray 后端
mmflood -> 基于哨兵-1 SAR 影像的洪水范围提取，相关论文见 IEEE Xplore
Sentinel-1 for Science Amazonas -> 森林损失时间序列数据集
CYCleSS -> 一个综合性的英国作物产量数据集，整合了卫星、气象和土壤类型等信息

Sentinel-2（光学）

Sentinel-2 云优化 GeoTIFF 文件和 Sentinel-2 L2A 120m 拼接图
GCP 上的开放数据
在笔记本中加载 Sentinel 数据的示例
使用 Keras 在 Python 中分析 Sentinel-2 卫星数据
SEN2VENµS -> 用于训练 Sentinel-2 超分辨率算法的数据集
M3LEO -> Github。一个超大规模的地理参考数据集，包含 Sentinel 1/2 影像、干涉 SAR 产品以及土地覆盖、生物量和数字高程模型等辅助数据。
SEN12MS -> 为深度学习和数据融合精心构建的地理参考多光谱 Sentinel-1/2 影像数据集。可查看 SEN12MS 工具箱，并在 paperswithcode.com 上找到大量相关应用。
SEN2NAIP -> 空间和光谱协调的 Sen-2 + NAIP 数据集，用于实现 4 倍 RGB-NIR 超分辨率。
Sen4AgriNet -> 一个多年跨国家的 Sentinel-2 基准数据集，用于作物分类和分割的深度学习，并提供模型。
sentinel2tools -> 下载和基础处理 Sentinel 2 图像的工具库。阅读 Sentinel2tools：下载 Sentinel-2 卫星图像的简单库。
open-sentinel-map -> OpenSentinelMap 数据集包含 Sentinel-2 影像以及基于 OpenStreetMap 衍生的像素级语义标签掩码。
Canadian-cropland-dataset -> 一个新颖的基于补丁的数据集，由从 Sentinel-2 获取的加拿大农业耕地光学卫星影像编译而成。
Sentinel-2 云覆盖分割数据集在 Radiant mlhub 上。
Azavea 云数据集用于训练此云模型。
fMoW-Sentinel -> 世界功能地图 - Sentinel-2 对应影像（fMoW-Sentinel）数据集由 Sentinel-2 卫星采集的影像时间序列组成，对应于世界功能地图（fMoW）数据集中多个不同地点的不同时间点。用于 SatMAE。
地球地表水数据集 -> 用于深度学习地表水特征的 Sentinel-2 卫星影像数据集。参见在 torchgeo 中使用该数据集的示例。
Ship-S2-AIS 数据集 -> 从 29 个免费 Sentinel-2 产品中提取的 13,000 个裁剪块。其中 2,000 张图像显示丹麦主权水域中的船只：可以检测到货船、渔船或集装箱船。
亚马逊雨林语义分割数据集 -> Sentinel 2 影像。
MATTER -> 用于自监督训练的 Sentinel 2 数据集。
S2GLC -> 欧洲高分辨率土地覆盖地图。
从多光谱 Sentinel-2 卫星影像生成不透水面地图。
Sentinel-2 水体边缘数据集（SWED）。
Sentinel2 Munich480 -> 利用 Sentinel-2 卫星的时间序列进行作物制图的数据集。
草地 vs 果园 -> 一个像素时间序列数据集。
用于作物制图的 Sentinel-2 影像时间序列 -> 意大利伦巴第大区的数据。
基于 Sentinel2 数据的乌克兰森林砍伐情况。
satellite-change-events -> CaiRoad 和 CalFire 的变化检测 Sentinel 2 数据集。
用于船舶检测的 Sentinel-2 数据集，也被编辑并重新发布为 VDS2RAW。
MineSegSAT -> 论文《利用 Sentinel-2 影像评估采矿扰动区域范围的自动化系统》所用的数据集。
CaBuAr -> 加州烧毁区域数据集，用于划定边界。
sen12mscr -> 多模态云去除。
Greenearthnet -> 专为高分辨率植被预测设计的数据集。
Floating-Marine-Debris-Data -> 浮动海洋垃圾，附有六类垃圾的标注，包括塑料、漂流木、海藻、浮石、海涕和海沫。
Sen2Fire -> 使用 Sentinel 数据进行野火检测的具有挑战性的基准数据集。
L1BSR -> 从两份 L1B 产品中提取的 3,740 对重叠图像裁剪。
GloSoFarID -> 全球多光谱数据集，用于太阳能电站识别。
MARIDA -> 从 Sentinel-2 检测海洋垃圾。
MADOS -> 从 Sentinel-2 检测海洋垃圾和溢油。
用于船舶检测和特征分析的 Sentinel-2 数据集 -> RGB。
S2-SHIPS -> 包含全部 12 个波段。
ChatEarthNet -> 一个全球规模的图像-文本数据集，赋能视觉-语言地理基础模型，利用 Sentinel-2 数据并结合 ChatGPT 生成的描述。
UKFields -> 超过 230 万个自动划定的田块边界，覆盖英格兰、威尔士、苏格兰和北爱尔兰。
ShipWakes -> 基于关键点方法，利用深度学习识别 Sentinel-2 影像中的船迹成分。
TimeSen2Crop -> 用于作物类型分类的百万样本标记的 Sentinel 2 影像时间序列数据集。
AgriSen-COG -> 一个多国、多时相的大规模 Sentinel-2 基准数据集，用于作物制图：包含异常检测预处理步骤。
MagicBathyNet -> 一个新的多模态基准数据集，由 Sentinel-2、SPOT-6 和航空影像的图像补丁、栅格格式的水深数据以及海底类别标注组成。
MuS2：用于 Sentinel-2 多图像超分辨率的基准。
Sen4Map -> Sentinel-2 时间序列影像，覆盖欧盟超过 335,125 个带有地理标签的位置。这些地理标签位置关联着详细的土地覆盖和土地利用信息。
CloudSEN12Plus -> 目前最大的用于 Sentinel-2 的云检测数据集。
mayrajeo S2 船舶检测 -> 使用 YOLOv8 从 Sentinel-2 影像中检测海上船只的标签。
Fields of The World -> 农业田块边界的实例分割。
ai4boundaries -> 结合 Sentinel-2 和航空摄影进行田块边界检测。
加州野火地理影像数据集 - CWGID -> 开发并应用基于 Sentinel-2 卫星影像的深度学习驱动森林野火检测数据集。
substation-seg -> 变电站分割数据集。
PhilEO-downstream -> 一个 400GB 的 Sentinel-2 数据集，用于建筑密度估计、道路分割和土地覆盖分类。
PhilEO-pretrain -> 一个 500GB 的全球 Sentinel-2 影像数据集，用于模型预训练。
KappaSet：Sentinel-2 KappaZeta 云和云影掩码。
AllClear 一个全面的卫星影像去云数据集和基准。
通过主动学习方法生成的 Sentinel-2 参考云掩码。
利用深度学习填补云隙以改善草原监测。
遥感船迹数据集。
ERAS-dataset -> 艾米利亚-罗马涅地区农业分割（ERAS）田块分割数据集。
瑞士两个地区五年内 92 场景的 Sentinel 2 超分辨率数据立方体。
SeasoNet -> 一个针对德国卫星影像的季节性场景分类、分割和检索数据集。土地覆盖类别基于 CORINE Land Cover 数据库（CLC）2018 年版本。
EuroCropsML -> 一个即用型基准数据集，用于使用 Sentinel-2 影像进行少样本作物类型分类。
CanadaFireSat -> Sentinel-2 Level-1C 时间序列。
ssl4eco -> 一种构建预训练数据集的配方，能够捕捉全球生态系统的地理和物候多样性。
IRRISIGHT -> 一个大规模的多模态遥感数据集，用于灌溉分类、土壤-水分映射和农业监测。
SentinelKilnDB -> 用于监测南亚砖窑排放的 Sentinel-2 数据集。
MSSWD - 多光谱船迹数据集。
MOSAIC-SEN2-CC -> 一个用于遥感变化标注的多光谱数据集和适配框架。
PLUTo -> 热带地区森林砍伐后的土地利用情况。
SentinelKilnDB -> 一个大型数据集和基准，用于在南亚利用卫星影像检测定向包围盒（OBB）形式的砖窑。
GSDD -> 全球冰川表面碎屑数据集。
MT4AFE -> 多任务学习用于农田提取。
agripotential -> 一个包含 34 个 Sentinel-2 时间帧的卫星影像时间序列（STIS），涵盖 5 类农业潜力。
YieldSAT -> 一个用于高分辨率作物产量预测的多模态基准数据集。

综合哨兵

awesome-sentinel -> 一个精选的列表，包含与哥白尼哨兵卫星数据相关的优秀工具、教程和API。
通过sentinel-hub和python-api可付费访问哨兵和Landsat数据。
用于处理存储在S3上的Sentinel-5P Level 2数据的Jupyter Notebooks。数据可在这里浏览。
哨兵NetCDF数据。
earthspy -> 利用Sinergise公司EO研究团队开发的哨兵Hub服务，实时（NRT）监测和研究地球上任何地点。
金矿开采与秘密简易机场数据集。
工业烟 plume。
MARIDA：海洋垃圾档案。
OMS2CD -> 用于露天矿区变化检测的手工标注图像。
煤电厂排放数据 -> 包含图像、元数据和标签的煤电厂排放数据集。
RapidAI4EO -> 欧洲范围内50万个地点采样的密集时间序列卫星影像，包括S2和Planet影像，并附有2018年CORINE土地覆盖多类别标签。
MS-HS-BCD-dataset -> 多源变化检测数据集，用于论文《基于深度学习融合多源遥感影像光谱与纹理特征的建筑物变化检测：以GF-1和Sentinel 2B数据为例》。
CropNet：面向气候变化的作物产量预测的开放大型多模态数据集 -> 大量公开可用的多模态数据集，用于支持气候变化背景下的作物产量预测。
Tiny CropNet数据集。
利用卫星影像估算发电厂温室气体排放的多任务学习。
METER-ML：用于自动化甲烷源测绘的多传感器地球观测基准数据集 -> 数据可在Zenodo上找到。
MultiSenGE -> 大规模多模态、多时相基准数据集。
SEN12MS -> 用于深度学习和数据融合的地理参考多光谱哨兵1/2影像精选数据集。可查看SEN12MS工具箱，并在paperswithcode.com上找到大量引用案例。
Space2Ground -> 包含太空（哨兵1/2）和地面（街景图像）两部分的数据集，标注了作物类型标签，用于农业监测。
MSCDUnet -> 包含VHR、多光谱（哨兵2）和SAR（哨兵1）影像的变化检测数据集。
OMBRIA -> 用于解决洪水制图问题的哨兵1和2数据集。
卫星烧毁区域数据集 -> 包含与过去森林火灾相关的多颗卫星影像的分割数据集。其中包括来自哨兵2和哨兵1（哥白尼计划）的73幅影像。
SEN12_GUM -> 哨兵12全球城市制图数据集。
哨兵1和2影像对（SAR与光学）。
MSOSCD -> 包含VHR、多光谱（哨兵2）和SAR（哨兵1）影像的变化检测数据集。
SICKLE -> 一个标注了多种关键种植参数的多传感器卫星影像数据集。包含来自Landsat-8、哨兵1和哨兵2的多分辨率时序影像。
哨兵1和2船只检测。
TreeSatAI -> 哨兵1、哨兵2。
AI2-S2-NAIP -> 对齐后的NAIP、哨兵2、哨兵1和Landsat影像，覆盖整个美国大陆。
POPCORN：基于哨兵1和哨兵2生成的高分辨率人口地图。
CropClimateX -> 用于极端气候条件下作物监测的大规模多任务、多传感数据集。
SmallMinesDS -> 用于绘制手工及小型金矿的地图的多模态数据集。该数据集中的影像也被重新用于CocoaMiningDS。
Hoss-ReID -> 通过光学和SAR影像进行跨模态船舶再识别。
IDEABench基准数据集 -> 针对全球城市样本的城市贫困状况测绘与基准测试。
ImpactMesh -> 用于洪水和野火制图的大规模多模态、多时相数据集。
Sen12Landslides -> 空间-时间滑坡与异常检测数据集。
Cryo-Bench -> 用于评估地理空间基础模型在冰冻圈应用中的基准。
BigEarthNet.txt -> 用于地球观测的大规模多传感器图像-文本数据集及基准。
婆罗洲森林扰动数据集 -> 利用哨兵2数据和RADD警报扰动信息的森林扰动数据集。

Landsat

美国长期运行的卫星计划 -> 参见维基百科

8个波段，分辨率15至60米，幅宽185公里，时间分辨率16天
Google上的Landsat 4、5、7和8影像，详见GCP存储桶，其中Landsat 8影像采用COG格式，并在此笔记本中进行了NDVI分析
AWS上的Landsat 8影像，附带大量教程和工具
https://github.com/kylebarron/landsat-mosaic-latest -> 基于AWS SNS通知自动更新的无云Landsat 8镶嵌图
使用Datashader可视化Landsat影像
Landsat-mosaic-tiler -> 该仓库托管了landsatlive.live网站及API的所有代码。
LandsatSCD -> 一种变化检测数据集，包含8468对图像，每对图像的空间分辨率为416 × 416
爱尔兰海岸线分割Landsat数据集
Wildfire-Spread-Dataset -> ABNextFire：基于多源深度学习的野火蔓延预测数据集

VENμS

新型微型卫星上的植被与环境监测（VENμS）

VENUS L2A云优化GeoTIFF文件
VENuS云掩膜训练数据集
Sen2Venµs -> 用于训练Sentinel-2超分辨率算法的数据集
sen2venus-pytorch-dataset -> PyTorch数据加载器及其他实用工具

Vantor

Vantor公司（前身为Maxar & DigitalGlobe）拥有的卫星包括GeoEye-1、WorldView-2、3号和4号

Maxar开放数据计划提供事件发生前后高分辨率卫星影像，以支持应急规划、响应、损失评估和灾后恢复
WorldView-2欧洲城市影像 -> 覆盖欧洲人口最密集地区的数据集，分辨率为40厘米

Planet

另请参阅本页后续的Spacenet-7以及Kaggle上的船舶和飞机分类数据集

Planet提供的全球热带地区高分辨率、可直接分析的镶嵌影像，由挪威国际气候与森林倡议支持。BBC报道
Planet曾通过Kaggle竞赛提供影像数据
阿尔伯塔油井数据集 -> 从卫星影像中精确定位油气井
ARGO船舶分类数据集 -> 来自PlanetScope四波段卫星的1750张标注图像。创建于此处
PlanetScope影像中的海洋垃圾检测数据集
LitterLines -> 用于检测PlanetScope影像中海洋垃圾堆积带的标注数据集
FloodPlanet洪水淹没数据集 -> 多传感器配准数据集，基于3米分辨率的PlanetScope数据进行标注，并与Sentinel-1、Sentinel-2和Landsat-8数据在空间上重叠、时间上接近
Zhijie_FloodPlanet_2023 -> 包含2017年至2020年间发生的19次洪水事件

UC Merced

土地利用分类数据集，包含21个类别，每个类别有100张RGB TIFF图像。每张图像尺寸为256×256像素，像素分辨率为1英尺

http://weegee.vision.ucmerced.edu/datasets/landuse.html
同时也以多标签数据集形式提供
阅读用于遥感图像分类的视觉Transformer，其中Vision Transformer分类器在Merced数据集上达到了98.49%的分类准确率

EuroSAT

Sentinel-2卫星影像的土地利用分类数据集，覆盖13个光谱波段，包含10个类别，共27000个已标注且地理参考的样本。提供RGB版本和13波段版本

EuroSAT：使用Sentinel-2进行土地利用与地表覆盖分类 -> 一篇发表论文，其中CNN模型实现了98.57%的分类准确率
使用fastai的仓库这里和这里
evolved_channel_selection -> 探讨混合分辨率与是否使用某个波段之间的权衡，并附有仓库
RGB版本可在PyTorch数据集中找到，而13波段版本则可在torchgeo中找到。请查看关于使用该数据集进行数据增强的教程
EuroSAT-SAR -> 根据地理坐标将EuroSAT中的每张Sentinel-2图像与一张Sentinel-1影像匹配

PatternNet

土地利用分类数据集，包含38个类别，每个类别有800张RGB JPG图像

Gaofen图像数据集（GID）用于分类

https://captain-whu.github.io/GID/
一个大规模分类数据集和一个精细地表覆盖分类数据集

Million-AID

一个包含百万级样本的大规模基准数据集，用于遥感场景分类，共51个场景类别，按层次化类别组织。

DIOR目标检测数据集

一个用于光学遥感图像中目标检测的大规模基准数据集，包含23,463张图像和192,518个由水平边界框标注的目标实例。

https://gcheng-nwpu.github.io/
https://arxiv.org/abs/1909.00133
ors-detection -> 使用YOLOv3在DIOR数据集上进行目标检测
dior_detect -> DIOR数据集上的目标检测基准测试
Tools -> 用于处理DIOR数据集的工具
Object_Detection_Satellite_Imagery_Yolov8_DIOR

Multiscene

MultiScene数据集旨在解决两个任务：开发多场景识别算法以及在带噪声标签的数据上进行网络学习。

https://multiscene.github.io/ 和 https://github.com/Hua-YS/Multi-Scene-Recognition

FAIR1M目标检测数据集

一个用于高分辨率遥感图像中细粒度目标识别的基准数据集。

arXiv论文
可从gaofen-challenge.com下载
2020Gaofen -> 2020年高分挑战赛的数据、基线和评估指标

DOTA目标检测数据集

一个用于航空图像中目标检测的大规模基准及挑战赛。分割标注可在iSAID数据集中找到。

https://captain-whu.github.io/DOTA/index.html
DOTA_devkit 用于加载数据集
arXiv论文
mmrotate中的预训练模型
DOTA2VOCtools -> 数据集拆分并转换为VOC格式
dotatron -> 2021年基于DOTA数据集的“学习理解航空图像”挑战赛

iSAID实例分割数据集

一个用于航空图像中实例分割的大规模数据集。

https://captain-whu.github.io/iSAID/dataset.html
使用了DOTA数据集中的图像。

HRSC RGB船舶目标检测数据集

SAR船舶检测数据集（SSDD）

高分辨率SAR旋转船舶检测数据集（SRSDD）

LEVIR船舶数据集

一个用于中等分辨率遥感图像下微小船舶检测的数据集。标注采用边界框格式。

LEVIR-Ship

托管于Nucleus

SAR飞机检测数据集

收集了2966个不重叠的224×224切片，包含7835个飞机目标。

https://github.com/hust-rslab/SAR-aircraft-data

xView1：航拍影像中的上下文对象

一个细粒度的目标检测数据集，包含60个对象类别，涵盖8种类别的本体结构。超过100万个对象分布在超过1,400平方公里的0.3米分辨率影像中。标注采用边界框格式。

官方网站
arXiv论文
paperswithcode
Satellite_Imagery_Detection_YOLOV7 -> 将YOLOV7应用于xView1

xView2：xBD建筑物损毁评估

一个用于建筑物损毁评估的高分辨率卫星影像标注数据集，提供精确的分割掩码和四级损伤标签，影像分辨率为0.3米。

官方网站
arXiv论文
paperswithcode
xView2_baseline -> TensorFlow中的基线解决方案
metadamagenet -> PyTorch解决方案
来自michal2409的U-Net模型
DAHiTra -> 2022年论文的代码：利用新型分层Transformer架构对卫星图像进行大规模建筑物损毁评估。使用xView2 xBD数据集。
使用Amazon SageMaker地理空间功能和自定义SageMaker模型进行损毁评估
Xview2_Strong_Baseline -> 强基线的简单实现

xView3：SAR影像中的暗色船只检测

在合成孔径雷达（SAR）影像中检测从事非法、未报告和无管制（IUU）捕捞活动的暗色船只。该多模态数据集包含人类和算法标注的船只及固定设施实例，覆盖43,200,000平方公里的Sentinel-1影像，使算法能够检测并分类暗色船只。

官方网站
arXiv论文
GitHub -> 包含所有参考代码、数据处理工具以及获奖模型的代码和权重
paperswithcode
xview3_ship_detection

航空影像中的车辆检测（VEDAI）

航空影像中的车辆检测。标注采用边界框格式。

俯视视角车辆数据集（COWC）

包含大量标注的俯视视角车辆图像。为目标检测和计数任务提供了基准数据集。标注采用边界框格式。

AI-TOD & AI-TOD-v2 - 微小目标检测

AI-TOD 数据集中物体的平均尺寸约为 12.8 像素，远小于其他数据集。标注采用边界框格式。v2 是对 v1 数据集进行细致重新标注的结果。

https://github.com/jwwangchn/AI-TOD
https://chasel-tsui.github.io/AI-TOD-v2/
NWD -> 用于 2021 年论文的代码：一种用于微小目标检测的归一化高斯 Wasserstein 距离。使用 AI-TOD 数据集。
ORFENet -> 基于目标重建与多感受野自适应特征增强的遥感图像微小目标检测。使用 LEVIR-ship 和 AI-TOD-v2。

RarePlanes

RarePlanes -> 包含真实和合成生成的卫星影像，其中包括飞机。阅读 arXiv 论文并查看此仓库。请注意，该数据集可通过 AWS 开放数据计划免费下载。
理解 RarePlanes 数据集并构建飞机检测模型 -> 博客文章。
阅读 NVIDIA 的这篇文章，其中讨论了如何用 10% 的真实数据对基于合成数据（Rareplanes）预训练的模型进行微调，然后通过剪枝减少模型大小，最后量化模型以提高推理速度。
yoltv4 包含使用 RarePlanes 数据集的示例。
rareplanes-yolov5 -> 使用 YOLOv5 和 RarePlanes 数据集来检测并分类飞机的子特征，并附有文章。

Counting from Sky

用于遥感目标计数的大规模数据集及基准方法

https://github.com/gaoguangshuai/Counting-from-Sky-A-Large-scale-Dataset-for-Remote-Sensing-Object-Counting-and-A-Benchmark-Method

AIRS（用于屋顶分割的航空影像）

公开数据集，用于从超高分辨率航空影像（7.5cm）中进行屋顶分割。覆盖新西兰南岛最大城市克赖斯特彻奇的几乎全部区域。

在 Kaggle 上
Rooftop-Instance-Segmentation -> 使用 VGG-16 进行实例分割，数据来源为 Airs 数据集。

Inria 建筑物/非建筑物分割数据集

空间分辨率为 0.3 m 的 RGB GeoTIFF 文件。数据涵盖奥斯汀、芝加哥、基茨普县、西蒂罗尔和东蒂罗尔、因斯布鲁克、旧金山和维也纳。

https://project.inria.fr/aerialimagelabeling/contest/
SemSegBuildings -> 使用 fast.ai 框架对 Inria 建筑物分割数据集进行语义分割的项目。
UNet_keras_for_RSimage -> 用于二值语义分割的 Keras 代码。

AICrowd Mapping Challenge：建筑物分割数据集

300×300 像素的 RGB 图像，标注采用 COCO 格式。影像似乎覆盖全球，但北美地区的比例较大。

作为 mapping-challenge 的一部分发布的数据集。
neptune.ai 发布的获胜方案这里，使用带有 Resnet 的 Unet 实现了 0.943 的精确率和 0.954 的召回率。
mappingchallenge -> 将 YOLOv5 应用于 AICrowd Mapping Challenge 数据集。

BONAI - 建筑物轮廓数据集

BONAI（斜视角航空影像中的建筑物）是一个用于从斜视角航空影像中提取建筑物轮廓（BFE）的数据集。

https://github.com/jwwangchn/BONAI

LEVIR-CD 建筑物变化检测数据集

https://justchenhao.github.io/LEVIR/
FCCDN_pytorch -> 使用 PyTorch 实现 FCCDN 算法进行变化检测任务。
RSICC -> 遥感图像变化描述数据集使用 LEVIR-CD 影像。

Onera（OSCD）Sentinel-2 变化检测数据集

该数据集由 2015 年至 2018 年间从 Sentinel-2 卫星拍摄的 24 对多光谱图像组成。

Onera 卫星变化检测数据集包括 2015 年至 2018 年间从 Sentinel-2 卫星拍摄的 24 对多光谱图像。
网站
change_detection_onera_baselines -> Siamese 版本的 U-Net 基准模型。
使用卷积神经网络进行多光谱地球观测的城市变化检测 -> 附有论文。
DS_UNet -> 2021 年论文的代码：利用双流 U-Net 进行 Sentinel-1 和 Sentinel-2 数据融合以实现城市变化检测，使用 Onera 卫星变化检测数据集。
ChangeDetection_wOnera。
OSCD + 额外日期 -> 扩展为包含三个不同日期的数据集。
MSOSCD -> 包含 VHR、多光谱（Sentinel-2）和 SAR（Sentinel-1）的变化检测数据集。

SECOND - 语义变化检测

https://captain-whu.github.io/SCD/
在像素级别进行变化检测。

亚马逊雨林和大西洋森林数据集

用于使用 Sentinel 2 进行语义分割。

亚马逊雨林和大西洋森林语义分割影像数据集
attention-mechanism-unet -> 基于注意力机制的 U-Net，用于检测卫星传感器影像中的森林砍伐。
TransUNetplus2 -> 重新思考带注意力门控的 TransU-Net，用于森林砍伐地图绘制。

世界功能地图（fMoW）

https://github.com/fMoW/dataset
RGB与多光谱变体
高分辨率、芯片分类数据集
目的：基于卫星影像的时间序列及丰富的元数据特征，预测建筑物的功能用途和土地利用类型

HRSCD变化检测

https://rcdaudt.github.io/hrscd/
291对高分辨率RGB航空影像的配准图像对
提供像素级的变化和地表覆盖标注

MiniFrance-DFC22 - 半监督语义分割

MiniFrance-DFC22（MF-DFC22）数据集扩展并修改了MiniFrance数据集，用于训练半监督语义分割模型，以进行土地利用/地表覆盖制图。
dfc2022-baseline -> 使用TorchGeo、PyTorch Lightning和Segmentation Models PyTorch，基于ResNet-18骨干网络，结合Focal + Dice损失函数，训练U-Net模型，完成DFC2022数据集上的语义分割任务，作为2022年IEEE GRSS数据融合竞赛（DFC2022）的基准解决方案。
https://github.com/mveo/mveo-challenge

FLAIR

由法国国家地理与森林信息研究所（IGN）提出的语义分割与领域适应挑战赛。该数据集包含超过7万张带有像素级标注的航空影像块，以及5万景Sentinel-2卫星影像。

ISPRS

语义分割数据集。38个6000×6000像素的影像块，每个块由从更大范围的正射影像拼接图中裁剪出的真实正射影像（TOP）和数字表面模型（DSM）组成。分辨率为5厘米。

https://www.isprs.org/resources/datasets/benchmarks/UrbanSemLab/2d-sem-label-potsdam.aspx

SpaceNet

SpaceNet是一系列比赛的总称，提供数据集和相关工具。涵盖的挑战包括：(1 & 2) 建筑物分割，(3) 道路分割，(4) 斜视角建筑物，(5) 道路网络提取，(6) 多传感器测绘，(7) 多时相城市变化，(8) 基于多类别分割的洪水检测挑战。

spacenet.ai 是一个在线平台，提供数据、挑战、算法和工具。
SpaceNet 7多时相城市发展挑战：数据集发布
spacenet-three-topcoder 解决方案
官方工具库 -> 旨在帮助将SpaceNet卫星影像数据预处理为机器学习算法可使用的格式。
andraugust spacenet-utils -> 可显示带有建筑物多边形叠加的geotiff图像，并利用kNN算法根据像素光谱对建筑物进行标注。
Spacenet-Building-Detection -> 使用Keras和SpaceNet 1数据集。
SpaceNet 8获奖者博客文章

WorldStrat数据集

近1万平方公里的免费高分辨率卫星影像，覆盖全球独特的地理位置，确保对各类土地利用类型的分层代表性：从农业到冰盖，从森林到不同密度的城市化区域。

https://github.com/worldstrat/worldstrat
WorldStrat数据集快速导览
每张高分辨率影像（1.5米/像素）都配有来自免费开放的低分辨率Sentinel-2卫星的多时相低分辨率影像（10米/像素）。
已有多个超分辨率基准模型在此数据集上进行训练。

Satlas Pretrain

SatlasPretrain是一个大规模的预训练数据集，用于涉及理解卫星影像的任务。通过Sentinel-2和NAIP等来源，地球大部分地区的定期更新卫星数据公开可用，可用于支持多种应用，从打击非法砍伐到监测海洋基础设施。

FLAIR 1 & 2 分割数据集

https://ignf.github.io/FLAIR/
FLAIR #1语义分割数据集包含77,412个高分辨率影像块（512×512，空间分辨率为0.2米），涵盖19种语义类别。
FLAIR #2则包含了扩展的Sentinel-2时间序列数据集，用于多模态语义分割。

五十亿像素分割数据集

https://x-ytong.github.io/project/Five-Billion-Pixels.html
中国地区的4m分辨率高分二号影像
24种地表覆盖类别
论文和代码展示了如何将模型迁移到Sentinel-2和Planetscope影像上。
扩展了GID15大规模语义分割数据集。
GID -> 高分影像数据集是一个基于高分二号（GF-2）卫星影像的大规模地表覆盖数据集。
MM-5B数据集 -> 多模态五十亿像素数据集是一个大规模、多模态、层次化的地表覆盖与土地利用（LCLU）数据集，建立在五十亿像素数据集的基础上。

RF100目标检测基准

RF100由100个跨越多个领域的现实世界数据集组成。其目的是通过对该数据集的性能评估，能够更细致地指导模型在不同领域中的表现。包含1万张航空影像。

SATIN（SATellite ImageNet）

SATIN是一个多任务遥感分类元数据集，由27个数据集组成，分为6个任务。影像分辨率跨度达5个数量级，涵盖超过250个不同的类别标签，以及多种视场大小。SATIN整体基准及其27个子数据集均通过HuggingFace发布。同时提供公开排行榜，用于指导和跟踪视觉-语言模型在SATIN上的进展。

SODA-A旋转边界框

https://shaunyuan22.github.io/SODA/
SODA-A包含2513张高分辨率航空场景图像，共标注了872,069个实例，采用定向矩形框标注，涵盖9个类别。
https://github.com/shaunyuan22/CFINet

Satellogic 的 EarthView 数据集

https://huggingface.co/datasets/satellogic/EarthView
用于基础模型的数据集，包含 Sentinel 1 和 2 卫星数据以及 1 米分辨率的 RGB 影像。

微软的数据集

美国建筑物轮廓 -> 美国50个州的建筑物轮廓，GeoJSON格式，通过语义分割生成。此外还有澳大利亚、加拿大、乌干达-坦桑尼亚、肯尼亚-尼日利亚以及全球建筑物轮廓等版本。可以使用RasterizingBuildingFootprints将矢量形状文件转换为栅格图层。
微软行星计算机是一个基于 Dask-Gateway 的 JupyterHub 部署，专注于支持可扩展的地理空间分析，其源代码仓库为这里。
landcover-orinoquia -> 与哥伦比亚野生动物保护协会合作，对哥伦比亚奥里诺基亚地区进行土地覆盖分类。这是一个 #AIforEarth 项目。
微软道路检测数据集

谷歌的数据集

open-buildings -> 一个用于支持公益应用的建筑物轮廓数据集，覆盖了非洲大陆的64%。阅读文章利用卫星影像绘制非洲建筑地图。

Google Earth Engine (GEE)

由于 GEE 拥有一个庞大的社区，这里不再赘述，仅列出一些精选资源。可以从 https://developers.google.com/earth-engine/ 开始学习。

提供多种遥感影像和气候数据集，包括 Landsat 和 Sentinel 卫星影像。
支持使用传统算法进行大规模处理，例如用于土地利用分类的聚类分析。对于深度学习，可以将 GEE 中的数据导出为 tfrecords 格式，在您选择的 GPU 平台上训练模型，然后将推理结果上传回 GEE。
awesome-google-earth-engine
Awesome-GEE
awesome-earth-engine-apps
如何使用 Google Earth Engine 和 Python API 将图像导出到 Roboflow -> 用于获取训练数据。
ee-fastapi 是一个简单的 FastAPI Web 应用程序，后端使用 Google Earth Engine 进行洪水检测。
如何下载地球上任何地点的高分辨率卫星数据
wxee -> 使用 wxee 将 GEE 中的数据导出为 xarray 格式，然后使用 PyTorch 或 TensorFlow 模型进行训练。这很有用，因为 GEE 本身只支持导出 tfrecord 格式。

图像描述数据集

RSICD -> 包含10921张图片，每张图片配有五句描述。该数据集被用于使用遥感（卫星）图像和描述微调 CLIP 模型，相关模型可在这个仓库中找到。
RSICC -> 遥感图像变化描述数据集包含10077对不同时期的遥感图像，以及50385句描述图像之间差异的文字。使用 LEVIR-CD 影像。
ChatEarthNet -> 全球规模的图文数据集，用于赋能视觉-语言地理基础模型，采用 Sentinel-2 数据，并由 ChatGPT 生成描述文字。

天气数据集

NASA（需提交请求，准备就绪后会通过邮件发送）-> https://search.earthdata.nasa.gov
NOAA（需要 BigQuery）-> https://www.kaggle.com/datasets/noaa/goes16/home
美国多个城市的气象时间序列数据 -> https://www.kaggle.com/datasets/selfishgene/historical-hourly-weather-data
DeepWeather -> 通过分析卫星图像来提高天气预报的准确性。

云数据集

Planet-CR -> 用于高分辨率光学遥感影像去云处理的多模态、多分辨率数据集，分辨率为3米，并有相关论文在这里。
Azavea 云数据集，用于训练这款云检测模型。
Sentinel-2 云覆盖分割数据集在 Radiant mlhub 上提供。
cloudsen12 -> 参见视频。
WHUS2-CD+ -> 包含36幅人工标注的10米分辨率云掩膜及其对应的 Sentinel-2 影像，均匀分布在中国大陆各地，用于训练 CD-FM3SF 云检测模型。
HRC_WHU -> 高分辨率云检测数据集，包含150张RGB影像，分辨率在不同全球区域介于0.5至15米之间。
AIR-CD -> 一个具有挑战性的云检测数据集，具有更高的空间分辨率和更具代表性的地表类型。
Landsat 8 云覆盖评估验证数据

森林数据集

OpenForest -> 一个开放获取的森林数据集目录
awesome-forests -> 面向机器学习和林业社区的精选地面真值森林数据集列表
ReforesTree -> 基于无人机和地面数据估算热带森林生物量的数据集
yosemite-tree-dataset -> 用于航拍图像中树木计数的基准数据集
亚马逊雨林语义分割数据集 -> Sentinel 2 影像。用于论文《基于注意力机制的 U-Net 用于检测卫星传感器影像中的森林砍伐》
亚马逊和大西洋森林语义分割影像数据集 -> Sentinel 2 影像。用于论文《基于注意力机制的 U-Net 用于检测卫星传感器影像中的森林砍伐》
TreeSatAI -> Sentinel-1、Sentinel-2
PureForest -> VHR RGB + 近红外与激光雷达，每个图块代表一片单一树种的森林

地理空间数据集

Resource Watch 提供广泛的地理空间数据集及可视化界面

时间序列与变化检测数据集

BreizhCrops -> 用于作物类型制图的时间序列数据集
SeCo 数据集包含来自 Sentinel-2 图幅的图像块，在每个地理位置的不同时间点采集。在此下载 SeCo
SYSU-CD -> 该数据集包含 20000 对 0.5 米分辨率的航拍图像，尺寸为 256×256，拍摄于 2007 年至 2014 年期间的香港地区

DEM（数字高程地图）

航天飞机雷达地形测绘任务，可在 usgs.gov 在线查询
Copernicus 数字高程模型 (DEM) 存储在 S3 上，表示地球表面，包括建筑物、基础设施和植被。数据以云优化 GeoTIFF 格式提供。链接
Awesome-DEM

无人机数据集

许多数据集可在 https://www.visualdata.io 上找到
AU-AIR 数据集 -> 用于目标检测的多模态无人机数据集
ERA -> 用于航拍视频中事件识别的数据集和深度学习基准
航拍海事无人机数据集 -> 边界框标注
RetinaNet 用于行人检测 -> 边界框标注
BIRDSAI：用于航拍热红外视频中检测与跟踪的数据集 -> 人类和动物的热红外视频
ERA：用于航拍视频中事件识别的数据集和深度学习基准
DroneVehicle -> 基于无人机的 RGB-红外跨模态车辆检测，采用不确定性感知学习。标注为旋转边界框。配套 GitHub 仓库：UA-CMDet
UAVOD10 -> 10 类物体，分辨率为 15 厘米。类别包括：建筑物、船只、车辆、预制房屋、水井、电缆塔、游泳池、滑坡区域、养殖网箱和采石场。标注为边界框
繁忙停车场数据集——无人机视频中的车辆检测 -> 车辆实例分割。标注格式尚不明确，可能是 MATLAB 特有的格式
dd-ml-segmentation-benchmark -> DroneDeploy 机器学习分割基准
SeaDronesSee -> 海上搜救视觉基准。标注包括边界框目标检测、单目标跟踪和多目标跟踪
aeroscapes -> 语义分割基准，由商用无人机从 5 至 50 米高度拍摄的图像组成
ALTO -> 航拍视角下的大规模地形导向数据集。用于基于深度学习的无人机视觉定位与场景识别任务
HIT-UAV-Infrared-Thermal-Dataset -> 用于无人机的高空红外热成像目标检测数据集
caltech-aerial-rgbt-dataset -> 同步的 RGB、热成像、GPS 和 IMU 数据
叶状大戟数据集 -> 航拍无人机影像中的真实世界杂草分类
Agriculture-Vision 2021 数据集
UAV-HSI-Crop-Dataset -> 用于“HSI-TransUNet：基于 Transformer 的语义分割模型，用于从无人机高光谱影像中进行作物制图”的数据集
UAVVaste -> 类似 COCO 的数据集，用于航拍图像中的有效垃圾检测
BSB-Aerial-Dataset -> 巴西巴西利亚航拍影像的全景分割数据集

其他数据集

目标检测与分类

RSOD-Dataset -> 用于目标检测的数据集，采用PASCAL VOC格式。包含飞机、游乐场、立交桥和油罐等类别。
VHR-10_dataset_coco -> 基于NWPU VHR-10数据集的目标检测与实例分割数据集。包含RGB和SAR两种模态。
MAR20 -> 军用飞机识别数据集。
RSAPS-ASD -> 遥感机场全景分割与飞机状态数据集，构建于“从单时相高分辨率遥感图像中进行飞机状态判别”研究中。
Sewage-Treatment-Plant-Dataset -> 目标检测数据集。
TGRS-HRRSD-Dataset -> 高分辨率遥感目标检测（HRRSD）数据集。
OGST -> 石油天然气储罐数据集。
SearchAndRescueNet -> 用于搜救任务的卫星影像数据集，并附有Faster R-CNN模型示例。
UBC-dataset -> 用于建筑物检测与分类的数据集，基于超高分辨率卫星影像，重点在于对单个建筑物的对象级解读。
Building_Dataset -> 高速铁路沿线建筑物展示数据集。
RID -> 用于基于计算机视觉的光伏潜力评估的屋顶信息数据集。相关论文：链接。
APKLOT -> 用于航空影像中停车位分割的数据集。
SAR-ACD -> SAR-ACD包含4322段飞机视频片段，涵盖6类民用飞机和14类其他飞机。
SODA -> 大规模小目标检测数据集。SODA-A包含2510张高分辨率航拍图像，标注了9个类别的800,203个实例，使用定向矩形框标注。
urban-tree-detection-data -> 用于训练和评估城市环境中树木检测器的航拍影像数据集。
包含船舶的卫星影像数据集 -> 列举了一系列用于船舶检测、分类、语义分割和实例分割任务的雷达及光学卫星数据集。
Roofline-Extraction -> 用于论文《基于知识的单张航拍图像三维建筑物重建（3DBR）及卷积神经网络（CNN）应用》的数据集。
Building-detection-and-roof-type-recognition -> 用于论文《基于CNN的单张航拍图像自动建筑物检测与屋顶类型识别方法》的数据集。
OnlyPlanes -> 用于Detectron2的合成数据集及预训练模型。
SV248S -> 单目标跟踪数据集，用于跟踪车辆、大型车辆、船舶和飞机。
NWPU-MOC -> 航空影像中细粒度多类别物体计数基准数据集。
卫星遥感车辆感知 -> 用于卫星交通监测的大规模基准数据集。
SARDet-100K -> 大规模合成孔径雷达（SAR）目标检测数据集。
城市车辆分割数据集（UV6K）
ShipRSImageNet -> 用于高分辨率光学遥感影像中船舶检测的大规模细粒度数据集。
VME：中东及其他地区车辆检测的卫星影像数据集与基准
VHRV：超高分辨率船舶检测基准数据集

土地利用与土地覆被

land-use-land-cover-datasets
RSD46-WHU -> 用于图像分类的46个场景类别，免费供教育、科研和商业用途使用
RSSCN7 -> 文章“基于深度学习的遥感场景分类特征选择”中的数据集
geonrw -> 正射校正的航空照片、由LiDAR生成的数字高程模型以及包含10个类别的分割地图。配套仓库
Attribute-Cooperated-Classification-Datasets -> 基于AID、UCM和Sydney的三个数据集。每张图像都配有场景分类标签和属性项标签向量。
open_earth_map -> 全球高分辨率土地覆被制图的基准数据集
孟买语义分割数据集
GAMUS -> 面向遥感数据的几何感知多模态语义分割基准数据集
openWUSU -> WUSU是一个专注于武汉城市结构及城市化进程的语义理解数据集
RSE_Cross-city -> 跨城事务：基于高分辨率领域适应网络的跨城语义分割多模态遥感基准数据集
AErial Lane -> AErial Lane (AEL) 数据集是首个为车道检测构建的大规模航空影像数据集，在约80公里道路的高分辨率图像上提供了高质量的折线型车道标注
切萨皮克道路空间上下文（RSC）
So2Sat-POP-DL -> 数据集发现：覆盖98个欧盟城市的So2Sat人口数据集
HouseTS -> 涵盖美国30个大都市区的长期多模态住房数据集。使用NAIP数据。附论文
印度全国1万块农作物田块边界 -> 使用Airbus SPOT卫星数据
OpenEarthMap-SAR -> 用于2025年IEEE GRSS数据融合竞赛赛道1：全天候土地覆被制图的VHR SAR数据。使用Umbra和Capella Space的数据
东京土地利用土地覆被数据集 -> 0.5米分辨率影像、两种10米分辨率LCP以及两种30米分辨率LCP

变化检测

S2Looking -> 用于建筑物变化检测的卫星侧视数据集，论文
Haiming-Z/MtS-WH-reference-map -> 基于MtS-WH的变化检测参考地图
MtS-WH-Dataset -> 多时相武汉场景（MtS-WH）数据集
SZTAKI -> 用于光学航空影像中变化检测的真实标签集合，这些影像拍摄时间间隔数年
DSIFN -> 变化检测数据集，由六幅大型双时相高分辨率影像组成，覆盖中国六个城市
道路变化检测数据集
3DCD -> 仅使用遥感光学双时相影像作为输入，无需数字高程模型（DEM），即可推断出3D变化检测地图
TUE-CD -> 用于地震后建筑物损毁评估的变化检测方法
Hi-UCD -> 超高分辨率城市变化检测，用于城市语义变化检测
LEVIR-CC-Dataset -> 用于遥感影像变化描述的大规模数据集
GDCLD -> 通过多源高分辨率遥感影像进行同震滑坡测绘的全球分布数据集
BANet变化检测数据集 - 遥感影像到地籍图
印度城市变化检测（ICCD）数据集

SAR专用数据集

HRSID -> 用于船舶检测、语义分割和实例分割任务的高分辨率SAR影像数据集
LS-SSDD-v1.0-OPEN -> 大规模SAR船舶检测数据集
WHU-SEN-City -> 一个涵盖中国34个大城市的SAR与光学影像配对翻译数据集
SAR_vehicle_detection_dataset -> 104张用于车辆检测的SAR影像，来源于Sandia MiniSAR/FARAD SAR影像和MSTAR影像
AIR-PolSAR-Seg -> 一个具有挑战性的PolSAR地形分割数据集
QXS-SAROPT -> 来自论文的光学与SAR配对数据集：用于SAR-光学数据融合深度学习的QXS-SAROPT数据集
SynthWakeSAR -> 用于海上船舶深度学习分类的合成SAR数据集，附论文
SAR2Opt-Heterogeneous-Dataset -> 用于遥感影像变化检测和图像转换基准的SAR-光学影像
OpenSARWake -> 用于SAR船舶航迹旋转检测的基准数据集。

专用应用

MUSIC4HA -> 多波段卫星影像用于目标分类（MUSIC），以检测热点区域
MUSIC4GC -> 多波段卫星影像用于目标分类（MUSIC），以检测高尔夫球场
MUSIC4P3 -> 多波段卫星影像用于目标分类（MUSIC），以检测光伏电站（太阳能电池板）
ABCDdataset -> 损害检测数据集，用于识别建筑物是否被海啸冲毁
火力发电厂数据集
SolarDK -> 一个高分辨率的城市太阳能电池板图像分类与定位数据集
油气基础设施测绘（OGIM）数据库 -> 包含重要的甲烷排放源——各类油气基础设施的位置及设施属性
架空风力涡轮机数据集 - NAIP
CloudTracks: 用于在云层卫星图像中定位船舶航迹的数据集 -> 该数据集包含1,780张MODIS卫星图像，人工标注了超过12,000条船舶航迹。
数字台风数据集 -> 旨在为长期时空数据的机器学习模型提供基准测试
BirdSAT -> 跨视角 iNaturalist 鸟类 2021：该跨视角鸟类物种数据集由地面拍摄的鸟类图像和卫星图像配对组成，并附有与 iNaturalist-2021 数据集相关的元信息。
RSHaze+ -> PhDnet 中的遥感去雾数据集：一种针对遥感图像的新型物理感知去雾网络
GMSEUS -> 美国全面的地面安装式太阳能能源数据集，包含子阵列设计元数据
MultiviewRS -> 用于探索多视角学习的遥感（RS）多视角数据集列表
SatDepth -> 一个用于卫星图像匹配和深度估计的新颖数据集
OpenSatMap -> 用于大规模地图构建及自动驾驶等下游任务

农业与环境

高光谱变化检测数据集——灌溉农业区
CNN-RNN-产量预测 -> 大豆数据集
FireRisk -> 用于火灾风险评估的遥感数据集，并提供了基于监督学习和自监督学习的基准测试
TimeMatch -> 用于作物识别的跨区域适应数据集，来自欧洲四个不同地区的SITS数据
Landsat 8 云覆盖评估验证数据
用于超分辨率的遥感卫星视频数据集
SpatioTemporalYield -> 涵盖美国玉米产量前五的州：爱荷华州、伊利诺伊州、印第安纳州、内布拉斯加州和明尼苏达州。
棕榈树数据集
ts-satfire -> 一个多任务卫星图像时间序列数据集，用于野火检测与预测
GTPBD -> 全球梯田地块与边界数据集

高光谱与多模态

AeroRIT -> 高光谱图像分析的新场景
Data-CSHSI -> 用于跨场景高光谱图像分类的开源数据集，包括休斯敦、帕维亚和HyRank数据集
HySpecNet-11k -> 一个大规模的高光谱基准数据集
STARCOP 数据集：利用高光谱机器学习模型进行甲烷羽流语义分割
图卢兹高光谱数据集
图卢兹高光谱数据集
多模态图像匹配 -> 包括多种遥感模态的图像匹配数据集
PanCollection -> 来自WorldView 2、WorldView 3、QuickBird、高分二号传感器的全色锐化数据集

基准与基础模型

EORSSD-dataset -> 扩展光学遥感显著性检测（EORSSD）数据集
ERA-DATASET -> 用于航空视频中事件识别的数据集和深度学习基准
SSL4EO-S12 -> 用于地球观测自监督学习的大规模数据集
AIR-CD -> 一个具有更高空间分辨率和更具代表性的地表覆盖类型的挑战性云检测数据集，名为AIR-CD
HRC_WHU -> 高分辨率云检测数据集，包含150张RGB图像，其分辨率在全球不同地区介于0.5至15米之间
University1652-Baseline -> 用于无人机地理定位的多视角、多源基准
benchmark_ISPRS2021 -> 一个新的用于深度学习的立体密集匹配基准数据集
WHU-Stereo -> 用于高分辨率卫星图像立体匹配的挑战性基准
GeoPile预训练数据集 -> 汇编了来自其他数据集的影像，包括RSD46-WHU、MLRSNet和RESISC45，用于基础模型的预训练
pangaea-bench -> 用于地理空间基础模型的全球性和包容性基准
VRSBench: 用于遥感图像理解的多功能视觉-语言基准数据集
SeeFar -> 适用于地理空间基础模型的卫星无关多分辨率数据集
dynnet -> DynamicEarthNet：用于语义变化分割的日度多光谱卫星数据集
Awesome-Remote-Sensing-Relative-Radiometric-Normalization-Datasets
AISD -> 用于阴影检测的航空影像数据集## Kaggle Kaggle 上托管了超过 200 个卫星图像数据集，搜索结果在此。 Kaggle 博客是一篇有趣的读物。

Kaggle - 从太空看亚马逊 - 分类挑战

https://www.kaggle.com/c/planet-understanding-the-amazon-from-space/data
来自行星鸽群卫星星座的3-5米分辨率GeoTIFF图像
12个类别，包括 - 云层、原始森林 + 水道 等
第一名获奖者访谈 - 使用了11个自定义CNN
FastAI 多标签图像分类
亚马逊雨林卫星照片的多标签分类
通过多标签分类 + VGG-19、Inceptionv3、AlexNet 和迁移学习来理解亚马逊雨林
amazon-classifier -> 比较随机森林与CNN
multilabel-classification -> 比较各种CNN架构
Planet-Amazon-Kaggle -> 使用fast.ai
deforestation_deep_learning
Track-Human-Footprint-in-Amazon-using-Deep-Learning
Amazon-Rainforest-CNN -> 在Tensorflow中使用了一个3层CNN
rainforest-tagging -> 在Tensorflow中使用卷积神经网络和循环神经网络进行卫星图像的多标签分类
satellite-deforestation -> 利用卫星图像识别森林砍伐的先行指标，应用于“从太空看亚马逊”Kaggle挑战赛

Kaggle - DSTL 分割挑战

https://www.kaggle.com/c/dstl-satellite-imagery-feature-detection
难度等级：中等，有许多优秀的示例（请参阅讨论区和内核），但由于该比赛是在几年前举行的，许多示例仍使用Python 2
WorldView 3 - 45张卫星图像，覆盖1公里×1公里区域，既有3波段（即RGB）图像，也有16波段（400nm - SWIR）图像
10个标注类别包括 - 建筑物、道路、树木、农作物、水道、车辆
对使用分割网络的第一名获奖者的访谈 - 使用了40多种模型，每种都针对特定目标进行了调整（例如道路、树木）
ZF_UNET_224_Pretrained_Model 第二名解决方案 ->
第三名解决方案 -> 探索了全色锐化和反射率指数的计算，并发表了arxiv论文
Deepsense 第四名解决方案
lopuhin 的参赛作品使用带有批量归一化的UNet
使用U-Net对卫星图像进行多类语义分割使用DSTL数据集，TensorFlow 1和Python 2.7。同时附有文章
Deep-Satellite-Image-Segmentation
Dstl-Satellite-Imagery-Feature-Detection-Improved
Satellite-imagery-feature-detection
Satellite_Image_Classification -> 使用XGBoost和集成分类方法
Unet-for-Satellite
building-segmentation -> TensorFlow U-Net实现，用于在卫星图像中分割建筑物

Kaggle - DeepSat 土地覆被分类

https://www.kaggle.com/datasets/crawford/deepsat-sat4 和 https://www.kaggle.com/datasets/crawford/deepsat-sat6
DeepSat-Kaggle -> 使用 Julia 语言
deepsat-aws-emr-pyspark -> 利用 PySpark 对农业用地的卫星影像进行图像分类

Kaggle - 空中客车船舶检测挑战赛

https://www.kaggle.com/c/airbus-ship-detection/overview
难度：中等，大多数解决方案采用深度学习，有许多内核，一个不错的示例内核
在卫星影像中检测船舶：五年之后…
我认为这个数据集存在一些问题，导致许多参赛者抱怨比赛被破坏了。
从 Kaggle 的空中客车挑战赛中学到的经验
Airbus-Ship-Detection -> 该方案在比赛中获得了 884 个参赛者中的第 139 名，结合了基于 ResNeXt50 的分类器和 U-net 分割模型。
Ship-Detection-Project -> 使用 Mask R-CNN 和 UNet 模型。
Airbus_SDC
Airbus_SDC_dup -> 该项目专注于检测重叠卫星影像中的重复区域。应用于空中客车船舶检测数据集。
airbus-ship-detection -> 带有 REST API 的 CNN。
使用 YOLOV4 从卫星图像中检测船舶 -> 使用 Kaggle 空中客车船舶检测数据集。
图像分割：Kaggle 经验 -> 由金牌得主 Vlad Shmyhlo 撰写的 Medium 文章。

Kaggle - 谷歌地球中的船只

https://www.kaggle.com/datasets/tomluther/ships-in-google-earth
794 张 JPEG 图像，展示了卫星影像中各种大小的船只，标注格式为 Pascal VOC，适用于目标检测模型。
/kaggle-ships-in-satellite-imagery-with-YOLOv8

Kaggle - 使用 Planet 卫星影像对旧金山湾的船只进行分类

https://www.kaggle.com/datasets/rhammell/ships-in-satellite-imagery
4000 张 80x80 的 RGB 图像，标记为“船”或“非船”，像素尺寸为 3 米。
shipsnet-detector -> 使用机器学习检测 Planet 影像中的集装箱船。
DeepLearningShipDetection
Ship-Detection-Using-Satellite-Imagery

Kaggle - Planesnet 分类数据集

https://www.kaggle.com/datasets/rhammell/planesnet -> 检测 Planet 卫星影像芯片中的飞机。
20x20 的 RGB 图像，“飞机”类别包含 8000 张图像，“非飞机”类别包含 24000 张图像。
数据集仓库和 planesnet-detector 展示了在此数据集上训练的小型 CNN 分类器。
ergo-planes-detector -> 一个基于 ergo 的项目，依赖于卷积神经网络来检测卫星影像中的飞机，使用 PlanesNet 数据集。
使用 AWS SageMaker/PlanesNet 处理卫星影像
Airplane-in-Planet-Image -> PyTorch 模型。

Kaggle - 带边界框的 CGI 卫星影像中的飞机

https://www.kaggle.com/datasets/aceofspades914/cgi-planes-in-satellite-imagery-w-bboxes
500 张计算机生成的飞机卫星图像。
使用 Faster RCNN 检测飞机
aircraft-detection-from-satellite-images-yolov3

Kaggle - 使用卫星影像检测游泳池和汽车

https://www.kaggle.com/datasets/kbhartiya83/swimming-pool-and-car-detection
3750 张住宅区的卫星影像，附带游泳池和汽车的标注数据。
使用 RetinaNet 在卫星影像上进行目标检测

Kaggle - Draper 挑战赛：按时间顺序排列图像

https://www.kaggle.com/c/draper-satellite-image-chronology/data
难度：困难。有用的内核不多。
图像被分成每组 5 张，每组都有相同的 setId。同一组中的每张图像都是在不同日期拍摄的（但不一定每天同一时间）。每组图像覆盖的区域大致相同，但并不完全对齐。
Kaggle 对使用 XGBOOST 和人类/ML 混合方法的参赛者进行了采访。
deep-cnn-sat-image-time-series -> 使用 LSTM。

Kaggle - 迪拜语义分割

https://www.kaggle.com/datasets/humansintheloop/semantic-segmentation-of-aerial-imagery
72 张阿联酋迪拜的卫星影像，被分割成 6 个类别。
dubai-satellite-imagery-segmentation -> 由于数据集较小，使用了图像增强技术。
使用 U-Net 对不平衡航空影像进行语义分割 -> 使用迪拜数据集。
Semantic-Segmentation-using-U-Net -> 使用 Keras。
unet_satelite_image_segmentation

Kaggle - 马萨诸塞州道路与建筑数据集 - 分割

https://www.kaggle.com/datasets/balraj98/massachusetts-roads-dataset
https://www.kaggle.com/datasets/balraj98/massachusetts-buildings-dataset
官方发布的数据集
Road_seg_dataset -> 道路数据集的一个子集，仅包含200张图像和对应的掩码
卫星影像中的道路和建筑语义分割使用U-Net模型和Keras框架处理马萨诸塞州道路数据集
fuweifu-vtoo的语义分割仓库 -> 使用PyTorch框架，并基于马萨诸塞州建筑与道路数据集
ssai-cnn -> 这是Volodymyr Mnih在其博士论文中提出的方法在马萨诸塞州道路与建筑数据集上的实现
building-footprint-segmentation -> 一个可通过pip安装的库，用于训练卫星和航空影像中的建筑物轮廓分割模型，应用于马萨诸塞州建筑数据集和Inria航空影像标注数据集
使用语义分割和Albumentations数据增强进行道路检测，使用马萨诸塞州道路数据集、U-Net和Keras
Image-Segmentation) -> 使用马萨诸塞州道路数据集和fast.ai框架

Kaggle - Deepsat分类挑战赛

这不是卫星影像，而是航空影像。每个样本图像为28x28像素，包含红、绿、蓝和近红外四个波段。训练和测试标签为1x6的独热编码向量。每张图像块都被归一化为28x28像素大小。数据以.mat格式存储，可能是JPEG格式？

Sat4 包含50万张图像块，覆盖四大类地表覆盖类型——荒地、树木、草地以及其他所有不属于前三种的地表覆盖类型
Sat6 包含40.5万张28x28像素大小的图像块，覆盖六种地表覆盖类型——荒地、树木、草地、道路、建筑物和水体

Kaggle - 高分辨率舰船数据集2016 (HRSC2016)

https://www.kaggle.com/datasets/guofeng/hrsc2016
从Google Earth上采集的舰船图像
HRSC2016_SOTA -> 对HRSC2016数据集上不同算法的公平比较

Kaggle - SWIM-船舶尾迹影像马萨诸塞州

https://www.kaggle.com/datasets/lilitopia/swimship-wake-imagery-mass
一个专为深度学习构建的光学船舶尾迹检测基准数据集
WakeNet -> 基于CNN的光学图像船舶尾迹检测器，代码对应2021年的论文：重新思考自动船舶尾迹检测：基于光学图像的最新CNN尾迹检测技术

Kaggle - 从卫星图像理解云层

在这个挑战赛中，你需要构建一个模型来对卫星图像中的云层组织模式进行分类。

Kaggle - 38-Cloud云分割

https://www.kaggle.com/datasets/sorour/38cloud-cloud-segmentation-in-satellite-images
包含38张Landsat 8影像以及手动提取的像素级真值
38-Cloud GitHub仓库及其后续的95-Cloud数据集
如何从零开始在PyTorch中为Kaggle上的多波段卫星图像数据集创建自定义数据集/加载器
Cloud-Net: 一种用于云检测的语义分割CNN -> 一种端到端的云检测算法，适用于Landsat 8影像，并在38-Cloud训练集上进行训练
利用深度学习对卫星图像中的云层进行分割 -> 使用Unet模型对Kaggle 38-Cloud数据集进行语义分割

Kaggle - 空客飞机检测数据集

https://www.kaggle.com/airbusgeo/airbus-aircrafts-sample-dataset
包括一百个民用机场和超过3000架已标注的商用飞机
使用YOLOv5在空客Pleiades影像上检测飞机
pytorch-remote-sensing -> 使用“空客飞机检测”数据集和PyTorch中的Faster-RCNN模型（骨干网络为ResNet-50）进行飞机检测

Kaggle - 空客石油储存检测数据集

https://www.kaggle.com/airbusgeo/airbus-oil-storage-detection-dataset
使用Mask R-CNN进行油罐实例分割，并配有相关文章使用Mask R-CNN进行油罐实例分割
使用YOLOX在空客影像上检测石油储存设施 -> 使用Kaggle空客石油储存检测数据集
油罐数据准备-YOLO格式

Kaggle - 飓风灾害卫星影像

Kaggle - 奥斯汀分区卫星图像

https://www.kaggle.com/datasets/franchenstein/austin-zoning-satellite-images
将奥斯汀的图像分类到其各个区域，例如住宅区、工业区等。共有3667张卫星图像。

Kaggle - Statoil/C-CORE 冰山分类挑战赛

将SAR图像中的目标分类为船只或冰山。该竞赛的数据集包含5000张从Sentinel-1卫星采集的多通道SAR数据中提取的图像。排名靠前的参赛者通过集成方法将预测准确率从约92%提升至97%。

https://www.kaggle.com/c/statoil-iceberg-classifier-challenge/data
对大卫·奥斯汀的采访：第一名获奖者
radar-image-recognition
Iceberg-Classification-Using-Deep-Learning -> 使用Keras
Deep-Learning-Project -> 使用Keras
shehabsunny的冰山分类挑战赛解决方案 -> 使用Keras
利用深度学习分析卫星雷达影像 -> 由Matlab实现，使用带有贪心搜索的集成方法
第16名的解决方案
fastai解决方案

Kaggle - DeepGlobe挑战赛的土地覆盖分类数据集 - 分割

https://www.kaggle.com/datasets/balraj98/deepglobe-land-cover-classification-dataset
使用CNN进行卫星影像语义分割 -> 7种不同的分割类别，基于DeepGlobe土地覆盖分类挑战赛的数据集，并附有代码库
使用U-Net进行土地覆盖分类 -> 使用PyTorch实现的U-Net进行卫星影像多类语义分割任务，采用DeepGlobe土地覆盖分割数据集，并提供代码
DeepGlobe土地覆盖分类挑战赛的解决方案

Kaggle - 次日野火蔓延

一个基于遥感数据预测野火蔓延的数据集

Kaggle - 卫星次日野火蔓延

受上述数据集启发，使用了不同的数据源

Kaggle - Spacenet 7 多时相城市变化检测

https://www.kaggle.com/datasets/amerii/spacenet-7-multitemporal-urban-development
SatFootprint -> 在Spacenet 7数据集上进行建筑物分割

Kaggle - 卫星图像用于预测非洲贫困

https://www.kaggle.com/datasets/sandeshbhat/satellite-images-to-predict-povertyafrica
利用卫星影像和夜间灯光数据来预测当地贫困水平
Predicting-Poverty -> 结合卫星影像和机器学习以预测贫困，使用PyTorch实现

Kaggle - NOAA渔业斯特勒海狮种群计数

https://www.kaggle.com/competitions/noaa-fisheries-steller-sea-lion-population-count -> 从航拍图像中统计海狮数量
Sealion-counting
Sealion_Detection_Classification

Kaggle - 北极海冰图像掩膜

Kaggle - Overhead-MNIST

作为MNIST的替代基准卫星数据集
https://www.kaggle.com/datasets/datamunge/overheadmnist -> Kaggle
https://arxiv.org/abs/2102.04266 -> 论文
https://github.com/reveondivad/ov-mnist -> GitHub

Kaggle - 卫星图像分类

Kaggle - EuroSAT - Sentinel-2 数据集

https://www.kaggle.com/datasets/raoofnaushad/eurosat-sentinel2-dataset
使用Sentinel-2卫星进行RGB土地覆盖与土地利用分类
用于论文卫星图像的数据增强

Kaggle - 水体卫星图像

https://www.kaggle.com/datasets/franciscoescobar/satellite-images-of-water-bodies
pytorch-waterbody-segmentation -> 基于Kaggle水体卫星图像数据集训练的UNET模型。该模型已部署在Hugging Face Spaces上。

Kaggle - NOAA海狮计数

https://www.kaggle.com/c/noaa-fisheries-steller-sea-lion-population-count
noaa -> 使用UNET、目标检测及图像级回归方法

Kaggle - 杂项

https://www.kaggle.com/datasets/reubencpereira/spatial-data-repo -> 卫星影像 + 贷款数据
https://www.kaggle.com/datasets/towardsentropy/oil-storage-tanks -> 工业油罐的图像数据，附有边界框标注，可通过阴影估算油罐的填充百分比
https://www.kaggle.com/datasets/airbusgeo/airbus-wind-turbines-patches -> 空客SPOT卫星拍摄的风力涡轮机区域图像，用于分类任务
https://www.kaggle.com/datasets/aceofspades914/cgi-planes-in-satellite-imagery-w-bboxes -> CGI飞机目标检测数据集
https://www.kaggle.com/datasets/atilol/aerialimageryforroofsegmentation -> 用于屋顶分割的航拍影像
https://www.kaggle.com/datasets/andrewmvd/ship-detection -> 621张船只和舰艇的图片
https://www.kaggle.com/datasets/alpereniek/vehicle-detection-from-satellite-images-data-set
https://www.kaggle.com/datasets/sergiishchus/maxar-satellite-data -> Maxar公司提供的示例数据，分辨率为15厘米
https://www.kaggle.com/datasets/cici118/swimming-pool-detection-algarves-landscape
https://www.kaggle.com/datasets/donkroco/solar-panel-module -> 太阳能电池板的目标检测
https://www.kaggle.com/datasets/balraj98/deepglobe-road-extraction-dataset -> 道路分割
https://www.kaggle.com/datasets/towardsentropy/oil-storage-tanks -> 工业储油罐的图像数据，附有边界框标注
https://www.kaggle.com/competitions/widsdatathon2019/ -> 棕榈油种植园
https://www.kaggle.com/datasets/siddharthkumarsah/ships-in-aerial-images -> 航拍图像中的船只/船舶
https://www.kaggle.com/datasets/jangsienicajzkowy/afo-aerial-dataset-of-floating-objects -> 用于海上搜救应用的航拍数据集
https://www.kaggle.com/datasets/yaroslavnaychuk/satelliteimagesegmentation -> 对高分卫星影像进行分割，数据来自GID-15数据集

竞赛

竞赛是获取干净、可直接使用的卫星数据集及模型基准测试的绝佳途径。

https://codalab.lisn.upsaclay.fr/competitions/9603 -> 多样化卫星影像的目标检测
https://www.drivendata.org/competitions/143/tick-tick-bloom/ -> 检测并分类藻华
https://www.drivendata.org/competitions/81/detect-flood-water/ -> 根据雷达影像绘制洪水范围图
https://platform.ai4eo.eu/enhanced-sentinel2-agriculture -> 利用Sentinel影像绘制耕地分布图
https://www.diu.mil/ai-xview-challenge -> 多个挑战，涵盖从渔船检测到建筑物损毁评估等多个方向
https://competitions.codalab.org/competitions/30440 -> 洪水检测
https://www.drivendata.org/competitions/83/cloud-cover/ -> 云层覆盖检测
https://www.drivendata.org/competitions/78/overhead-geopose-challenge/page/372/ -> 基于单视角斜视卫星影像预测地心姿态
https://www.drivendata.org/competitions/60/building-segmentation-disaster-resilience/ -> 建筑物分割
https://captain-whu.github.io/DOTA/ -> 用于航拍影像中目标检测的大型数据集
https://spacenet.ai/ -> 包含道路网络检测等8个挑战的数据集
https://huggingface.co/spaces/competitions/ChaBuD-ECML-PKDD2023 -> 针对加利福尼亚州森林火灾监测的二值图像分割任务

https://spaceml.org/repo/project/6269285b14d764000d798fde -> 用于洪水相关的机器学习
https://spaceml.org/repo/project/60002402f5647f00129f7287 -> 闪电与极端天气
https://spaceml.org/repo/project/6025107d79c197001219c481/true -> 约1TB的降水预报数据集
https://spaceml.org/repo/project/61c0a1b9ff8868000dfb79e1/true -> Sentinel-2影像超分辨率

常见问题

遥感图像中为什么会出现阴影？这是否意味着它们不是真正的遥感图像？

如何添加新的数据集（例如 OpenSatMap）到项目中？

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

★ 349.3k|★★★☆☆|1周前

Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|1周前

开发框架图像Agent

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 108.3k|★★☆☆☆|1周前

开发框架图像Agent

gemini-cli

gemini-cli 是一款由谷歌推出的开源 AI 命令行工具，它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言，它提供了一条从输入提示词到获取模型响应的最短路径，无需切换窗口即可享受智能辅助。这款工具主要解决了开发过程中频繁上下文切换的痛点，让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用，还是执行复杂的 Git 操作，gemini-cli 都能通过自然语言指令高效处理。它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口，具备出色的逻辑推理能力；内置 Google 搜索、文件操作及 Shell 命令执行等实用工具；更独特的是，它支持 MCP（模型上下文协议），允许用户灵活扩展自定义集成，连接如图像生成等外部能力。此外，个人谷歌账号即可享受免费的额度支持，且项目基于 Apache 2.0 协议完全开源，是提升终端工作效率的理想助手。

★ 100.8k|★★☆☆☆|1周前

插件Agent图像

LLMs-from-scratch

LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目，旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型（LLM）。它不仅是同名技术著作的官方代码库，更提供了一套完整的实践方案，涵盖模型开发、预训练及微调的全过程。该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型，却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码，用户能够透彻掌握 Transformer 架构、注意力机制等关键原理，从而真正理解大模型是如何“思考”的。此外，项目还包含了加载大型预训练权重进行微调的代码，帮助用户将理论知识延伸至实际应用。 LLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API，而是渴望探究模型构建细节的技术人员而言，这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计：将复杂的系统工程拆解为清晰的步骤，配合详细的图表与示例，让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础，还是为未来研发更大规模的模型做准备

★ 90.1k|★★★☆☆|1周前

语言模型图像Agent

Deep-Live-Cam

Deep-Live-Cam 是一款专注于实时换脸与视频生成的开源工具，用户仅需一张静态照片，即可通过“一键操作”实现摄像头画面的即时变脸或制作深度伪造视频。它有效解决了传统换脸技术流程繁琐、对硬件配置要求极高以及难以实时预览的痛点，让高质量的数字内容创作变得触手可及。这款工具不仅适合开发者和技术研究人员探索算法边界，更因其极简的操作逻辑（仅需三步：选脸、选摄像头、启动），广泛适用于普通用户、内容创作者、设计师及直播主播。无论是为了动画角色定制、服装展示模特替换，还是制作趣味短视频和直播互动，Deep-Live-Cam 都能提供流畅的支持。其核心技术亮点在于强大的实时处理能力，支持口型遮罩（Mouth Mask）以保留使用者原始的嘴部动作，确保表情自然精准；同时具备“人脸映射”功能，可同时对画面中的多个主体应用不同面孔。此外，项目内置了严格的内容安全过滤机制，自动拦截涉及裸露、暴力等不当素材，并倡导用户在获得授权及明确标注的前提下合规使用，体现了技术发展与伦理责任的平衡。

★ 88.9k|★★★☆☆|1周前

开发框架图像Agent