earth2studio
Earth2Studio 是 NVIDIA 推出的开源深度学习框架,旨在帮助用户快速探索、构建和部署基于人工智能的天气与气候工作流。它主要解决了传统气象模拟计算成本高、门槛高以及不同 AI 模型与数据源之间集成困难的问题,让用户仅需几行代码即可调用主流模型进行预测。
这款工具非常适合气象科研人员、AI 开发者以及地球系统科学领域的研究者使用。无论是需要复现前沿算法的学者,还是希望将 AI 预报能力融入业务系统的工程师,都能通过 Earth2Studio 高效开展工作。
其核心技术亮点在于强大的模块化设计与广泛的兼容性。Earth2Studio 并非单一模型,而是一个灵活的接口平台,原生支持 NVIDIA FourCastNet3、ECMWF AIFS、Google GraphCast 等多种顶级第三方预训练模型,并能无缝对接 GFS、IFS 等全球权威气象数据源。此外,它还提供了先进的数据同化功能(如 StormCast SDA 和 HealDA),支持高分辨率区域预测,并内置了标准化的输入输出后端(如 Zarr),极大地简化了从实验研究到实际部署的全流程。借助 Earth2Studio,用户可以更专注于科学发现与算法创新,而非繁琐的工程配置。
使用场景
某气象科技公司的算法团队正急需为沿海风电场构建一套高分辨率的短期风速预测系统,以优化发电调度策略。
没有 earth2studio 时
- 模型集成繁琐:团队需分别下载 FourCastNet、GraphCast 等不同架构的预训练权重,手动编写复杂的加载脚本和数据预处理管道,耗时数周。
- 数据源对接困难:将全球预报系统(GFS)或 ECMWF 数据转换为特定模型所需的张量格式极易出错,且缺乏统一的标准接口。
- 工作流复用性差:每次更换模型或测试新数据集时,都需要重构大量底层代码,导致实验迭代周期漫长。
- 部署门槛高:缺乏标准化的推理和输出模块,将实验代码转化为生产级服务需要额外的工程化投入。
使用 earth2studio 后
- 一键加载模型:通过
FCN3.load_model等标准化 API,仅需几行代码即可直接调用 NVIDIA、Google 等主流 AI 气象模型,大幅缩短启动时间。 - 统一数据接口:内置 GFS、IFS 等数据源适配器,自动处理数据对齐与格式化,消除了手动清洗数据的痛点。
- 灵活编排工作流:利用统一的
run接口,团队可像搭积木般快速切换模型与数据组合,一天内即可完成多种方案的对比验证。 - 标准化输出管理:原生支持 Zarr 后端存储,直接生成云友好的预测结果文件,无缝衔接后续的业务分析系统。
earth2studio 将原本需要数周的环境搭建与数据对齐工作压缩至小时级,让团队能专注于核心算法优化而非底层工程琐事。
运行环境要求
- 未说明
需要 NVIDIA GPU(由 NVIDIA 开发,支持 Earth-2 模型),具体显存大小和 CUDA 版本未在 README 中明确说明
未说明

快速开始
NVIDIA Earth2Studio
Earth2Studio 是一个基于 Python 的软件包,旨在帮助用户快速上手并运行 AI 地球系统模型。 我们的使命是让每个人都能构建、研究和探索由人工智能驱动的天气与气候科学。
- Earth2Studio 文档 -

快速入门
只需几行代码即可运行 AI 天气预测。
NVIDIA FourCastNet3
from earth2studio.models.px import FCN3
from earth2studio.data import GFS
from earth2studio.io import ZarrBackend
from earth2studio.run import deterministic as run
model = FCN3.load_model(FCN3.load_default_package())
data = GFS()
io = ZarrBackend("outputs/fcn3_forecast.zarr")
run(["2025-01-01T00:00:00"], 10, model, data, io)
ECMWF AIFS
from earth2studio.models.px import AIFS
from earth2studio.data import IFS
from earth2studio.io import ZarrBackend
from earth2studio.run import deterministic as run
model = AIFS.load_model(AIFS.load_default_package())
data = IFS()
io = ZarrBackend("outputs/aifs_forecast.zarr")
run(["2025-01-01T00:00:00"], 10, model, data, io)
Google Graphcast
from earth2studio.models.px import GraphCastOperational
from earth2studio.data import GFS
from earth2studio.io import ZarrBackend
from earth2studio.run import deterministic as run
package = GraphCastOperational.load_default_package()
model = GraphCastOperational.load_model(package)
data = GFS()
io = ZarrBackend("outputs/graphcast_operational_forecast.zarr")
run(["2025-01-01T00:00:00"], 4, model, data, io)
[!重要提示] Earth2Studio 是第三方模型、检查点和数据集的接口。 这些资源的许可权归其提供商所有。 请确保您拥有下载、使用以及(如适用)再分发每个模型和数据集的权利。 每个模型/数据源的 API 文档中通常会提供原始许可和来源的链接。
最新消息
- StormCast SDA, 基于评分的数据同化 (SDA) 结合 StormCast 实现高分辨率区域天气预报,现已推出,并附带新的数据同化模型工具。
- 数据同化模型,一种用于数据同化的新型模型类别,包括等距圆柱投影插值和 HealDA。
- NOAA UFS 观测数据源, 用于卫星和常规观测的数据框现已采用新的 Earth2Studio 基础架构提供。
- Planetary Computer 数据源 新增了 ECMWF IFS 分析数据以及 GOES 云和湿度影像。
有关最新功能和改进的完整列表,请参阅 变更日志。
概述
Earth2Studio 是一款专注于天气和气候应用的 AI 推理管道工具包,旨在兼容不同的 AI 框架、模型架构、数据源和 SciML 工具,同时提供统一的 API。

Earth2Studio 中各个核心组件的可组合性,使得开发和部署日益复杂的管道变得轻而易举,这些管道可以将多个数据源、AI 模型和其他模块串联起来。

Earth2Studio 统一的生态系统为用户提供了快速替换组件选项的机会。 除了拥有最大的天气/气候 AI 模型库之外,Earth2Studio 还配备了诸多实用功能,例如针对云数据存储的优化数据访问、统计运算等,以加速您的管道流程。

Earth-2 开放模型
访问最先进的 Nvidia 开放式气候与天气模型:Earth-2 开放模型。 有关这些模型的训练配方,请参阅 PhysicsNeMo 仓库。
特性
Earth2Studio 软件包专注于为您提供构建自定义工作流、管道、API 或软件包所需的工具,使用包括以下内容在内的模块化组件:
预报模型
预报模型 在 Earth2Studio 中执行时间积分,即以某一特定时刻的大气场作为输入,通过自回归方式逐步预测未来的大气场(通常每步 6 小时),从而实现单步预测及长期时间序列预报。
Earth2Studio 拥有目前规模最大的预训练先进 AI 天气/气候模型集合,涵盖全球预报模型到区域专用模型,覆盖多种分辨率、架构和预报能力,以满足不同的计算和精度需求。
可用模型包括但不限于:
| 模型 | 分辨率 | 架构 | 时间步长 | 覆盖范围 |
|---|---|---|---|---|
| GraphCast Small | 1.0° | 图神经网络 | 6小时 | 全球 |
| GraphCast Operational | 0.25° | 图神经网络 | 6小时 | 全球 |
| Pangu 3hr | 0.25° | Transformer | 3小时 | 全球 |
| Pangu 6hr | 0.25° | Transformer | 6小时 | 全球 |
| Pangu 24hr | 0.25° | Transformer | 24小时 | 全球 |
| Aurora | 0.25° | Transformer | 6小时 | 全球 |
| FuXi | 0.25° | Transformer | 6小时 | 全球 |
| AIFS | 0.25° | Transformer | 6小时 | 全球 |
| AIFS Ensemble | 0.25° | Transformer集成 | 6小时 | 全球 |
| StormCast | 3公里 | 扩散+回归 | 1小时 | 区域(美国) |
| SFNO | 0.25° | 神经算子 | 6小时 | 全球 |
| DLESyM | 0.25° | 卷积 | 6小时 | 全球 |
完整列表请参阅 预报模型API文档。
诊断模型
Earth2Studio中的诊断模型执行与时间无关的转换,通常接收特定时刻的地理空间场,并预测新的派生量,而不进行时间积分。这使得用户能够构建管道来预测预报模型可能未提供的特定感兴趣量。
Earth2Studio包含越来越多的专用诊断模型,用于各种现象,包括降水预测、热带气旋追踪、太阳辐射估算、阵风预报等。
可用的诊断模型包括但不限于:
| 模型 | 分辨率 | 架构 | 覆盖范围 | 输出 |
|---|---|---|---|---|
| PrecipitationAFNO | 0.25° | 神经算子 | 全球 | 总降水量 |
| SolarRadiationAFNO1H | 0.25° | 神经算子 | 全球 | 地表太阳辐射 |
| WindgustAFNO | 0.25° | AFNO | 全球 | 最大阵风 |
| TCTrackerVitart | 0.25° | 算法 | 全球 | 热带气旋路径及特性 |
| CBottleInfill | 100公里 | 扩散 | 全球 | 全球气候样本 |
| CBottleSR | 5公里 | 扩散 | 区域/全球 | 高分辨率气候 |
| CorrDiff | 变量 | 扩散 | 区域 | 细尺度天气 |
| CorrDiffTaiwan | 2公里 | 扩散 | 区域(台湾) | 台湾细尺度天气 |
完整列表请参阅 诊断模型API文档。
数据源
Earth2Studio中的数据源提供标准化的API,用于访问来自不同提供商的气象和气候数据集(数值模型、数据同化结果以及AI生成的数据),从而实现对模型推理初始条件和评分验证数据的无缝集成,支持跨不同数据格式和存储系统的操作。
Earth2Studio包含从业务运行的天气模型(GFS、HRRR、IFS)和再分析数据集(通过ARCO、CDS获取的ERA5),到AI生成的气候数据(cBottle)以及本地文件系统等多种数据源。获取数据非常简单,Earth2Studio会处理复杂的部分,为您提供一个易于使用的Xarray数据数组,所有数据都遵循统一的包级vocabulary和坐标系统。
可用的数据源包括但不限于:
| 数据源 | 类型 | 分辨率 | 覆盖范围 | 数据格式 |
|---|---|---|---|---|
| GFS | 业务运行 | 0.25° | 全球 | GRIB2 |
| GFS_FX | 预报 | 0.25° | 全球 | GRIB2 |
| HRRR | 业务运行 | 3公里 | 区域(美国) | GRIB2 |
| HRRR_FX | 预报 | 3公里 | 区域(美国) | GRIB2 |
| ARCO ERA5 | 再分析 | 0.25° | 全球 | Zarr |
| CDS | 再分析 | 0.25° | 全球 | NetCDF |
| IFS | 业务运行 | 0.25° | 全球 | GRIB2 |
| NCAR_ERA5 | 再分析 | 0.25° | 全球 | NetCDF |
| WeatherBench2 | 再分析 | 0.25° | 全球 | Zarr |
| GEFS_FX | 集合预报 | 0.25° | 全球 | GRIB2 |
| ISD | 观测 | 点 | 区域(美国) | CSV |
| MRMS | 再分析 | 1公里 | 区域(美国) | GRIB2 |
完整列表请参阅 数据源API文档。
IO后端
Earth2Studio中的IO后端提供了一个标准化的接口,用于以不同的文件格式和存储系统写入和存储管道输出,使用户能够保存推理结果以便后续处理。
Earth2Studio包含的IO后端范围从传统的科学格式(NetCDF)和现代云优化格式(Zarr),到内存存储后端。
可用的IO后端包括:
| IO后端 | 格式 | 特性 | 存储位置 |
|---|---|---|---|
| ZarrBackend | Zarr | 压缩、分块 | 内存/本地 |
| AsyncZarrBackend | Zarr | 异步写入、并行I/O | 内存/本地/远程 |
| NetCDF4Backend | NetCDF4 | 符合CF标准、元数据 | 内存/本地 |
| XarrayBackend | Xarray Dataset | 丰富的元数据、便于分析 | 内存 |
| KVBackend | 键值 | 快速临时访问 | 内存 |
完整列表请参阅 IO API文档。
扰动方法
Earth2Studio中的Perturbation methods提供了一个标准化的接口,用于向数据数组添加噪声,通常可以创建捕捉天气和气候预测不确定性的集合预报管道。
可用的扰动方法包括但不限于:
| 扰动方法 | 类型 | 空间相关性 | 时间相关性 |
|---|---|---|---|
| Gaussian | 噪声 | 无 | 无 |
| Correlated SphericalGaussian | 噪声 | 球形 | AR(1)过程 |
| Spherical Gaussian | 噪声 | 球形(Matern) | 无 |
| Brown | 噪声 | 二维傅里叶 | 无 |
| Bred Vector | 动力学 | 依赖于模型 | 依赖于模型 |
| Hemispheric Centred Bred Vector | 动力学 | 半球 | 依赖于模型 |
完整列表请参阅 扰动API文档。
统计/指标
Earth2Studio中的统计和指标提供了一系列操作,通常用于在管道中评估预报性能,涵盖空间、时间、集合等多个维度,通过多种统计指标,包括误差指标、相关系数和集合验证统计等。
可用的操作包括但不限于:
| 统计 | 类型 | 应用 |
|---|---|---|
| RMSE | 误差指标 | 预报准确性 |
| ACC | 相关性 | 模式相关性 |
| CRPS | 集合指标 | 概率技能 |
| Rank Histogram | 集合指标 | 集合可靠性 |
| Standard Deviation | 矩 | 散度测量 |
| Spread-Skill Ratio | 集合指标 | 集合校准 |
完整列表请参阅 统计API文档。
如需更完整的功能列表,请务必查看文档。 没有找到您需要的内容吗? 好消息是,扩展和定制是我们设计的核心。
贡献者
请参阅贡献指南,了解详细的技术要求;同时阅读用户指南,以理解更高层次的理念、架构和设计。
许可证
Earth2Studio 采用 Apache License 2.0 许可证发布,完整许可文本请参阅LICENSE 文件。
版本历史
0.13.02026/03/230.12.12026/01/290.12.02026/01/270.11.02025/12/190.10.02025/11/240.9.02025/08/190.8.12025/07/070.8.02025/06/180.7.02025/05/210.6.02025/04/150.5.02025/03/270.4.02024/12/130.3.02024/09/240.2.02024/07/230.1.02024/04/21常见问题
相似工具推荐
openclaw
OpenClaw 是一款专为个人打造的本地化 AI 助手,旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚,能够直接接入你日常使用的各类通讯渠道,包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息,OpenClaw 都能即时响应,甚至支持在 macOS、iOS 和 Android 设备上进行语音交互,并提供实时的画布渲染功能供你操控。 这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地,用户无需依赖云端服务即可享受快速、私密的智能辅助,真正实现了“你的数据,你做主”。其独特的技术亮点在于强大的网关架构,将控制平面与核心助手分离,确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者,以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力(支持 macOS、Linux 及 Windows WSL2),即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你
stable-diffusion-webui
stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。
everything-claude-code
everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上
ComfyUI
ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。
markitdown
MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具,专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片(含 OCR)、音频(含语音转录)、HTML 乃至 YouTube 链接等多种格式的解析,能够精准提取文档中的标题、列表、表格和链接等关键结构信息。 在人工智能应用日益普及的今天,大语言模型(LLM)虽擅长处理文本,却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点,它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式,成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外,它还提供了 MCP(模型上下文协议)服务器,可无缝集成到 Claude Desktop 等 LLM 应用中。 这款工具特别适合开发者、数据科学家及 AI 研究人员使用,尤其是那些需要构建文档检索增强生成(RAG)系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性,但其核心优势在于为机器
LLMs-from-scratch
LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目,旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型(LLM)。它不仅是同名技术著作的官方代码库,更提供了一套完整的实践方案,涵盖模型开发、预训练及微调的全过程。 该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型,却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码,用户能够透彻掌握 Transformer 架构、注意力机制等关键原理,从而真正理解大模型是如何“思考”的。此外,项目还包含了加载大型预训练权重进行微调的代码,帮助用户将理论知识延伸至实际应用。 LLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API,而是渴望探究模型构建细节的技术人员而言,这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计:将复杂的系统工程拆解为清晰的步骤,配合详细的图表与示例,让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础,还是为未来研发更大规模的模型做准备
