weatherbench2

597 67 较难 1 次阅读 5天前Apache-2.0其他

AI 解读由 AI 自动生成，仅供参考

WeatherBench 2 是专为评估和比较新一代数据驱动全球天气预报模型而设计的开源基准框架。它旨在解决当前气象 AI 领域缺乏统一、公平且可扩展的评估标准这一痛点，让研究人员能够直观地对比深度学习模型与传统数值预报方法的性能差异。

该工具主要服务于气象学研究者、AI 算法开发者以及数据科学家。如果你正在开发新的天气预报模型，或希望验证现有算法在真实场景下的表现，WeatherBench 2 提供了理想的测试环境。其核心亮点在于提供了一套云端优化的公开真值数据集和基线数据，并配套了高度可扩展的开源评估代码。基于 Xarray-Beam 构建的命令行脚本，使其能够高效处理高分辨率的大规模预报文件，甚至支持在 Google Cloud 上通过 DataFlow 进行分布式运行。此外，项目还维护着一个实时更新的前沿模型得分榜单，促进了社区内的透明交流与协作。作为由谷歌研究团队推出的演进型工具，WeatherBench 2 正成为推动智能气象预报技术发展的重要基础设施。

使用场景

某气象科技公司的算法团队正在研发新一代数据驱动的全球天气预报模型，急需一套标准流程来验证模型精度并与业界顶尖方案进行公平对比。

没有 weatherbench2 时

数据获取混乱：团队需自行从不同源下载和清洗海量气象数据，格式不统一且缺乏云优化，导致预处理耗时数周。
评估标准不一：缺乏统一的基准测试代码，自定义的评估脚本难以复现，无法确保与竞争对手的对比结果公平可信。
算力瓶颈明显：面对高分辨率预报文件，本地单机脚本经常因内存溢出而崩溃，难以扩展至全球尺度的大规模计算。
行业对标困难：无法实时获取最新的主流模型得分，难以判断自身模型在行业中的真实水位，研发方向容易偏离。

使用 weatherbench2 后

数据开箱即用：直接调用其提供的云端优化真值与基线数据集，无需繁琐清洗，将数据准备时间从数周缩短至数小时。
评估权威统一：利用其开源评估代码库，一键生成符合学术标准的各项指标，确保了对比结果的公正性与可复现性。
弹性伸缩计算：基于 Xarray-Beam 架构，轻松将评估任务部署到 Google Cloud DataFlow，高效处理 TB 级高分辨率数据而不崩溃。
实时榜单参照：通过官方仪表盘实时查看 SOTA（最先进）模型得分，快速定位自身模型差距，精准调整优化策略。

weatherbench2 通过提供标准化的数据、代码与榜单，彻底消除了气象 AI 研发中的“重复造轮子”现象，让团队能专注于核心算法的创新与突破。

运行环境要求

操作系统

未说明

GPU

未说明

内存

未说明（处理高分辨率数据需大规模计算资源，建议使用 GCP DataFlow 进行扩展）

依赖

notes该工具主要设计用于在 Google Cloud Platform (GCP) 上通过 DataFlow 运行以处理大规模高分辨率气象数据。官方已发布更新版本 WeatherBench-X，建议用户迁移至新代码库。具体依赖库版本未在 README 中列出，需参考官方文档或源代码。

python未说明

xarray-beam

Apache Beam (用于 GCP DataFlow)

快速开始

logo

WeatherBench 2 - 下一代数据驱动全球天气模型的基准测试平台

🚨🚨🚨 WeatherBench-X 已发布。它提供了我们评估代码库的更新版本。我们鼓励用户切换到新的代码库。数据指南仍然保持最新。 🚨🚨🚨

arXiv 论文
 Google AI 博客文章

为什么需要 WeatherBench？

WeatherBench 2 是一个用于评估和比较数据驱动型与传统数值天气预报模型的框架。WeatherBench 包含：

公开可用、针对云端优化的真实值和基线数据集。完整列表请参阅此页面。
开源的评估代码。请参阅此快速入门以了解基本功能，或查阅 API 文档获取更多细节。由于高分辨率预报文件可能体积庞大，WeatherBench 2 的代码在设计时充分考虑了可扩展性。请参阅基于 Xarray-Beam 的命令行脚本，以及此指南，了解如何使用 DataFlow 在 GCP 上运行这些脚本。
一个网站，展示众多最先进数据驱动方法和物理方法的最新评分。
一篇论文，详细阐述了评估设置背后的原理。

WeatherBench 2 被构建为面向整个社区的不断发展的工具。因此，我们欢迎任何反馈（最好通过 GitHub 问题提交）或贡献。如果您希望将自己的模型纳入 WeatherBench，请查看此指南。

引用

@misc{rasp2023weatherbench,
      title={WeatherBench 2: 下一代数据驱动全球天气模型的基准测试平台}, 
      author={Stephan Rasp 和 Stephan Hoyer 和 Alexander Merose 和 Ian Langmore 和 Peter Battaglia 和 Tyler Russel 和 Alvaro Sanchez-Gonzalez 和 Vivian Yang 和 Rob Carver 和 Shreya Agrawal 和 Matthew Chantry 和 Zied Ben Bouallegue 和 Peter Dueben 和 Carla Bromberg 和 Jared Sisk 和 Luke Barrington 和 Aaron Bell 和 Fei Sha},
      year={2023},
      eprint={2308.15560},
      archivePrefix={arXiv},
      primaryClass={physics.ao-ph}
}

许可证

本项目并非 Google 官方产品。

版权所有 2023 Google LLC

根据 Apache License, Version 2.0（“许可证”）授权；
除非符合许可证的规定，否则不得使用本文件。
您可以在以下网址获取许可证副本：

    https://www.apache.org/licenses/LICENSE-2.0

除非适用法律要求或双方另有约定，否则软件按“原样”分发，
不提供任何形式的保证或条件。有关权限和限制的具体内容，
请参阅许可证文件。

WeatherBench 2 快速上手指南

WeatherBench 2 是一个用于评估和比较数据驱动模型与传统数值天气预报模型的框架。它提供了公开的云优化数据集、开源评估代码以及最新的排行榜。

⚠️ 重要提示：Google 已发布更新版本的评估代码库 WeatherBench-X。建议新用户优先切换至新代码库，但 WeatherBench 2 的数据指南仍然有效。

环境准备

在开始之前，请确保您的开发环境满足以下要求：

操作系统：Linux 或 macOS（Windows 用户建议使用 WSL2 或 Docker）。
Python 版本：推荐 Python 3.8 或更高版本。
前置依赖：
- pip 包管理工具。
- 对于大规模数据处理，建议配置 Google Cloud Platform (GCP) 环境以使用 DataFlow（可选，仅限海量数据评估）。
网络环境：由于数据集和依赖包主要托管在 Google 服务上，国内开发者可能需要配置科学上网环境或使用代理加速下载。

安装步骤

可以通过 pip 直接安装 WeatherBench 2 的核心评估库：

pip install weatherbench2

如果需要从源码安装以获取最新功能或贡献代码：

git clone https://github.com/google-research/weatherbench2.git
cd weatherbench2
pip install -e .

注意：目前官方未提供专门的中国镜像源。如果 pip 安装缓慢，可尝试指定国内通用镜像源（如清华源）安装基础依赖，但需注意 weatherbench2 包本身可能仍需从 PyPI 官方源拉取：
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple <dependency_name>

基本使用

WeatherBench 2 的核心功能是评估预测结果。最简单的使用方式是通过 Python API 加载数据并计算指标，或者直接运行提供的评估脚本。

1. 使用 Colab 快速体验（推荐）

无需本地配置环境，直接在浏览器中运行官方提供的 Notebook 示例：

2. Python API 示例

以下是一个基础的评估逻辑示例，展示如何调用评估模块：

import weatherbench2 as wb2

# 加载真值数据 (Ground Truth) 和 预测数据 (Forecast)
# 具体数据路径需参考官方数据指南: https://weatherbench2.readthedocs.io/en/latest/data-guide.html
truth = wb2.load_dataset("path/to/truth.zarr")
forecast = wb2.load_dataset("path/to/forecast.zarr")

# 计算评估指标 (例如：均方根误差 RMSE)
metrics = wb2.compute_metrics(truth, forecast, metrics=["rmse", "crps"])

print(metrics)

3. 命令行脚本

针对高分辨率的大规模文件，推荐使用基于 Xarray-Beam 的命令行脚本进行处理，以支持可扩展的计算：

# 查看可用命令
wb2-eval --help

# 运行评估任务 (示例)
wb2-eval \
  --truth_path=path/to/truth.zarr \
  --forecast_path=path/to/forecast.zarr \
  --output_path=path/to/results.json

如需在 Google Cloud (GCP) 上利用 DataFlow 进行分布式评估，请参考官方文档中的 Beam on Cloud 指南。

版本历史

v0.2.02023/12/04

v0.1.02023/08/31

常见问题

为什么某些模型（如 ERA5, Pangu, Keisler）的预测数据集中缺少 'total_precipitation_6hr'（6 小时累计降水）变量？

运行评估脚本时遇到内存不足（Out of Memory）错误或维度缺失问题怎么办？

访问数据集或运行评估命令时遇到 '503 Service Unavailable' 错误如何解决？

运行集合预报（Ensemble）评估示例命令时报错，提示参数解析错误或找不到 lsm_dataset，如何修正命令？

如何在命令行中指定多个变量、区域和指标进行评估？

运行评估管道时出现 'AttributeError: PandasIndex object has no attribute coord_dtype' 错误是什么原因？

相似工具推荐

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。

★ 85k|★★☆☆☆|今天

图像数据工具视频

ragflow

RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。

★ 77.1k|★★★☆☆|2天前

Agent图像开发框架

PaddleOCR

PaddleOCR 是一款基于百度飞桨框架开发的高性能开源光学字符识别工具包。它的核心能力是将图片、PDF 等文档中的文字提取出来，转换成计算机可读取的结构化数据，让机器真正“看懂”图文内容。面对海量纸质或电子文档，PaddleOCR 解决了人工录入效率低、数字化成本高的问题。尤其在人工智能领域，它扮演着连接图像与大型语言模型（LLM）的桥梁角色，能将视觉信息直接转化为文本输入，助力智能问答、文档分析等应用场景落地。 PaddleOCR 适合开发者、算法研究人员以及有文档自动化需求的普通用户。其技术优势十分明显：不仅支持全球 100 多种语言的识别，还能在 Windows、Linux、macOS 等多个系统上运行，并灵活适配 CPU、GPU、NPU 等各类硬件。作为一个轻量级且社区活跃的开源项目，PaddleOCR 既能满足快速集成的需求，也能支撑前沿的视觉语言研究，是处理文字识别任务的理想选择。

★ 75k|★★★☆☆|今天

语言模型图像开发框架

awesome-machine-learning

awesome-machine-learning 是一份精心整理的机器学习资源清单，汇集了全球优秀的机器学习框架、库和软件工具。面对机器学习领域技术迭代快、资源分散且难以甄选的痛点，这份清单按编程语言（如 Python、C++、Go 等）和应用场景（如计算机视觉、自然语言处理、深度学习等）进行了系统化分类，帮助使用者快速定位高质量项目。它特别适合开发者、数据科学家及研究人员使用。无论是初学者寻找入门库，还是资深工程师对比不同语言的技术选型，都能从中获得极具价值的参考。此外，清单还延伸提供了免费书籍、在线课程、行业会议、技术博客及线下聚会等丰富资源，构建了从学习到实践的全链路支持体系。其独特亮点在于严格的维护标准：明确标记已停止维护或长期未更新的项目，确保推荐内容的时效性与可靠性。作为机器学习领域的“导航图”，awesome-machine-learning 以开源协作的方式持续更新，旨在降低技术探索门槛，让每一位从业者都能高效地站在巨人的肩膀上创新。

★ 72.1k|★☆☆☆☆|3天前

开发框架其他

scikit-learn

scikit-learn 是一个基于 Python 构建的开源机器学习库，依托于 SciPy、NumPy 等科学计算生态，旨在让机器学习变得简单高效。它提供了一套统一且简洁的接口，涵盖了从数据预处理、特征工程到模型训练、评估及选择的全流程工具，内置了包括线性回归、支持向量机、随机森林、聚类等在内的丰富经典算法。对于希望快速验证想法或构建原型的数据科学家、研究人员以及 Python 开发者而言，scikit-learn 是不可或缺的基础设施。它有效解决了机器学习入门门槛高、算法实现复杂以及不同模型间调用方式不统一的痛点，让用户无需重复造轮子，只需几行代码即可调用成熟的算法解决分类、回归、聚类等实际问题。其核心技术亮点在于高度一致的 API 设计风格，所有估算器（Estimator）均遵循相同的调用逻辑，极大地降低了学习成本并提升了代码的可读性与可维护性。此外，它还提供了强大的模型选择与评估工具，如交叉验证和网格搜索，帮助用户系统地优化模型性能。作为一个由全球志愿者共同维护的成熟项目，scikit-learn 以其稳定性、详尽的文档和活跃的社区支持，成为连接理论学习与工业级应用的最

★ 65.6k|★☆☆☆☆|今天

开发框架其他数据工具

keras

Keras 是一个专为人类设计的深度学习框架，旨在让构建和训练神经网络变得简单直观。它解决了开发者在不同深度学习后端之间切换困难、模型开发效率低以及难以兼顾调试便捷性与运行性能的痛点。无论是刚入门的学生、专注算法的研究人员，还是需要快速落地产品的工程师，都能通过 Keras 轻松上手。它支持计算机视觉、自然语言处理、音频分析及时间序列预测等多种任务。 Keras 3 的核心亮点在于其独特的“多后端”架构。用户只需编写一套代码，即可灵活选择 TensorFlow、JAX、PyTorch 或 OpenVINO 作为底层运行引擎。这一特性不仅保留了 Keras 一贯的高层易用性，还允许开发者根据需求自由选择：利用 JAX 或 PyTorch 的即时执行模式进行高效调试，或切换至速度最快的后端以获得最高 350% 的性能提升。此外，Keras 具备强大的扩展能力，能无缝从本地笔记本电脑扩展至大规模 GPU 或 TPU 集群，是连接原型开发与生产部署的理想桥梁。

★ 63.9k|★★☆☆☆|2天前

开发框架数据工具其他