deepmind-research

14.8k 2.9k 较难 1 次阅读今天Apache-2.0开发框架其他

AI 解读由 AI 自动生成，仅供参考

deepmind-research 是 DeepMind 官方推出的开源代码库，旨在复现其发表的前沿学术论文中的核心算法与实验环境。它主要解决了科研领域中“论文难以复现”的痛点，通过提供经过验证的实现代码、数据集及训练环境，让全球研究者能够直接基于高质量基准开展后续工作，从而加速科学进步。

该资源特别适合人工智能研究人员、算法工程师及高校师生使用。无论是希望深入理解强化学习、生成模型等理论细节的学者，还是想要在实际项目中应用先进架构的开发者，都能从中获益。其独特亮点在于涵盖了极广的研究维度，从控制核聚变等离子体的深度强化学习、精准降水预报的生成模型，到蛋白质结构预测及大规模图神经网络挑战等跨学科成果均有收录。用户不仅可以获取如 Perceiver IO、Enformer 等创新架构的代码，还能直接使用 DeepMind Lab 或 StarCraft II 等标准测试环境进行对比实验。作为一个连接理论与实践的桥梁，deepmind-research 以透明、开放的方式推动了社区对复杂 AI 系统的探索与构建。

使用场景

某顶尖高校的计算生物学团队正试图利用深度学习预测基因序列的长程相互作用，以加速罕见病致病机理的研究。

没有 deepmind-research 时

团队需从零复现《Nature》上发表的 Enformer 模型架构，因缺乏官方参考代码，极易在注意力机制实现上出现隐蔽偏差。
处理海量基因序列数据时，缺少经过验证的数据预处理流水线，导致清洗和特征工程耗时数周且结果不可复现。
难以直接复用 DeepMind 针对生物序列优化的训练技巧（如长上下文窗口管理），模型收敛缓慢且显存占用远超预期。
面对复杂的实验环境配置，研究人员需自行摸索依赖库版本兼容性，大量精力浪费在调试环境而非算法创新上。

使用 deepmind-research 后

直接调用仓库中开源的 Enformer 官方实现，确保核心算法与顶刊论文完全一致，将模型构建时间从数周缩短至几天。
沿用配套的标准化数据加载器与预处理脚本，快速构建高质量的基因序列数据集，显著提升实验的可复现性。
借鉴项目中成熟的大规模序列训练策略与优化器配置，模型训练效率提升 40%，并在同等算力下实现了更优的预测精度。
基于提供的完整环境依赖说明，一键搭建起与 DeepMind 内部一致的开发环境，让团队能立即专注于下游的生物学发现。

deepmind-research 通过将顶刊成果转化为可执行代码，消除了学术界与工业界顶尖研究之间的“复现鸿沟”，让科研人员能站在巨人的肩膀上快速创新。

运行环境要求

GPU

未说明

内存

未说明

依赖

notes该仓库是 DeepMind 研究论文的代码实现集合，并非单一工具。每个子项目（如 AlphaFold, Perceiver, Enformer 等）都有独立的环境配置和依赖要求，需进入具体项目子目录查看各自的 README 或 requirements.txt 文件以获取详细的运行环境信息。

python未说明

快速开始

DeepMind 研究

本仓库包含与 DeepMind 出版物配套的实现和示例代码。除了发表在 DeepMind 进行的研究相关的论文外，我们还开源了环境、数据集和代码，以帮助更广泛的科研社区参与并在此基础上开展工作，最终目标是加速科学进步，造福社会。例如，您可以基于我们的深度 Q 网络或微分神经计算机实现进行开发，或者在我们用于研究的相同环境中进行实验，如 DeepMind Lab 或星际争霸 II。

如果您喜欢构建工具、环境、软件库以及其他类似下方列出的基础架构，您可以在我们的招聘页面查看相关领域的开放职位。

有关我们出版物的完整列表，请参阅 https://deepmind.com/research/publications/

项目

通过深度强化学习对托卡马克等离子体进行磁控，Nature 2022
通过解决分数电子问题推进密度泛函理论的边界，Science 2021
关注差距：评估神经语言模型中的时间泛化能力，NeurIPS 2021
深度强化学习中被动学习的困难，NeurIPS 2021
利用雷达的深度生成模型进行熟练的降水临近预报，Nature 2021
作为语言的计算辅助设计
持续学习的编码器与集成
迈向心理时间旅行：强化学习智能体的层次化记忆
Perceiver IO：一种适用于结构化输入与输出的通用架构
使用神经网络求解混合整数规划问题
用于带标签噪声学习的真实感仿真框架
在新环境中快速解决问题，ICLR 2021
WikiGraphs：维基百科-知识图谱配对数据集，TextGraphs 2021
高效强化学习的行为先验
利用图网络学习基于网格的仿真，ICLR 2021
开放图基准——大规模挑战 (OGB-LSC)
长期信用分配的合成回报
用于表征大型星系合并的深度学习方法
更好、更快的费米子神经网络（KFAC 实现）
基于对象的关注机制用于时空推理
通过整合长程相互作用从序列有效预测基因表达
Satore：带有原子重写的一阶逻辑饱和
表征信号传播以缩小未归一化 ResNet 的性能差距，ICLR 2021
揭示对抗训练在范数有界对抗样本下的局限性
通过跨模态自监督学习丰富的触觉表征，CoRL 2020
持续学习中的函数正则化，ICLR 2020
自编码变分自编码器，NeurIPS 2020
自监督的多模态多功能网络，NeurIPS 2020
ODE-GAN：通过求解常微分方程训练 GAN，NeurIPS 2020
概率树中因果推理的算法
门控线性网络，NeurIPS 2020
价值驱动的回溯建模，NeurIPS 2020
通过学习映射进行目标自由能估计，Journal of Chemical Physics 2020
利用图网络学习复杂物理系统的仿真，ICML 2020
物理嵌入式规划问题
PolyGen：3D 网格的自回归生成模型，ICML 2020
自举你自己的潜在表示
抓取与搬运：面向视觉引导全身任务的可重用神经控制器，SIGGRAPH 2020
MEMO：一种用于灵活组合情景记忆的深度网络，ICLR 2020
RL Unplugged：离线强化学习的基准测试
通过子空间扩散解耦（GEOMANCER），NeurIPS 2020
我在这里能做什么？强化学习中可供性的理论，ICML 2020
通过奖励草图和批量强化学习扩展数据驱动的机器人技术，RSS 2020
路径特异性反事实公平性，AAAI 2019
选项键盘：在强化学习中组合技能，NeurIPS 2019
VISR：利用变分内在成功特征进行快速任务推理，ICLR 2020
揭示玻璃态系统中静态结构的预测能力，Nature Physics 2020
利用迭代变分推断进行多对象表征学习（IODINE）
AlphaFold CASP13，Nature 2020
无限制对抗挑战
层次化概率 U-Net（HPU-Net）
从头开始训练语言 GAN，NeurIPS 2019
时间价值传递，Nature Communications 2019
持续的无监督表征学习（CURL），NeurIPS 2019
对象关键点的无监督学习（Transporter），NeurIPS 2019
BigBiGAN，NeurIPS 2019
深度压缩感知，ICML 2019
副作用惩罚
PrediNet 架构及关系游戏数据集
无监督对抗训练，NeurIPS 2019
用于学习图结构对象相似性的图匹配网络，ICML 2019
REGAL：用于快速优化计算图的迁移学习
深度集成：从损失景观的角度来看
Powerpropagation
受物理学启发的模型

免责声明

本项目并非 Google 官方产品。

DeepMind Research 快速上手指南

deepmind-research 是 DeepMind 官方开源的代码仓库，收录了配合其学术论文发布的实现代码和示例。该仓库并非单一的库，而是包含多个独立研究项目（如 AlphaFold、Perceiver、BYOL 等）的集合。以下指南将帮助你快速开始使用其中的具体项目。

环境准备

在开始之前，请确保你的开发环境满足以下基本要求。由于不同子项目依赖可能略有差异，建议为每个项目创建独立的虚拟环境。

操作系统: Linux (推荐 Ubuntu 18.04+) 或 macOS。Windows 用户建议使用 WSL2。
Python 版本: Python 3.7 - 3.9 (具体版本需参考所选子项目的 requirements.txt)。
硬件要求: 多数深度学习项目需要 NVIDIA GPU 及对应的 CUDA 驱动。
前置工具:
- Git
- pip 或 conda (推荐使用 conda 管理环境)

推荐配置命令：

# 安装 git 和 python (以 Ubuntu 为例)
sudo apt-get update
sudo apt-get install -y git python3 python3-pip python3-venv

# 如果使用 conda
# wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
# bash Miniconda3-latest-Linux-x86_64.sh

国内加速提示：在中国大陆地区，建议使用清华源或阿里源加速 pip 和 conda 下载。

Pip 临时加速：-i https://pypi.tuna.tsinghua.edu.cn/simple

Conda 配置：conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/

安装步骤

由于仓库包含多个独立项目，不存在统一的“一键安装”命令。你需要选择感兴趣的具体项目目录进行安装。

以下以通用的安装流程为例（假设你选择了一个名为 project_name 的子目录）：

克隆仓库

git clone https://github.com/deepmind/deepmind-research.git
cd deepmind-research

创建并激活虚拟环境

# 使用 venv
python3 -m venv env
source env/bin/activate

# 或者使用 conda
# conda create -n dm_research python=3.8
# conda activate dm_research

进入特定项目目录并安装依赖

浏览 Projects 列表，进入你感兴趣的项目文件夹（例如 byol 或 perceiver），然后安装依赖。
```
# 示例：进入 BYOL 项目目录
cd byol

# 安装该项目特定的依赖
pip install -r requirements.txt
# 国内加速版：
# pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
```
注意：部分项目可能需要额外的系统级依赖（如 TensorFlow 或 JAX 的特定版本），请务必阅读该项目目录下的 README.md 获取详细指引。

基本使用

每个项目的具体用法不同，通常包含数据预处理、训练脚本和评估脚本。以下是一个典型的运行示例（以大多数项目通用的训练入口为例）：

查看可用参数

大多数脚本支持 --help 参数来查看配置选项。
```
python train.py --help
```

运行训练示例

通常在项目根目录下运行主训练脚本。以下是一个伪代码示例，具体文件名请参考对应项目的文档：

# 示例：启动训练任务
python train.py \
  --dataset_dir=/path/to/data \
  --model_config=configs/default.json \
  --output_dir=/path/to/save/results

验证安装

许多项目提供简单的单元测试或演示脚本来验证环境是否正确配置。

# 运行测试（如果项目提供）
pytest tests/

# 或者运行一个简单的 demo 脚本
python demo.py

重要提示：

请始终优先阅读你所选具体子项目文件夹内的 README.md，那里有针对该算法最准确的运行指令和数据集下载链接。
本仓库代码主要用于复现论文结果和研究参考，部分代码可能未针对生产环境进行封装。

常见问题

DM21 泛函在计算长键（如 H2 或 F2 解离）时出现收敛失败，如何解决？

运行 MeshGraphNets 训练命令时出现 'flag --mode=train=cloth: value should be one of <train|eval>' 错误，如何修复？

MeshGraphNets 代码运行时报 'invalid tensor rank' 或 'unique_edges has rank 1' 错误，原因是什么？

MeshGraphNets 中的 World Edges（世界边）是否连接布料节点与障碍物节点？如何实现碰撞模拟？

训练 MeshGraphNets 时在约 21k 步后因内存不足（OOM）崩溃，如何解决？

Hierarchical Perceiver (HiP) 的代码和预训练模型何时发布？

分数占据数优化算法能否改善传统泛函（如 B3LYP）在长距离解离曲线上的表现？

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

★ 349.3k|★★★☆☆|2天前

Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|3天前

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 145.9k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 108.1k|★★☆☆☆|今天

开发框架图像Agent

markitdown

MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器

★ 93.4k|★★☆☆☆|2天前

插件开发框架

LLMs-from-scratch

LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目，旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型（LLM）。它不仅是同名技术著作的官方代码库，更提供了一套完整的实践方案，涵盖模型开发、预训练及微调的全过程。该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型，却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码，用户能够透彻掌握 Transformer 架构、注意力机制等关键原理，从而真正理解大模型是如何“思考”的。此外，项目还包含了加载大型预训练权重进行微调的代码，帮助用户将理论知识延伸至实际应用。 LLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API，而是渴望探究模型构建细节的技术人员而言，这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计：将复杂的系统工程拆解为清晰的步骤，配合详细的图表与示例，让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础，还是为未来研发更大规模的模型做准备

★ 90.1k|★★★☆☆|2天前

语言模型图像Agent