DiffEqFlux.jl

915 159 较难 1 次阅读 5天前MIT图像开发框架

AI 解读由 AI 自动生成，仅供参考

DiffEqFlux.jl 是一款将微分方程求解器与深度学习深度融合的开源工具，旨在推动科学机器学习（SciML）的发展。它允许用户直接将微分方程作为神经网络的“层”嵌入模型中，从而构建出能够理解物理规律的混合架构。

该工具主要解决了传统机器学习难以融入物理机制、以及纯数值模拟缺乏数据适应性的痛点。通过它，研究者可以轻松实现神经常微分方程（Neural ODEs）、神经随机微分方程等多种前沿模型，让神经网络不仅能拟合数据，还能遵循已知的物理定律进行推演。

DiffEqFlux.jl 特别适合科研人员、算法工程师及需要处理复杂动态系统的开发者使用。其核心技术亮点在于提供了预建的隐式层架构，支持常数级内存占用的高效反向传播（O(1) backprop），并兼容 GPU 加速。无论是刚性还是非刚性方程，它都能调用高性能求解器进行快速训练。此外，它基于 Julia 生态构建，完美衔接 DifferentialEquations.jl 与 Lux.jl（同时兼容 Flux.jl），为用户探索从连续时间建模到物理信息神经网络的创新应用提供了强大而灵活的基础设施。

使用场景

某生物制药团队正试图利用患者稀疏的临床血液检测数据，重构药物在体内的连续代谢动力学曲线，以预测最佳给药窗口。

没有 DiffEqFlux.jl 时

物理规律缺失：传统神经网络仅做数据拟合，无法遵循质量守恒等生化反应定律，导致外推预测出现违背常识的浓度波动。
离散化误差大：必须先将连续时间数据强制离散化为固定步长，不仅丢失了采样点间的动态细节，还引入了数值截断误差。
刚性方程求解难：面对代谢过程中快慢反应并存的“刚性”微分方程组，自定义求解器极易发散或需要极小的时间步长，训练效率极低。
反向传播成本高：手动推导伴随方程以实现梯度回传极其复杂，且内存消耗随时间序列长度线性增长，难以在 GPU 上扩展。

使用 DiffEqFlux.jl 后

内嵌物理约束：直接构建神经微分方程（Neural ODE）层，将生化反应机理作为先验知识嵌入模型，确保预测曲线严格符合动力学规律。
原生连续时间建模：利用自适应步长求解器直接处理连续时间流，无需人为离散化，能精准还原任意时刻的药物浓度变化。
高效求解刚性系统：调用内置的高阶隐式求解器和 Newton-Krylov 算法，轻松稳定地处理多尺度刚性问题，收敛速度提升数倍。
常数内存反向传播：借助伴随灵敏度方法实现 O(1) 复杂度的反向传播，大幅降低显存占用，使长序列高精度训练在单张 GPU 上成为可能。

DiffEqFlux.jl 通过将微分方程求解器无缝转化为可微分的神经网络层，让数据驱动与物理机理在连续时间域内实现了完美融合。

运行环境要求

GPU

支持 GPU 加速（具体型号、显存及 CUDA 版本未说明）

内存

未说明

依赖

notes该工具是基于 Julia 语言的库，而非 Python。从 v3 版本起，主要依赖已切换为 Lux.jl，不再直接依赖 Flux.jl（但提供兼容适配器）。v4 版本引入了 Boltz.jl 模块替代部分原有功能。支持多种神经微分方程架构（如 Neural ODE, SDE, DAE 等）及高阶自适应求解器。

python不适用 (基于 Julia 语言)

DifferentialEquations.jl

Lux.jl

Boltz.jl (v1+)

快速开始

DiffEqFlux.jl

DiffEq(For)Lux.jl（又称 DiffEqFlux.jl）通过帮助用户将微分方程求解器嵌入到神经网络中，实现了微分方程领域与机器学习领域的融合。该包以 DifferentialEquations.jl 和 Lux.jl 为基石，支持科学机器学习领域的研究，尤其是神经微分方程，从而将物理信息融入传统机器学习模型中。

[!注意] 我们通过 FromFluxAdaptor() 保持与 Flux.jl 的向后兼容性。

教程与文档

有关如何使用本包的信息，请参阅稳定版文档。如需查看包含未发布功能的版本文档，请使用开发中文档。

问题领域

DiffEqFlux.jl 适用于隐式层机器学习。它提供了与 Flux.jl 和 Lux.jl 等机器学习库接口兼容的架构，便于将连续时间机器学习层集成到更大的机器学习应用中。

现有以下层函数：

神经常微分方程（Neural ODEs）
基于配点法的神经常微分方程（无需求解器，速度最快的方式！）
多重打靶神经常微分方程
神经随机微分方程（Neural SDEs）
神经微分代数方程（Neural DAEs）
神经时滞微分方程（Neural DDEs）
扩展型神经常微分方程
哈密顿神经网络（配备专门的二阶和辛积分器）
连续归一化流（CNF）和 FFJORD

这些方法支持高阶、自适应、隐式、GPU 加速、牛顿-克雷洛夫等求解技术。更多示例请参考发布博客文章。此外，关于神经偏微分方程和神经跳跃随机微分方程等更多演示，可参见这篇博客文章（以及其他许多内容）。

不要局限于当前的神经化方式。借助本包，您可以探索多种整合这两种方法论的方式：

可以定义“激活”由微分方程描述的非线性函数的神经网络。
可以定义部分层为常微分方程求解的神经网络。
可以定义部分项为神经网络的常微分方程。
可以在常微分方程上定义成本函数来生成神经网络。

Flux ODE 训练动画

破坏性变更

v4

TensorLayer 已被移除，改用 Boltz.Layers.TensorProductLayer。
DiffEqFlux 中的基础函数已被移除，取而代之的是 Boltz.Basis 模块。
SplineLayer 已被移除，改用 Boltz.Layers.SplineLayer。
NeuralHamiltonianDE 已被移除，改用带有 Layers.HamiltonianNN 的 NeuralODE。
HamiltonianNN 已被移除，取而代之的是 Layers.HamiltonianNN。
Lux 和 Boltz 更新至 v1 版本。

v3

移除了对 Flux 的依赖。如果传入非 Lux 的 AbstractLuxLayer，我们会尝试使用 FromFluxAdaptor()(model) 自动将其转换为 Lux 模型。
Flux 不再从 DiffEqFlux 中重新导出，而是改由 Lux 重新导出。
NeuralDAE 现在允许将可选的 du0 作为输入。
TensorLayer 现已成为一个 Lux 神经网络。
多个层构造的 API 发生了变化。详情请参阅更新后的文档。

DiffEqFlux.jl 快速上手指南

DiffEqFlux.jl 是一个将微分方程求解器与机器学习深度融合的 Julia 库。它允许用户在神经网络中嵌入微分方程求解层，从而实现神经微分方程（Neural ODEs/SDEs/DAEs 等），特别适用于科学机器学习（Scientific ML）领域，能够将物理规律融入传统机器学习模型。

环境准备

操作系统：支持 Linux、macOS 和 Windows。
Julia 版本：建议安装最新稳定版 Julia（1.9 或更高版本）。
前置知识：熟悉基本的 Julia 语法，了解 Lux.jl（现代神经网络库）和 DifferentialEquations.jl（微分方程求解库）的基本概念会有所帮助。
依赖说明：本工具核心基于 Lux.jl 构建。虽然不再直接依赖 Flux.jl，但提供了适配器以兼容旧的 Flux 模型。

安装步骤

在 Julia REPL 或脚本中，进入包管理模式并安装 DiffEqFlux：

using Pkg
Pkg.add("DiffEqFlux")

提示：国内开发者若遇到下载速度慢的问题，可配置国内镜像源加速安装。在运行上述命令前，执行以下设置（以清华源为例）：
ENV["JULIA_PKG_SERVER"] = "https://mirrors.tuna.tsinghua.edu.cn/julia"

安装完成后，加载包即可使用：

using DiffEqFlux
using Lux, Random

基本使用

以下示例展示如何构建并训练一个最简单的**神经常微分方程（Neural ODE）**模型。该模型将神经网络作为微分方程的动态项进行优化。

1. 定义问题与数据

假设我们要拟合一个简单的正弦波数据 $u' = f(u, p, t)$。

using OrdinaryDiffEq, Plots

# 生成训练数据 (真值: u' = -0.5u + cos(t))
tspan = (0.0f0, 10.0f0)
tsteps = 0.0f0:0.1f0:10.0f0
u0 = [2.0f0]

# 真实动力学函数
function true_dudt(u, p, t)
    return [-0.5u[1] + cos(t)]
end

prob_true = ODEProblem(true_dudt, u0, tspan)
sol_true = solve(prob_true, Tsit5(), saveat=tsteps)
X_train = sol_true.u
Y_train = sol_true.u # 自监督学习，预测自身轨迹

2. 构建神经 ODE 层

使用 Lux 定义神经网络，并将其包裹在 NeuralODE 中。

# 定义一个简单的全连接神经网络 (输入 1 -> 隐藏层 32 -> 输出 1)
nn = Lux.Chain(
    Lux.Dense(1, 32, tanh),
    Lux.Dense(32, 1)
)

# 初始化参数
rng = Random.default_rng()
p_init, st = Lux.setup(rng, nn)

# 构建 NeuralODE 对象
# 使用 Tsit5() 求解器，自动处理反向传播
neural_ode = NeuralODE(nn, tspan, Tsit5(), saveat=tsteps)

# 包装成可训练的模型函数
function predict(p)
    Array(neural_ode(u0, p, st)[1])
end

3. 定义损失函数并训练

使用 Optimisers.jl 或 SciMLBase 提供的训练循环进行参数优化。

using Optimisers

# 损失函数：预测轨迹与真实轨迹的均方误差
function loss(p)
    pred = predict(p)
    sum(abs2, X_train .- pred)
end

# 初始损失
println("Initial Loss: $(loss(p_init))")

# 设置优化器 (Adam)
opt = Optimisers.Adam(0.05)
opt_state = Optimisers.setup(opt, p_init)

# 简单训练循环 (实际应用中建议使用 SciML 的训练回调)
for i in 1:100
    grad = Flux.gradient(loss, p_init) # 注意：此处需确保梯度追踪正确，推荐使用 Zygote 或 Enzyme
    # 由于 DiffEqFlux 深度集成，通常直接使用 sciml 训练接口更稳健
    # 这里仅展示逻辑，具体梯度计算依赖后端配置
    println("Step $i completed") 
end

注意：在实际生产代码中，推荐使用 SciMLBase 生态提供的标准训练接口（如 sciml_train）来处理微分方程反向传播的复杂性，以获得最佳的 GPU 加速和稳定性支持。

通过以上步骤，您已成功构建了一个包含微分方程求解层的神经网络。您可以进一步探索神经 SDE、神经 DAE 或哈密顿神经网络等高级架构。详细 API 请参考官方文档。

版本历史

v4.2.02025/02/22

v4.1.02024/11/05

v3.5.02024/05/19

v3.3.02023/12/25

v3.1.02023/12/11

v3.0.02023/12/08

v2.2.02023/08/13

v2.1.02023/06/28

v2.0.02023/04/19

v1.53.02022/12/11

v1.52.02022/07/27

v1.51.22022/06/30

v1.51.12022/06/30

v1.51.02022/06/25

v1.50.02022/06/21

v1.49.12022/06/17

v1.49.02022/06/08

v1.48.02022/06/04

v1.47.12022/05/03

v1.47.02022/05/03

常见问题

如何为 Julia 包注册新版本并添加发布说明（Release Notes）？

TagBot 未自动创建版本标签怎么办？

在使用 DiffEqFlux 进行多段射击（Multiple Shooting）训练时，如何更清晰地分割数据集？

运行代码时遇到 'Tried to add a tstop that is behind the current time' 错误如何解决？

在 GPU 上进行稳态微分方程（SteadyStateDiffEq）训练时是否需要手动指定伴随算法（Adjoint Algorithm）？

如何在 DiffEqFlux 中结合 CUDA 进行卷积神经网络与微分方程的联合训练？

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

★ 349.3k|★★★☆☆|1周前

Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|1周前

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 160.4k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 109.2k|★★☆☆☆|今天

开发框架图像Agent

gemini-cli

gemini-cli 是一款由谷歌推出的开源 AI 命令行工具，它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言，它提供了一条从输入提示词到获取模型响应的最短路径，无需切换窗口即可享受智能辅助。这款工具主要解决了开发过程中频繁上下文切换的痛点，让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用，还是执行复杂的 Git 操作，gemini-cli 都能通过自然语言指令高效处理。它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口，具备出色的逻辑推理能力；内置 Google 搜索、文件操作及 Shell 命令执行等实用工具；更独特的是，它支持 MCP（模型上下文协议），允许用户灵活扩展自定义集成，连接如图像生成等外部能力。此外，个人谷歌账号即可享受免费的额度支持，且项目基于 Apache 2.0 协议完全开源，是提升终端工作效率的理想助手。

★ 100.8k|★★☆☆☆|1周前

插件Agent图像

markitdown

MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器

★ 93.4k|★★☆☆☆|1周前

插件开发框架