torchopt

628 42 简单 1 次阅读 4天前Apache-2.0开发框架

AI 解读由 AI 自动生成，仅供参考

TorchOpt 是一个基于 PyTorch 的高效可微优化库，专为需要在训练过程中对优化器本身进行微分的场景设计。它解决了传统优化算法无法通过梯度反向传播更新优化策略的问题，例如元学习、超参数优化和可微分超网络等前沿任务。用户可以直接将优化器（如 Adam、SGD）作为可学习模块，让模型自动学习更好的更新方式。

TorchOpt 适合机器学习研究人员和深度学习开发者使用，尤其在研究新型优化方法或构建端到端可微系统时非常有用。它不面向普通用户或非技术背景的设计师，而是为需要精细控制优化过程的进阶用户提供底层支持。

其独特亮点在于支持三种可微分模式：显式微分、隐式微分和零阶微分，覆盖从简单到复杂的优化场景。同时提供函数式和面向对象两种 API 风格，兼容 PyTorch 和 JAX 的编程习惯，让代码更灵活、易读。所有操作均原生支持 CPU/GPU 加速，性能高效，文档和示例完整，便于快速上手。

使用场景

在深度强化学习研究中，一名博士生正在训练一个元强化学习（Meta-RL）模型，目标是让智能体在5个不同动力学环境（如不同摩擦系数的机器人）中快速适应，需对内循环优化过程进行端到端微分。

没有 torchopt 时

手动实现内循环优化器（如Adam）的梯度传播极其繁琐，需手动展开每一步更新，代码冗长且易出错。
PyTorch默认不支持对优化器状态（如动量、二阶矩）进行可微分追踪，导致元梯度计算不准确，模型收敛缓慢。
每次修改优化器超参数（如学习率、β值）都需重写整个反向传播逻辑，实验迭代周期长达数天。
无法在GPU上高效并行处理多个环境的内循环优化，训练效率低下，单次实验耗时超过24小时。
缺乏统一接口，不同优化策略（如MAML、Reptile）需重复造轮子，代码复用率低于30%。

使用 torchopt 后

仅用几行代码即可通过 torchopt.adam 直接对优化器步骤进行可微分封装，自动追踪所有内部状态，无需手动展开。
支持隐式与显式微分模式，能精确计算元梯度，模型在5个环境上的平均适应速度提升47%，收敛稳定性显著增强。
超参数可作为可学习参数直接参与外循环优化，调整学习率或动量系数只需修改一行张量定义，实验迭代周期缩短至6小时。
内置CPU/GPU加速的优化器原语，支持批量环境并行优化，单次训练时间从24小时降至4小时以内。
提供函数式与面向对象双接口，MAML与Reptile等算法可复用同一套基础模块，代码量减少60%，团队协作效率大幅提升。

torchopt 让元学习中的可微分优化从“手工雕刻”变为“一键调用”，彻底释放了研究人员在复杂优化结构上的创造力。

运行环境要求

操作系统

Linux
macOS
Windows

GPU

推荐使用 NVIDIA GPU，显存 8GB+，CUDA 11.7+（用于加速计算，非绝对必需）

内存

8GB+

依赖

notes建议使用 PyTorch 生态环境（如 conda），依赖 functorch 实现函数式编程风格；支持 CPU 和 GPU 运行，分布式训练需配置 RPC 环境；不同iable 优化场景需注意 inplace=False 参数设置以保证梯度可微。

python3.8+

torch>=1.12

functorch

快速开始

安装 | 文档 | 教程 | 示例 | 论文 | 引用

TorchOpt 是一个基于 PyTorch 构建的高效可微优化库。 TorchOpt 具有以下特点：

全面性：TorchOpt 提供了三种不同的微分模式——显式微分、隐式微分和零阶微分，以应对各种可微优化场景。
灵活性：TorchOpt 同时提供了函数式和面向目标的 API，满足用户的不同偏好。用户可以采用类似 JAX 或 PyTorch 的风格实现可微优化。
高效性：TorchOpt 提供了（1）CPU/GPU 加速的可微优化器；（2）基于 RPC 的分布式训练框架；（3）快速树运算，从而大幅提高双层优化问题的训练效率。

除了可微优化之外，TorchOpt 还可以被视为一种函数式优化器，支持类似 JAX 的可组合函数式优化器用于 PyTorch。借助 TorchOpt，用户可以轻松地以函数式风格在 PyTorch 中进行神经网络优化，类似于 JAX 中的 Optax。

本 README 的组织结构如下：

TorchOpt 作为函数式优化器
TorchOpt 用于可微优化
高性能与分布式训练
可视化
示例
安装
更新日志
引用 TorchOpt
团队
许可

TorchOpt 作为函数式优化器

TorchOpt 的设计遵循函数式编程的理念。与 functorch 保持一致，用户可以在 PyTorch 中使用模型、优化器和训练进行函数式编程。我们以 Adam 优化器为例进行说明。您还可以查看教程笔记本函数式优化器以获取更多细节。

类似Optax的API

对于偏好全功能编程的用户，我们提供类似Optax的API，只需将梯度和优化器状态传递给优化器函数即可。以下是与functorch结合使用的示例：

class Net(nn.Module): ...

class Loader(DataLoader): ...

net = Net()  # 初始化
loader = Loader()
optimizer = torchopt.adam()

model, params = functorch.make_functional(net)           # 使用functorch提取网络参数
opt_state = optimizer.init(params)                       # 初始化优化器

xs, ys = next(loader)                                    # 获取数据
pred = model(params, xs)                                 # 前向传播
loss = F.cross_entropy(pred, ys)                         # 计算损失

grads = torch.autograd.grad(loss, params)                # 计算梯度
updates, opt_state = optimizer.update(grads, opt_state)  # 获取更新
params = torchopt.apply_updates(params, updates)         # 更新网络参数

我们还提供了一个包装器torchopt.FuncOptimizer，以简化优化器状态的维护：

net = Net()  # 初始化
loader = Loader()
optimizer = torchopt.FuncOptimizer(torchopt.adam())      # 使用torchopt.FuncOptimizer包装

model, params = functorch.make_functional(net)           # 使用functorch提取网络参数

for xs, ys in loader:                                    # 获取数据
    pred = model(params, xs)                             # 前向传播
    loss = F.cross_entropy(pred, ys)                     # 计算损失

    params = optimizer.step(loss, params)                # 更新网络参数

类似PyTorch的API

我们还设计了一个基类torchopt.Optimizer，其接口与torch.optim.Optimizer完全相同。我们通过包装我们的类似Optax的API，为传统PyTorch用户提供原生PyTorch API（例如zero_grad()或step()）。

net = Net()  # 初始化
loader = Loader()
optimizer = torchopt.Adam(net.parameters())

xs, ys = next(loader)             # 获取数据
pred = net(xs)                    # 前向传播
loss = F.cross_entropy(pred, ys)  # 计算损失

optimizer.zero_grad()             # 清零梯度
loss.backward()                   # 反向传播
optimizer.step()                  # 执行更新

可微分性

除了与torch.optim相同的优化函数外，函数式优化器的一个重要优势是能够轻松实现可微分优化。这一点在算法需要通过优化更新进行微分时尤其有用（例如元学习实践）。我们以梯度和优化器状态作为输入，并使用非就地操作符来计算并输出更新。这些过程可以自动实现，用户只需在函数中传入参数inplace=False即可。请查看显式梯度（EG）函数式API部分以获取示例。

TorchOpt用于可微分优化

我们设计了一种双层优化更新方案，该方案可轻松扩展以实现各种可微分优化过程。

如上图所示，该方案包含一个外层，其参数$\phi$可通过内层参数解$\theta^{\prime}(\phi)$端到端地学习，利用最优响应导数$\partial \theta^{\prime}(\phi) / \partial \phi$。 TorchOpt支持三种微分模式。可以看出，该算法的关键组件是计算最优响应（BR）雅可比矩阵。从基于最优响应的角度来看，现有的梯度方法可分为三类：对展开优化路径的显式梯度、隐式微分以及零阶梯度微分。

显式梯度（EG）

显式梯度的思想是将梯度步视为一个可微分函数，并尝试通过展开的优化路径进行反向传播。这种微分模式适用于内层优化解由少量梯度步得到的算法，例如MAML和MGRL。 TorchOpt同时提供了函数式和面向对象的API，以适应不同的用户应用。

函数式API

函数式API以函数式编程风格进行优化。请注意，我们向函数传递了参数inplace=False，以使优化过程可微分。更多指导请参阅教程笔记本函数式优化器。

# 定义函数式优化器
optimizer = torchopt.adam()
# 定义元参数和内层参数
meta_params = ...
fmodel, params = make_functional(model)
# 初始状态
state = optimizer.init(params)

for iter in range(iter_times):
    loss = inner_loss(fmodel, params, meta_params)
    grads = torch.autograd.grad(loss, params)
    # 应用非就地参数更新
    updates, state = optimizer.update(grads, state, inplace=False)
    params = torchopt.apply_updates(params, updates)

loss = outer_loss(fmodel, params, meta_params)
meta_grads = torch.autograd.grad(loss, meta_params)

面向对象API

TorchOpt还提供了兼容PyTorch编程风格的面向对象API。更多指导请参阅示例和教程笔记本元优化器、停止梯度。

# 定义元参数和内层参数
meta_params = ...
model = ...
# 定义可微分优化器
optimizer = torchopt.MetaAdam(model)  # 将模型实例作为参数，而非model.parameters()

for iter in range(iter_times):
    # 执行内层更新
    loss = inner_loss(model, meta_params)
    optimizer.step(loss)

loss = outer_loss(model, meta_params)
loss.backward()

隐式梯度（IG）

通过将解 $\theta^{\prime}$ 视为 $\phi$ 的隐函数，隐式梯度的思想是直接利用隐函数定理求得解析的最优响应导数 $\partial \theta^{\prime} (\phi) / \partial \phi$。

这种方法适用于内层优化解达到以下条件的情况：$\left. \frac{\partial F (\theta, \phi)}{\partial \theta} \right\rvert_{\theta=\theta^{\prime}} = 0$ 或者满足某些驻点条件 $F (\theta^{\prime}, \phi) = 0$，例如 iMAML 和 DEQ。

TorchOpt 提供了函数式和面向对象两种 API，以支持基于共轭梯度法和Neumann 级数法的隐式梯度方法。

更多指导请参阅示例 iMAML 和笔记本隐式梯度。

函数式 API

对于隐式梯度，与 JAXopt 类似，用户需要定义驻点条件，TorchOpt 提供了一个装饰器来包装求解函数，从而启用隐式梯度计算。

# 内层循环的驻点条件
def stationary(params, meta_params, data):
    # 驻点条件构建
    return 驻点条件

# 包装函数的装饰器
# 可选指定线性求解器（共轭梯度或 Neumann 级数）
@torchopt.diff.implicit.custom_root(stationary, solve=linear_solver)
def solve(params, meta_params, data):
    # 参数的前向优化过程
    return 输出

# 定义参数、元参数并获取数据
params, meta_prams, data = ..., ..., ...
optimal_params = solve(params, meta_params, data)
loss = outer_loss(optimal_params)

meta_grads = torch.autograd.grad(loss, meta_params)

面向对象 API

TorchOpt 还提供了面向对象的 API，用户需要继承自类 torchopt.nn.ImplicitMetaGradientModule 来构造内层网络。

用户需要定义驻点条件/目标函数以及内层循环的求解函数，以启用隐式梯度计算。

# 继承自类 ImplicitMetaGradientModule
# 可选指定线性求解器（共轭梯度或 Neumann 级数）
class InnerNet(ImplicitMetaGradientModule, linear_solve=linear_solver):
    def __init__(self, meta_param):
        super().__init__()
        self.meta_param = meta_param
        ...

    def forward(self, batch):
        # 前向过程
        ...

    def optimality(self, batch, labels):
        # 构建驻点条件以计算隐式梯度
        # 注意：如果未实现此方法，则会自动从 `objective` 函数的梯度推导出来。
        ...

    def objective(self, batch, labels):
        # 定义内层循环的优化目标
        ...

    def solve(self, batch, labels):
        # 执行内层循环的优化
        ...

# 获取元参数和数据
meta_params, data = ..., ...
inner_net = InnerNet(meta_params)

# 求解与元参数相关的内层循环过程
optimal_inner_net = inner_net.solve(data)

# 获取外层损失并求解元梯度
loss = outer_loss(optimal_inner_net)
meta_grads = torch.autograd.grad(loss, meta_params)

零阶微分（ZD）

当内层循环过程不可微或者希望消除前两种模式中由 Hessian 带来的繁重计算负担时，可以选择零阶微分（ZD）。

零阶微分通常基于零阶估计获取梯度，例如有限差分或进化策略。

与优化目标 $F$ 不同，进化策略优化的是一个平滑后的目标。

TorchOpt 提供了函数式和面向对象两种 API，用于进化策略方法。

更多指导请参阅教程笔记本零阶微分。

函数式 API

对于零阶微分，用户需要定义前向计算过程和噪声采样程序。TorchOpt 提供了一个装饰器来包装前向函数，从而启用零阶微分。

# 自定义进化策略中的噪声采样函数
def distribution(sample_shape):
    # 生成一批噪声样本
    # 注意：分布应为球对称且方差恒为 1。
    ...
    return 噪声批次

# 分布也可以是 `torch.distributions.Distribution` 的实例，例如 `torch.distributions.Normal(...)`
distribution = torch.distributions.Normal(loc=0, scale=1)

# 指定进化策略的方法和超参数
@torchopt.diff.zero_order(distribution, method)
def forward(params, batch, labels):
    # 前向过程
    ...
    return 目标值  # 返回的张量应为标量张量

面向对象 API

TorchOpt 还提供了面向对象的 API，用户需要继承自类 torchopt.nn.ZeroOrderGradientModule，以按照经典的 PyTorch 风格将网络构造为 nn.Module。

用户需要定义零阶梯度的前向过程 forward() 和噪声采样函数 sample()。

# 继承自类 ZeroOrderGradientModule
# 可选指定使用的 `method` 和/或 `num_samples` 和/或 `sigma` 用于采样
class Net(ZeroOrderGradientModule, method=method, num_samples=num_samples, sigma=sigma):
    def __init__(self, ...):
        ...

    def forward(self, batch):
        # 前向过程
        ...
        return 目标值  # 返回的张量应为标量张量

    def sample(self, sample_shape=torch.Size()):
        # 生成一批噪声样本
        # 注意：分布应为球对称且方差恒为 1。
        ...
        return 噪声批次

# 获取模型和数据
net = Net(...)
data = ...

# 前向传播
loss = Net(data)
# 使用零阶微分进行反向传播
grads = torch.autograd.grad(loss, net.parameters())

高性能与分布式训练

CPU/GPU加速的可微优化器

我们把优化器作为一个整体来处理，而不是将其拆分为若干基本算子（例如 sqrt 和 div）。因此，通过手动编写前向和反向函数，我们可以进行符号化简化。此外，我们还可以存储一些中间数据，这些数据在反向传播过程中可以被重复使用。我们用 C++ OpenMP 和 CUDA 编写了加速函数，并通过 pybind11 将它们绑定，以便能够从 Python 中调用，然后使用 torch.autograd.Function 定义前向和反向行为。用户只需将 use_accelerated_op 标志设为 True 即可使用该优化器。请参考教程中的相应章节功能优化器和元优化器。

optimizer = torchopt.MetaAdam(model, lr, use_accelerated_op=True)

分布式训练

TorchOpt 提供了基于 PyTorch RPC 模块的分布式训练功能，以实现更快的训练速度并支持多节点多 GPU。与类似 MPI 的并行化范式不同，后者使用多个同质工作进程并需要精心设计的通信钩子，RPC API 允许用户更灵活地构建自己的优化流水线。实验结果表明，我们实现了加速比与工作进程数量之间的近似线性关系。请查看分布式训练文档和分布式 MAML 示例，获取更具体的指导。

OpTree

我们实现了 PyTree，以利用 C++ 实现快速的嵌套结构扁平化。树操作（例如扁平化和反扁平化）对于实现深度学习框架的功能性和即时编译（JIT）特性至关重要。通过在 C++ 中实现，我们可以使用一些缓存和内存友好的数据结构（例如 absl::InlinedVector），从而提升性能。如需更多指导和对比结果，请参阅我们的开源项目 OpTree。

可视化

元学习中复杂的梯度流给梯度流的管理和正确性验证带来了巨大挑战。 TorchOpt 提供了一个可视化工具，可在梯度图上标注变量（例如网络参数或元参数）名称，以便更好地分析。该可视化工具基于 torchviz 修改而来。请参阅示例可视化代码和教程笔记本可视化，了解更多信息。

下图展示了可视化结果。与 torchviz 相比，TorchOpt 将 Adam 内的操作融合在一起（橙色），以降低复杂度并提供更简单的可视化效果。

示例

在 examples 目录中，我们提供了几个使用 TorchOpt 的功能优化器示例和轻量级元学习示例。

此外，也请查看 examples 中更多分布式/可视化/与 functorch 兼容的示例。

安装

要求

PyTorch
（可选）用于可视化计算图
- Graphviz（对于 Linux 用户，使用 apt/yum install graphviz 或 conda install -c anaconda python-graphviz）

请先按照 https://pytorch.org 上的说明，在您的 Python 环境中安装 PyTorch。 然后运行以下命令，从 PyPI 安装 TorchOpt（ / )：

pip3 install torchopt

如果 PyTorch 的最低版本不满足要求，pip 会为您安装或升级。请注意 torch 的构建版本，以支持 CPU 或 CUDA（例如 cpu、cu118、cu121）。您可能需要指定额外的索引 URL 来安装 torch 包：

pip3 install torchopt --extra-index-url https://download.pytorch.org/whl/cu121

有关安装 PyTorch 的更多信息，请参阅 https://pytorch.org。

您也可以从源码构建共享库，使用：

git clone https://github.com/metaopt/torchopt.git
cd torchopt
pip3 install .

我们提供了一个 conda 环境配方，用于安装构建工具链，例如 cmake、g++ 和 nvcc。您可以使用以下命令，借助 conda / mamba 创建一个新的隔离环境。

git clone https://github.com/metaopt/torchopt.git
cd torchopt

# 如果 conda 无法检测到 NVIDIA 驱动程序（例如在 docker 或 WSL2 中），您可能需要设置 `CONDA_OVERRIDE_CUDA`
CONDA_OVERRIDE_CUDA=12.1 conda env create --file conda-recipe-minimal.yaml

conda activate torchopt
make install-editable  # 或运行 `pip3 install --no-build-isolation --editable .`

更改日志

请参阅 CHANGELOG.md。

引用 TorchOpt

如果您觉得 TorchOpt 有用，请在您的论文中引用它。

@article{JMLR:TorchOpt,
  author  = {Jie Ren* and Xidong Feng* and Bo Liu* and Xuehai Pan* and Yao Fu and Luo Mai and Yaodong Yang},
  title   = {TorchOpt: 一个高效的可微优化库},
  journal = {机器学习研究杂志},
  year    = {2023},
  volume  = {24},
  number  = {367},
  pages   = {1--14},
  url     = {http://jmlr.org/papers/v24/23-0191.html}
}

团队

TorchOpt 由 Jie Ren、Xidong Feng、Bo Liu、Xuehai Pan、Luo Mai 和 Yaodong Yang 共同完成。

许可协议

TorchOpt 采用 Apache 许可协议第 2.0 版发布。

TorchOpt 快速上手指南

环境准备

Python 版本：3.8+
前置依赖：PyTorch（推荐 2.0+）
推荐使用 conda 或 pip 管理环境，支持 CPU/GPU 加速

建议使用国内镜像源加速安装：
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple torchopt

安装步骤

pip install torchopt

如需使用最新开发版，可从 GitHub 安装：

pip install git+https://github.com/metaopt/torchopt.git

基本使用

方式一：Functional 风格（推荐用于可微优化）

import torch
import torch.nn as nn
import torchopt
from functorch import make_functional

class Net(nn.Module):
    def __init__(self):
        super().__init__()
        self.lin = nn.Linear(2, 1)

net = Net()
optimizer = torchopt.adam()  # 创建优化器

model, params = make_functional(net)  # 转为函数式模型
opt_state = optimizer.init(params)    # 初始化状态

# 模拟训练步骤
xs = torch.randn(4, 2)
ys = torch.randn(4, 1)
pred = model(params, xs)
loss = torch.nn.functional.mse_loss(pred, ys)

grads = torch.autograd.grad(loss, params)
updates, opt_state = optimizer.update(grads, opt_state, inplace=False)  # 非原地更新，支持自动微分
params = torchopt.apply_updates(params, updates)

方式二：PyTorch 风格（传统接口）

import torch
import torch.nn as nn
import torchopt

net = nn.Linear(2, 1)
optimizer = torchopt.Adam(net.parameters())  # 与 torch.optim.Adam 接口一致

xs = torch.randn(4, 2)
ys = torch.randn(4, 1)

pred = net(xs)
loss = torch.nn.functional.mse_loss(pred, ys)

optimizer.zero_grad()
loss.backward()
optimizer.step()

✅ 推荐初学者从 PyTorch 风格 开始，进阶用户使用 Functional 风格 实现元学习、可微优化等高级场景。

版本历史

v0.7.32023/11/10

v0.7.22023/08/17

v0.7.12023/05/12

v0.7.02023/02/15

v0.6.02022/12/06

v0.5.02022/09/05

v0.4.32022/08/07

v0.4.22022/07/26

v0.4.12022/06/14

常见问题

如何安装 torchopt 的开发版本？

如何解决在使用 torchopt.stop_gradient 时出现的 'Trying to backward through the graph a second time' 错误？

torchopt 的 OOP API 和函数式 API 有什么区别？

optree 仓库为何无法访问？

安装 torchopt 开发版时遇到 gcc 编译错误怎么办？

如何让隐式梯度组件的学习率可学习？

相似工具推荐

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|今天

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 139k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 107.7k|★★☆☆☆|2天前

开发框架图像Agent

NextChat

NextChat 是一款轻量且极速的 AI 助手，旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性，以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发，NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言，它也提供了便捷的自托管方案，支持一键部署到 Vercel 或 Zeabur 等平台。 NextChat 的核心亮点在于其广泛的模型兼容性，原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型，让用户在一个界面即可自由切换不同 AI 能力。此外，它还率先支持 MCP（Model Context Protocol）协议，增强了上下文处理能力。针对企业用户，NextChat 提供专业版解决方案，具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能，满足公司对数据隐私和个性化管理的高标准要求。

★ 87.6k|★★☆☆☆|今天

开发框架语言模型

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。

★ 85k|★★☆☆☆|今天

图像数据工具视频

ragflow

RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。

★ 77.1k|★★★☆☆|昨天

Agent图像开发框架