flax

7.1k 795 中等 1 次阅读今天Apache-2.0开发框架

AI 解读由 AI 自动生成，仅供参考

Flax 是一个专为 JAX 生态打造的高性能神经网络库，其核心设计理念是“灵活性”。它旨在帮助研究人员和开发者摆脱传统框架的束缚，无需等待官方更新功能，只需直接修改训练循环或示例代码，即可轻松尝试全新的训练方法。

针对深度学习模型构建中常见的复杂性与调试难题，Flax 提供了简洁直观的解决方案。特别是其最新推出的 Flax NNX API，创新性地引入了原生 Python 引用语义，允许用户使用标准的 Python 对象来定义模型。这一特性不仅支持可变状态和引用共享，还大幅降低了模型的创建、检查与调试难度，让代码逻辑更符合直觉。

Flax 由 Google Brain 工程师与 JAX 团队紧密协作开发，内置了从线性层、卷积、归一化到注意力机制及循环单元等丰富的常用组件。它非常适合希望深入底层原理、追求极致定制能力的 AI 研究人员和高级开发者。如果你需要在 JAX 上进行前沿探索或快速验证新想法，Flax 将是你得力的科研伙伴。

使用场景

某 AI 实验室的研究团队正在基于 JAX 开发一种新型动态图神经网络，需要频繁修改模型内部状态传递逻辑以验证创新算法。

没有 flax 时

研究人员被迫使用纯函数式写法手动管理所有模型参数和状态，代码中充斥着繁琐的 params 字典传递，难以直观理解网络结构。
每次尝试新的训练循环变体（如梯度裁剪或自定义优化步骤）时，都需要重写大量样板代码，无法灵活复用现有组件。
调试过程极其痛苦，因为模型不可就地修改（immutable），必须追踪复杂的函数返回链才能定位状态更新错误。
实现带有共享权重的复杂拓扑结构时，需手动处理引用关系，极易出错且代码可读性差。

使用 flax 后

借助 Flax NNX 的原生 Python 引用语义，研究员可以直接用常规类定义模型，像操作普通对象一样自然地访问和修改层属性。
训练逻辑与模型定义彻底解耦，只需简单叉改示例中的训练循环即可尝试新策略，无需触碰核心模型代码。
支持就地调试和断点检查，开发者能直接观察中间变量变化，快速定位并修复状态更新异常，研发效率显著提升。
轻松实现权重共享等高级架构，通过标准的 Python 对象引用即可让不同模块共享同一层实例，代码简洁且符合直觉。

Flax 将 JAX 的高性能与 Python 的灵活性完美结合，让研究者能专注于算法创新而非框架束缚。

运行环境要求

操作系统

未说明

GPU

非必需，支持 CPU、GPU 和 TPU（具体取决于 JAX 的安装配置）

内存

未说明

依赖

notesFlax 是基于 JAX 的神经网络库，本身不强制要求 GPU，但若要使用 GPU 或 TPU 加速，需参考 JAX 的安装指南进行相应配置（如安装 CUDA/cuDNN 或 TPU 驱动）。可选安装额外依赖（如 matplotlib）可通过 'pip install flax[all]' 实现。

python3.8+

jax

flax

快速开始

Flax：专为灵活性设计的 JAX 神经网络库及生态系统

概述 | 快速安装 | Flax 是什么样子的？ | 文档

2024 年发布的 Flax NNX 是一个简化的全新 Flax API，旨在让在 JAX 中创建、检查、调试和分析神经网络变得更加容易。它通过为 Python 引用语义提供一等公民级的支持来实现这一点。这使得用户能够使用常规 Python 对象来表达他们的模型，从而支持引用共享和可变性。

Flax NNX 源自 Flax Linen API。该 API 于 2020 年由 Google Brain 的工程师和研究人员与 JAX 团队紧密合作发布。

您可以在专门的 Flax 文档网站上了解更多关于 Flax NNX 的信息。请务必查看：

注意： Flax Linen 的文档有其独立的站点。

Flax 团队的使命是服务于不断增长的 JAX 神经网络研究生态系统——无论是在 Alphabet 内部还是更广泛的社区中——并探索 JAX 发挥优势的用例。我们几乎所有的协调与规划工作都在 GitHub 上进行，同时也在那里讨论即将发生的设计变更。我们欢迎对任何讨论、问题或拉取请求线程提出反馈意见。

您可以在我们的 Flax GitHub 讨论区提出功能请求、告知我们您的工作进展、报告问题或提问。

我们预计会持续改进 Flax，但不打算对核心 API 进行重大破坏性更改。我们会尽可能使用 Changelog 条目和弃用警告。

如果您想直接联系我们，我们的邮箱是 flax-dev@google.com。

概述

Flax 是一个面向 JAX 的高性能神经网络库及生态系统，其设计宗旨就是 灵活性：尝试新的训练方式，只需分叉示例并修改训练循环，而无需向框架添加新特性。

Flax 在与 JAX 团队的密切合作下开发，自带您开展研究所需的一切，包括：

神经网络 API (flax.nnx)：包含 Linear、Conv、BatchNorm、LayerNorm、GroupNorm、Attention（如 MultiHeadAttention）、LSTMCell、GRUCell、Dropout。
实用工具与模式：分布式训练、序列化与检查点保存、指标计算、设备端预取。
教学示例：MNIST、使用 Gemma 语言模型（Transformer）进行推理/采样。

快速安装

Flax 使用 JAX，因此请先查看 JAX 在 CPU、GPU 和 TPU 上的安装说明。

您需要 Python 3.8 或更高版本。从 PyPI 安装 Flax：

pip install flax

要升级到最新版本的 Flax，可以使用：

pip install --upgrade git+https://github.com/google/flax.git

如果某些依赖项需要额外的包（例如 matplotlib），而这些包并未包含在内，您可以运行以下命令来安装所有依赖项：

pip install "flax[all]"

Flax 是什么样子的？

我们提供了三个使用 Flax API 的示例：一个简单的多层感知机、一个卷积神经网络和一个自编码器。

要深入了解 Module 抽象，可以查看我们的文档以及我们关于 Module 抽象的详细介绍。如需更多最佳实践的具体演示，请参阅我们的指南和开发者笔记。

多层感知机的示例：

class MLP(nnx.Module):
  def __init__(self, din: int, dmid: int, dout: int, *, rngs: nnx.Rngs):
    self.linear1 = nnx.Linear(din, dmid, rngs=rngs)
    self.dropout = nnx.Dropout(rate=0.1, rngs=rngs)
    self.bn = nnx.BatchNorm(dmid, rngs=rngs)
    self.linear2 = nnx.Linear(dmid, dout, rngs=rngs)

  def __call__(self, x: jax.Array):
    x = nnx.gelu(self.dropout(self.bn(self.linear1(x))))
    return self.linear2(x)

卷积神经网络的示例：

class CNN(nnx.Module):
  def __init__(self, *, rngs: nnx.Rngs):
    self.conv1 = nnx.Conv(1, 32, kernel_size=(3, 3), rngs=rngs)
    self.conv2 = nnx.Conv(32, 64, kernel_size=(3, 3), rngs=rngs)
    self.avg_pool = partial(nnx.avg_pool, window_shape=(2, 2), strides=(2, 2))
    self.linear1 = nnx.Linear(3136, 256, rngs=rngs)
    self.linear2 = nnx.Linear(256, 10, rngs=rngs)

  def __call__(self, x):
    x = self.avg_pool(nnx.relu(self.conv1(x)))
    x = self.avg_pool(nnx.relu(self.conv2(x)))
    x = x.reshape(x.shape[0], -1)  # 展平
    x = nnx.relu(self.linear1(x))
    x = self.linear2(x)
    return x

自编码器的示例：

Encoder = lambda rngs: nnx.Linear(2, 10, rngs=rngs)
Decoder = lambda rngs: nnx.Linear(10, 2, rngs=rngs)

class AutoEncoder(nnx.Module):
  def __init__(self, rngs):
    self.encoder = Encoder(rngs)
    self.decoder = Decoder(rngs)

  def __call__(self, x) -> jax.Array:
    return self.decoder(self.encoder(x))

  def encode(self, x) -> jax.Array:
    return self.encoder(x)

引用 Flax

引用本仓库时，请使用以下格式：

@software{flax2020github,
  author = {Jonathan Heek and Anselm Levskaya and Avital Oliver and Marvin Ritter and Bertrand Rondepierre and Andreas Steiner and Marc van {Z}ee},
  title = {{F}lax: A neural network library and ecosystem for {JAX}},
  url = {http://github.com/google/flax},
  version = {0.12.6},
  year = {2024},
}

在上述 BibTeX 条目中，作者姓名按字母顺序排列；版本号应为 flax/version.py 中的版本号；年份对应于该项目的开源发布年份。

注意事项

Flax 是由 Google DeepMind 的一支专业团队维护的开源项目，但它并非 Google 的官方产品。

Flax 快速上手指南

Flax 是一个为 JAX 设计的高性能神经网络库，主打灵活性。2024 年推出的 Flax NNX 是新简化版 API，支持原生 Python 引用语义，让模型定义、调试和分析更加直观。

环境准备

在开始之前，请确保满足以下要求：

操作系统：Linux, macOS, 或 Windows (WSL2 推荐)
Python 版本：3.8 或更高
前置依赖：必须先安装 JAX。
- 请访问 JAX 安装指南根据您的硬件（CPU/GPU/TPU）安装对应版本的 JAX。
- 国内用户提示：如果官方源下载缓慢，可尝试使用清华或阿里镜像源安装 JAX 相关包。

安装步骤

1. 基础安装

通过 PyPI 安装稳定版：

pip install flax

2. 安装最新版（可选）

如需体验最新功能，可从 GitHub 源码安装：

pip install --upgrade git+https://github.com/google/flax.git

3. 安装完整依赖（推荐）

若需使用绘图等额外功能（如 matplotlib），建议安装完整包：

pip install "flax[all]"

国内加速提示：若 pip 下载速度慢，可添加国内镜像源参数，例如：

pip install flax -i https://pypi.tuna.tsinghua.edu.cn/simple

基本使用

Flax NNX 允许你像编写普通 Python 类一样定义神经网络。以下是一个最简单的多层感知机（MLP）示例：

import jax
import jax.numpy as jnp
from flax import nnx

class MLP(nnx.Module):
  def __init__(self, din: int, dmid: int, dout: int, *, rngs: nnx.Rngs):
    # 定义网络层
    self.linear1 = nnx.Linear(din, dmid, rngs=rngs)
    self.dropout = nnx.Dropout(rate=0.1, rngs=rngs)
    self.bn = nnx.BatchNorm(dmid, rngs=rngs)
    self.linear2 = nnx.Linear(dmid, dout, rngs=rngs)

  def __call__(self, x: jax.Array):
    # 定义前向传播逻辑
    x = nnx.gelu(self.dropout(self.bn(self.linear1(x))))
    return self.linear2(x)

# 实例化模型
rngs = nnx.Rngs(0)
model = MLP(din=10, dmid=20, dout=2, rngs=rngs)

# 创建虚拟输入数据
x = jnp.ones((4, 10))

# 执行前向推理
output = model(x)
print(output.shape)  # 输出: (4, 2)

核心要点：

继承 nnx.Module 类来定义模型。
在 __init__ 中初始化层，需传入 rngs 用于随机数生成。
在 __call__ 中定义数据流动逻辑。
直接调用模型实例即可进行计算。

版本历史

v0.12.62026/03/20

v0.12.52026/03/04

v0.12.42026/02/12

v0.12.32026/01/27

v0.12.22025/12/18

v0.12.12025/11/19

v0.12.02025/09/25

v0.11.22025/08/28

v0.11.12025/08/08

v0.11.02025/07/29

v0.10.72025/07/02

v0.10.62025/04/23

v0.10.52025/03/31

v0.10.42025/02/27

v0.10.32025/02/10

v0.10.22024/11/19

v0.10.12024/10/31

v0.10.02024/10/16

v0.9.02024/08/27

v0.8.52024/06/26

常见问题

Flax 的旧版 API (flax.nn) 和新版 Linen API 有什么区别？我应该使用哪个？

Flax 返回的参数字典应该是 FrozenDict 还是普通字典？为什么？

如何在 Flax 中使用 FlashAttention？它会自动启用吗？

为什么在 CPU 上使用不同 batch size 调用 model.apply 时，网络行为不一致（即使使用了固定的 BatchNorm 参数）？

Flax 模块实例化时为什么要重写 __new__？这带来了什么问题？

JAX 和 Flax 为什么默认不使用双精度（float64），能否全局设置？

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

★ 349.3k|★★★☆☆|今天

Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|昨天

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 141.5k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 107.9k|★★☆☆☆|今天

开发框架图像Agent

markitdown

MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器

★ 93.4k|★★☆☆☆|今天

插件开发框架

LLMs-from-scratch

LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目，旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型（LLM）。它不仅是同名技术著作的官方代码库，更提供了一套完整的实践方案，涵盖模型开发、预训练及微调的全过程。该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型，却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码，用户能够透彻掌握 Transformer 架构、注意力机制等关键原理，从而真正理解大模型是如何“思考”的。此外，项目还包含了加载大型预训练权重进行微调的代码，帮助用户将理论知识延伸至实际应用。 LLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API，而是渴望探究模型构建细节的技术人员而言，这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计：将复杂的系统工程拆解为清晰的步骤，配合详细的图表与示例，让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础，还是为未来研发更大规模的模型做准备

★ 90.1k|★★★☆☆|今天

语言模型图像Agent