probability

4.4k 1.1k 简单 3 次阅读昨天Apache-2.0其他开发框架数据工具

AI 解读由 AI 自动生成，仅供参考

TensorFlow Probability（简称 TFP）是 TensorFlow 生态系统中的概率推理与统计分析库，让开发者能够在深度学习框架中轻松处理不确定性问题。

传统神经网络输出确定性的预测结果，而现实世界的数据往往充满噪声和未知因素。TFP 将概率方法深度整合进 TensorFlow，使模型能够量化预测的不确定性，表达"我有 80% 的把握认为结果是 A"而非简单的"结果是 A"。这对于风险评估、决策系统、科学模拟等场景至关重要。

TFP 采用分层架构设计：底层提供丰富的概率分布和可逆变换（Bijectors），支持从基础正态分布到复杂流模型的构建；中层支持联合分布建模和概率神经网络层；顶层则集成 MCMC 采样、变分推断等高级推理算法。值得一提的是，TFP 同时支持 JAX 后端，让偏好纯函数式编程的研究人员也能无缝使用。

这款工具主要面向机器学习研究人员、数据科学家和算法工程师，尤其适合需要构建贝叶斯神经网络、生成模型或进行因果推断的开发者。借助自动微分和 GPU 加速，TFP 既能处理学术研究中的复杂模型，也能支撑工业级的大规模应用。

使用场景

某金融科技公司的风控团队正在开发一套小微企业信贷违约预测模型，需要在预测违约概率的同时，量化模型不确定性，为授信决策提供置信区间参考。

没有 probability 时

团队只能用传统神经网络输出"点估计"违约概率（如0.73），无法告知业务方"这个预测有多可靠"，导致高风险客户被误判为优质客户
为获取不确定性估计，工程师被迫手动实现贝叶斯神经网络，需从零编写变分推断代码，开发周期长达2个月
模型上线后，面对10万+企业客户的批量预测，Python原生采样代码运行缓慢，无法利用GPU加速，单次全量评估需6小时
当业务要求"如果企业营收下降30%，违约概率如何变化"时，团队缺乏概率编程工具，无法便捷地做反事实推断

使用 probability 后

通过tfp.layers.DenseVariational快速构建贝叶斯神经网络层，模型天然输出预测分布，业务方可直接获取"违约概率90%置信区间为[0.58, 0.88]"的风险提示
利用tfp.distributions和tfp.vi内置的变分推断算法，3天内完成模型搭建与训练，自动微分机制免除了手动推导梯度的繁琐工作
借助TensorFlow的GPU加速能力，结合tfp.mcmc的并行采样，全量评估时间从6小时压缩至15分钟，轻松支持日频风控决策
通过tfp.distributions.JointDistributionSequential构建因果概率图模型，一行代码即可实现条件概率查询，快速响应业务方的敏感性分析需求

核心价值：probability 让团队以生产级效率将贝叶斯方法融入深度学习流水线，把"不确定性量化"从学术难题转化为可落地的风控标准能力。

运行环境要求

操作系统

Linux
macOS
Windows

GPU

可选，支持 GPU 加速（如 NVIDIA GPU），需安装对应版本的 TensorFlow GPU 版本

内存

未说明

依赖

notesTensorFlow 需单独安装，TFP 不将其作为依赖项；支持纯 JAX 后端（tensorflow_probability.substrates.jax）；源码编译需要 Bazel 构建系统，最高支持 Bazel 6.4.0；夜间版（tfp-nightly）可能不够稳定

python未说明

tensorflow>=2.0

tensorflow-cpu（CPU 版本可选）

tf-nightly（夜间版）

bazel<=6.4.0（源码编译）

快速开始

TensorFlow Probability

TensorFlow Probability 是一个用于概率推理（probabilistic reasoning）和统计分析的 TensorFlow 库。作为 TensorFlow 生态系统的一部分，TensorFlow Probability 提供了概率方法与深度网络的集成、通过自动微分实现的基于梯度的推断，以及通过硬件加速（如 GPU）和分布式计算实现对大规模数据集和模型的扩展能力。

TFP 也可以作为 "Tensor-friendly Probability" 在纯 JAX 环境中运行！： from tensorflow_probability.substrates import jax as tfp -- 了解更多请访问此处。

我们的概率机器学习工具结构如下：

第 0 层：TensorFlow。数值运算。特别是，LinearOperator 类支持无矩阵（matrix-free）实现，可以利用特殊结构（对角、低秩等）进行高效计算。它由 TensorFlow Probability 团队构建和维护，现已成为核心 TF 中 tf.linalg 的一部分。

第 1 层：统计构建模块

分布（Distributions，tfp.distributions）：大量概率分布和相关统计量，支持批处理和广播语义。请参阅分布教程。
双射器（Bijectors，tfp.bijectors）：随机变量的可逆且可组合变换。双射器提供了丰富的变换分布类别，从经典的对数正态分布到复杂的深度学习模型如掩码自回归流。

第 2 层：模型构建

联合分布（Joint Distributions，例如 tfp.distributions.JointDistributionSequential）：一个或多个可能相互依赖的分布之上的联合分布。关于使用 TFP 的 JointDistribution 进行建模的入门介绍，请查看此 colab
概率层（Probabilistic Layers，tfp.layers）：对其所表示函数具有不确定性的神经网络层，扩展了 TensorFlow 层。

第 3 层：概率推断

马尔可夫链蒙特卡罗（Markov chain Monte Carlo，tfp.mcmc）：通过采样近似积分的算法。包括哈密顿蒙特卡罗、随机游走 Metropolis-Hastings，以及构建自定义转移核的能力。
变分推断（Variational Inference，tfp.vi）：通过优化近似积分的算法。
优化器（Optimizers，tfp.optimizer）：随机优化方法，扩展了 TensorFlow 优化器。包括随机梯度朗之万动力学。
蒙特卡罗（Monte Carlo，tfp.monte_carlo）：计算蒙特卡罗期望的工具。

TensorFlow Probability 正在积极开发中。接口可能随时更改。

示例

查看 tensorflow_probability/examples/ 获取端到端示例。其中包括以下教程笔记本：

线性混合效应模型（Linear Mixed Effects Models）。一种分层线性模型，用于在样本间共享统计强度。
八所学校（Eight Schools）。一种用于可交换处理效应的分层正态模型。
分层线性模型（Hierarchical Linear Models）。在 TensorFlow Probability、R 和 Stan 之间进行比较的分层线性模型。
贝叶斯高斯混合模型（Bayesian Gaussian Mixture Models）。使用概率生成模型进行聚类。
概率主成分分析（Probabilistic Principal Components Analysis）。使用潜变量进行降维。
高斯连接函数（Gaussian Copulas）。用于捕捉随机变量间依赖关系的概率分布。
TensorFlow Distributions：温和入门。 TensorFlow Distributions 简介。
理解 TensorFlow Distributions 的形状。如何区分任意形状概率计算中的样本（samples）、批次（batches）和事件（events）。
TensorFlow Probability 案例研究：协方差估计。用户应用 TensorFlow Probability 进行协方差估计的案例研究。

还包括以下示例脚本：

使用潜码和变分推断（variational inference）进行表示学习。

向量量化自编码器（Vector-Quantized Autoencoder）。使用向量量化进行离散表示学习。
解耦序列变分自编码器（Disentangled Sequential Variational Autoencoder）使用变分推断对序列进行解耦表示学习。
贝叶斯神经网络（Bayesian Neural Networks）。对权重具有不确定性的神经网络。
贝叶斯逻辑回归（Bayesian Logistic Regression）。用于二分类的贝叶斯推断。

安装

有关安装 TensorFlow 的更多详细信息、安装先决条件的指导以及（可选）设置虚拟环境，请参阅 TensorFlow 安装指南。

稳定版本

要安装最新的稳定版本，请运行以下命令：

# 注意事项：

# - `--upgrade` 标志确保您获得最新版本。
# - `--user` 标志确保软件包安装到您的用户目录
#   而不是系统目录。
# - TensorFlow 2 软件包需要 pip >= 19.0
python -m pip install --upgrade --user pip
python -m pip install --upgrade --user tensorflow tensorflow_probability

对于仅 CPU 使用（以及更小的安装），请使用 tensorflow-cpu 安装。

要使用 TensorFlow 2.0 之前的版本，请运行：

python -m pip install --upgrade --user "tensorflow<2" "tensorflow_probability<0.9"

注意：由于 TensorFlow 未作为 TensorFlow Probability 软件包的依赖项包含在 setup.py 中，您必须显式安装 TensorFlow 软件包（tensorflow 或 tensorflow-cpu）。这使我们能够维护一个软件包，而不是分别为 CPU 和 GPU 启用的 TensorFlow 维护单独的软件包。有关 TensorFlow 和 TensorFlow Probability 之间依赖关系的更多详细信息，请参阅 TFP 发布说明。

夜间构建

TensorFlow Probability 还有夜间构建版本，pip 软件包名为 tfp-nightly，它依赖于 tf-nightly 或 tf-nightly-cpu 之一。夜间构建包含较新的功能，但可能比版本化发布更不稳定。稳定版本和夜间版本的文档均可在此获取。

python -m pip install --upgrade --user tf-nightly tfp-nightly

从源代码安装

您也可以从源代码安装。这需要 Bazel 构建系统。强烈建议在尝试从源代码构建 TensorFlow Probability 之前安装 TensorFlow 的夜间构建版本（tf-nightly）。TFP 当前支持的最新的 Bazel 版本是 6.4.0；对 7.0.0+ 的支持正在进行中（WIP, Work In Progress）。

# sudo apt-get install bazel git python-pip  # Ubuntu；其他系统，请参阅上述链接。
python -m pip install --upgrade --user tf-nightly
git clone https://github.com/tensorflow/probability.git
cd probability
bazel build --copt=-O3 --copt=-march=native :pip_pkg
PKGDIR=$(mktemp -d)
./bazel-bin/pip_pkg $PKGDIR
python -m pip install --upgrade --user $PKGDIR/*.whl

社区

作为 TensorFlow 的一部分，我们致力于营造一个开放且友好的环境。

Stack Overflow：提出或回答技术问题。
GitHub：报告 bug 或提出功能需求。
TensorFlow 博客：获取 TensorFlow 团队的最新内容和社区精选文章。
YouTube 频道：关注 TensorFlow 相关节目。
tfprobability@tensorflow.org：开放的邮件列表，用于讨论和提问。

更多详情请参见 TensorFlow 社区页面。查看我们最新的公开报道：

贡献

我们期待与您合作！请参阅 CONTRIBUTING.md 了解如何贡献。本项目遵循 TensorFlow 的行为准则。参与本项目即表示您同意遵守该准则。

参考文献

如果您在论文中使用了 TensorFlow Probability，请引用：

TensorFlow Distributions. Joshua V. Dillon, Ian Langmore, Dustin Tran, Eugene Brevdo, Srinivas Vasudevan, Dave Moore, Brian Patton, Alex Alemi, Matt Hoffman, Rif A. Saurous. arXiv preprint arXiv:1711.10604, 2017.

（我们深知 TensorFlow Probability 的内容远不止 Distributions，但 Distributions 论文阐述了我们的愿景，目前是一个合适的引用来源。）

TensorFlow Probability 快速上手指南

环境准备

系统要求

Python 3.7+
pip 19.0+（TensorFlow 2 必需）
支持的操作系统：Linux、macOS、Windows

前置依赖

必须安装：TensorFlow（tensorflow 或 tensorflow-cpu）
可选：GPU 支持需安装 CUDA/cuDNN（参考 TensorFlow GPU 指南）

注意：TensorFlow Probability 不将 TensorFlow 作为依赖项自动安装，需手动指定。

安装步骤

方式一：稳定版安装（推荐）

# 升级 pip
python -m pip install --upgrade --user pip

# 安装 TensorFlow + TensorFlow Probability
python -m pip install --upgrade --user tensorflow tensorflow_probability

仅 CPU 版本（体积更小）：

python -m pip install --upgrade --user tensorflow-cpu tensorflow_probability

国内镜像加速（清华源）：

python -m pip install --upgrade --user -i https://pypi.tuna.tsinghua.edu.cn/simple \
    tensorflow tensorflow_probability

方式二：每日构建版（最新功能）

python -m pip install --upgrade --user tf-nightly tfp-nightly

验证安装

import tensorflow as tf
import tensorflow_probability as tfp

print(tfp.__version__)  # 应输出版本号

基本使用

示例 1：创建分布并采样

import tensorflow as tf
import tensorflow_probability as tfp

tfd = tfp.distributions

# 创建正态分布
normal = tfd.Normal(loc=0., scale=1.)

# 采样
samples = normal.sample(1000)  # 1000 个样本

# 计算概率密度
log_prob = normal.log_prob(0.0)

示例 2：JAX 后端使用（无 TensorFlow）

from tensorflow_probability.substrates import jax as tfp

tfd = tfp.distributions

# 同样 API，底层使用 JAX
normal = tfd.Normal(loc=0., scale=1.)
samples = normal.sample(seed=42)  # JAX 需要显式传入 seed

示例 3：简单贝叶斯推断（MCMC）

import tensorflow_probability as tfp

tfd = tfp.distributions
tfb = tfp.bijectors

# 定义目标分布（标准正态）
target_log_prob = lambda x: -0.5 * tf.square(x)

# HMC 采样器
hmc = tfp.mcmc.HamiltonianMonteCarlo(
    target_log_prob_fn=target_log_prob,
    num_leapfrog_steps=3,
    step_size=0.1
)

# 运行 MCMC（简化示例，实际需设置初始状态）

下一步

资源	链接
官方教程	GitHub Examples
API 文档	https://www.tensorflow.org/probability/api_docs/python/tfp
分布形状指南	Understanding TensorFlow Distributions Shapes

版本历史

v0.14.02021/09/21

v0.13.02021/06/18

0.13.0-rc02021/05/24

v0.12.22021/04/19

v0.21.02023/08/04

v0.25.02024/11/08

v0.24.02024/03/12

v0.23.02023/11/20

v0.22.12023/10/23

v0.22.02023/10/02

v0.20.02023/05/08

v0.19.02022/12/06

v0.18.02022/09/12

v0.17.02022/06/07

v0.16.02022/02/14

v0.15.02021/11/18

v0.14.12021/09/30

v0.12.12020/12/29

v0.12.02020/12/29

v0.12.0-rc42020/12/09

常见问题

TFP 与 Stan 的 CholeskyLKJ 对数概率计算结果不一致，如何解决？

如何将无约束向量转换为 LKJ 分布的相关矩阵（Cholesky 分解形式）？

如何计算高斯混合模型（GMM）之间的 KL 散度？

Gamma 分布如何使用隐式重参数化梯度（Implicit Reparameterization Gradients）？

TensorFlow 2.0 中遇到 "Tensor is unhashable if Tensor equality is enabled" 错误如何解决？

相似工具推荐

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|今天

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 139k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 107.7k|★★☆☆☆|2天前

开发框架图像Agent

NextChat

NextChat 是一款轻量且极速的 AI 助手，旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性，以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发，NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言，它也提供了便捷的自托管方案，支持一键部署到 Vercel 或 Zeabur 等平台。 NextChat 的核心亮点在于其广泛的模型兼容性，原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型，让用户在一个界面即可自由切换不同 AI 能力。此外，它还率先支持 MCP（Model Context Protocol）协议，增强了上下文处理能力。针对企业用户，NextChat 提供专业版解决方案，具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能，满足公司对数据隐私和个性化管理的高标准要求。

★ 87.6k|★★☆☆☆|今天

开发框架语言模型

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。

★ 85k|★★☆☆☆|今天

图像数据工具视频

ragflow

RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。

★ 77.1k|★★★☆☆|昨天

Agent图像开发框架