BayesianDeepLearning-Survey

519 63 非常简单 1 次阅读 1个月前开发框架

AI 解读由 AI 自动生成，仅供参考

BayesianDeepLearning-Survey 是一个持续更新的贝叶斯深度学习（BDL）开源综述资源库。它基于 2020 年发表于 ACM Computing Surveys 的经典论文《A Survey on Bayesian Deep Learning》扩展而来，旨在系统梳理该领域的最新进展。

传统深度学习模型往往缺乏对预测不确定性的量化能力，这在医疗、自动驾驶等高风险场景中至关重要。BayesianDeepLearning-Survey 通过整合大量前沿文献，展示了如何利用贝叶斯方法赋予深度模型“自知之明”，使其不仅能给出预测结果，还能评估结果的可靠程度，从而解决模型在数据稀缺或分布变化时的鲁棒性问题。

该资源库特别适合人工智能研究人员、算法工程师及高校师生使用。其独特亮点在于极高的时效性与广泛的覆盖范围：内容不仅包含基础理论，还细致划分了推荐系统、自然语言处理、计算机视觉、医疗健康、联邦学习及科学发现（AI4Science）等十多个垂直应用方向，并提供了相关经典论文、代码实现及数据集的直接链接。无论是希望快速入门的新手，还是寻找特定领域突破口的资深专家，都能在此找到极具价值的参考指引，是探索不确定性人工智能不可或缺的学术导航图。

使用场景

某医疗 AI 初创团队正在研发一款基于深度学习的疾病风险预测系统，亟需解决模型在数据稀缺场景下的不确定性量化难题。

没有 BayesianDeepLearning-Survey 时

文献检索如大海捞针：团队成员需在 arXiv、Google Scholar 等平台手动搜索分散的贝叶斯深度学习论文，耗时数周仍难以理清技术脉络。
技术选型盲目试错：由于缺乏系统性对比，工程师不清楚该用变分推断还是蒙特卡洛 Dropout，导致在不适配的架构上浪费大量算力资源。
跨领域应用受阻：团队想参考推荐系统或自然语言处理中的成熟贝叶斯迁移方案，却因找不到跨领域的关联研究而陷入闭门造车。
复现成本极高：找不到经过验证的代码库和标准数据集（如 CiteULike），从零复现经典算法（如 CDL）的成功率极低且周期漫长。

使用 BayesianDeepLearning-Survey 后

一站式知识导航：直接利用其更新的综述目录，快速定位到"BDL 与医疗健康”及“概率神经网络构建块”章节，半天内即可掌握核心方法论。
精准架构决策：通过查阅其中关于不同推断方法的适用场景分析，迅速选定适合小样本医疗数据的变分自编码器架构，避免无效实验。
跨界灵感激发：参考"BDL 与推荐系统”及“领域自适应”章节，成功将协同深度学习的思想迁移至多模态病历数据融合，提升了模型泛化能力。
高效落地复现：直接获取文中链接的 TensorFlow/MXNet 代码库及标准数据集，将原本需要一个月的基线模型搭建时间缩短至三天。

BayesianDeepLearning-Survey 将原本碎片化的前沿研究转化为结构化的工程指南，极大降低了贝叶斯深度学习在高风险领域的落地门槛。

运行环境要求

GPU

未说明

内存

未说明

依赖

notes该仓库主要是一个贝叶斯深度学习（BDL）的综述文献列表和资源索引，而非一个可直接运行的单一软件工具。README 中列出的各个子项目（如推荐系统、医疗、NLP 等方向的具体论文代码）拥有各自独立的运行环境需求，需参考对应子项目的代码仓库（如 GitHub 链接所示）获取具体的依赖库、Python 版本及硬件要求。

python未说明

快速开始

贝叶斯深度学习（BDL）更新版综述

这是一份关于贝叶斯深度学习（BDL）的更新版综述，是对2020年发表于ACM计算综述上的论文《贝叶斯深度学习综述》（http://wanghao.in/paper/CSUR20_BDL.pdf）的持续更新与扩展版本。

贝叶斯深度学习是一个功能强大的框架，可用于设计适用于广泛应用场景的模型。有关其在医疗健康领域的潜在应用，请参阅我们的Nature Medicine论文。

综述

贝叶斯深度学习综述
作者：Wang 等人，ACM计算综述（CSUR）2020年
[PDF] [博客] [2016年的BDL框架]

BDL与推荐系统

用于推荐系统的协同深度学习
作者：Wang 等人，KDD 2015
[PDF] [项目页面] [2014年Arxiv版本] [代码] [MXNet代码] [TensorFlow代码] [数据集A] [数据集B] [Jupyter Notebook] [演示文稿] [长篇演示文稿]

协同循环自编码器：在推荐的同时学习填补缺失值
作者：Wang 等人，NIPS 2016
[PDF]

用于推荐系统的协同知识库嵌入
作者：Zhang 等人，KDD 2016
[PDF]

协同深度排序：一种结合隐式反馈的混合成对推荐算法
作者：Ying 等人，PAKDD 2016
[PDF]

用于推荐系统的协同变分自编码器
作者：Li 等人，KDD 2017
[PDF]

用于协同过滤的变分自编码器
作者：Liang 等人，WWW 2018
[PDF]

具有自适应边距的概率度量学习用于Top-K推荐
作者：Ma 等人，KDD 2020
[PDF]

BDL与领域适应（及领域泛化、元学习等）

概率模型无关的元学习
作者：Finn 等人，NIPS 2018
[PDF]

贝叶斯模型无关的元学习
作者：Yoon 等人，NIPS 2018
[PDF]

将基于梯度的元学习重新表述为层次贝叶斯模型
作者：Grant 等人，ICLR 2018
[PDF]

通过在线任务混合协调元学习与持续学习
作者：Jerefal 等人，NIPS 2019
[PDF]

用于预测的概率推理元学习
作者：Gordon 等人，ICLR 2019
[PDF]

利用变分信息瓶颈进行领域泛化的元学习
作者：Du 等人，ECCV 2020
[PDF]

通过深度核函数实现小样本设置下的贝叶斯元学习
作者：Patacchiola 等人，NIPS 2020
[PDF]

连续索引的领域适应
作者：Wang 等人，ICML 2020
[PDF]

更进一步的贝叶斯方法：带有不确定性的领域不变学习
作者：Xiao 等人，ICML 2021
[PDF]

领域索引变分贝叶斯：用于领域适应的可解释领域索引
作者：Xu 等人，ICLR 2023
[PDF]

BDL与医疗健康

基于深度泊松因子模型的电子健康记录分析
作者：Henao等，JMLR 2016年
[PDF]

非线性状态空间模型的结构化推理网络
作者：Krishnan等，AAAI 2017年
[PDF]

基于深度潜在变量模型的因果效应推断
作者：Louizos等，NIPS 2017年
[PDF]

黑盒FDR
作者：Tansey等，ICML 2018年
[PDF]

双向推理网络：一类用于健康画像的深度贝叶斯网络
作者：Wang等，AAAI 2019年
[PDF]

无采样不确定性估计在门控循环单元中的应用及其在神经影像学规范建模中的实践
作者：Hwang等，UAI 2019年
[PDF]

神经跳跃随机微分方程
作者：Jia等，NIPS 2019年
[PDF]

基于实体感知CNN堆叠的贝叶斯网络集成实现可解释临床诊断
作者：Chen等，ACL 2020年
[PDF]

连续索引域适应
作者：Wang等，ICML 2020年
[PDF] [参见BDL与域适应]

利用人工智能评估药物自我管理
作者：Zhao等，Nature Medicine 2021年
[PDF]

神经药效动力学状态空间建模
作者：Hussain等，ICML 2021年
[PDF]

具有反事实解释的自解释时间序列预测
作者：Yan等，ICML 2023年
[PDF] [参见BDL与预测（时间序列分析）]

BDL与自然语言处理

从序列到更好序列：组合结构的持续修正
作者：Mueller等，ICML 2017年
[PDF]

QuaSE：在可量化指导下进行的序列编辑
作者：Liao等，EMNLP 2018年
[PDF]

用于可解释文本生成的分散指数族混合VAE
作者：Shi等，ICML 2020年
[PDF]

基于实体感知CNN堆叠的贝叶斯网络集成实现可解释临床诊断
作者：Chen等，ACL 2020年
[PDF] [参见BDL与医疗健康]

你说了什么以及如何说：微博对话中主题与话语的联合建模
作者：Zeng等，ACL 2020年
[PDF]

用于可解释文本建模的基于能量的潜扩散模型
作者：Yu等，ICML 2022年
[PDF]

扩散-LM提升可控文本生成能力
作者：Li等，NeurIPS 2022年
[PDF]

自回归语言生成的可操作控制
作者：Zhang等，ICML 2023年
[PDF]

用于解释基础语言模型的变分语言概念
作者：Wang等，EMNLP 2024年
[PDF]

基于代理超网的多智能体架构搜索
作者：Zhang等，ICML 2025年
[PDF]

LARGO：通过梯度优化实现的潜在对抗反射，用于突破大型语言模型的安全限制
作者：Li等，NeurIPS 2025年
[PDF]

BDL与计算机视觉

关注、推断、重复：利用生成模型实现快速场景理解
作者：Eslami等，NIPS 2016年
[PDF]

图像遮挡感知生成模型中的高效推理
作者：Huang等，ICLR 2016年
[PDF]

顺序式关注、推断、重复：运动物体的生成建模
作者：Kosiorek等，NIPS 2018年
[PDF]

高斯过程先验变分自编码器
作者：Casale等，NIPS 2018年
[PDF]

卷积神经网络实现的空间不变无监督目标检测
作者：Crawford等，AAAI 2019年
[PDF]

利用可处理概率模型加速关注-推断-重复流程
作者：Stelzner等，ICML 2019年
[PDF]

用于动作识别的异步时序场
作者：Sigurdsson等，CVPR 2017年
[PDF]

基于贝叶斯对抗学习推广眼动追踪技术
作者：Wang等，CVPR 2019年
[PDF]

顺序神经过程
作者：Singh等，NIPS 2019年
[PDF]

SPACE：基于空间注意力和分解的无监督面向对象场景表示
作者：Lin等，ICLR 2020年
[PDF]

对分类概率的贝叶斯视角
作者：Joo等，ICML 2020年
[PDF]

NVAE：一种深度层次变分自编码器
作者：Vahdat等，NIPS 2020年
[PDF]

学习基于能量的潜在空间先验模型
作者：Pang等，NIPS 2020年
[PDF]

生成式神经符号机器
作者：Jiang等，NIPS 2020年
[PDF]

去噪扩散概率模型
作者：Ho等，NIPS 2020年
[PDF]

组合式零样本识别的因果视角
作者：Atzmon等，NIPS 2020年
[PDF]

反事实揭示了深度生成模型的模块化结构
作者：Besserve等，ICLR 2020年
[PDF]

ROOTS：面向对象的三维场景表示与渲染
陈等人著，JMLR 2021年
[PDF]

改进的去噪扩散概率模型
尼科尔等人著，ICML 2021年
[PDF]

用于因果学习的生成式干预。
毛等人著，CVPR 2021年
[PDF]

在自然监督下，对抗攻击是可逆的
毛等人著，ICCV 2021年
[PDF]

反事实零样本与开放集视觉识别
岳等人著，CVPR 2021年
[PDF]

ILVR：去噪扩散概率模型的条件化方法
崔等人著，ICCV 2021年
[PDF]

扩散模型在图像合成方面超越GAN
达里瓦尔等人著，NIPS 2021年
[PDF]

扩散视觉反事实解释
奥古斯丁等人著，NIPS 2022年
[PDF]

DiffuseVAE：从低维潜在空间高效、可控且高保真地生成图像
潘迪等人著，TMLR 2022年
[PDF]

用于反事实估计的扩散因果模型
桑切斯等人著，CleaR 2022年
[PDF]

基于变分贝叶斯的关系学习
刘著，ICLR 2022年
[PDF]

使用潜在扩散模型进行高分辨率图像合成
罗姆巴赫等人著，CVPR 2022年
[PDF]

GLIDE：迈向文本引导的扩散模型实现照片级真实感图像生成与编辑
尼科尔等人著，ICML 2022年
[PDF]

用于对抗性净化的扩散模型
聂等人著，ICML 2022年
[PDF]

用于三维点云补全的条件化点扩散—精炼范式
吕等人著，ICLR 2022年
[PDF]

利用扩散模型实现标签高效的语义分割
巴兰丘克等人著，ICLR 2022年
[PDF]

通过微分采样质量来学习扩散模型的快速采样器
沃森等人著，ICLR 2022年
[PDF]

长视频的灵活扩散建模
哈维等人著，NIPS 2022年
[PDF]

ProtoVAE：一种可信的自解释原型变分模型
高塔姆等人著，NIPS 2022年
[PDF]

视觉识别中的因果可迁移性
毛等人著，CVPR 2022年
[PDF]

用于任意条件化的后验匹配
斯特劳斯等人著，NIPS 2022年
[PDF]

关于变分推断与自联想记忆之间关系的研究
安纳比等人著，NIPS 2022年
[PDF]

通过等变性实现鲁棒感知
毛等人著，ICML 2023年
[PDF]

面向对象的槽位扩散
蒋等人著，NeurIPS 2023年
[PDF]

PreDiff：利用潜在扩散模型进行降水临近预报
高等人著，NeurIPS 2023年
[PDF]

用于线性逆问题求解的扩散后验采样：一种滤波视角
窦等人著，ICLR 2024年
[PDF]

直接去噪扩散模型
张等人著，ICML 2024年
[PDF]

通过观测变量分组使因果表征学习具有可识别性
森冈等人著，ICML 2024年
[PDF]

反事实图像编辑
潘等人著，ICML 2024年
[PDF]

概率概念解释器：迈向视觉基础模型的可信概念解释
王等人著，ICML 2024年
[PDF]

扩散模型的反馈引导
库利舍尔等人著，NeurIPS 2025年
[PDF]

PoGDiff：用于不平衡文生图生成的高斯乘积扩散模型
王等人著，NeurIPS 2025年
[PDF]

BDL与控制/规划

嵌入即控制：一种基于原始图像的局部线性潜在动力学模型用于控制
瓦特等人著，NIPS 2015年
[PDF]

深度变分贝叶斯滤波器：从原始数据中无监督学习状态空间模型
卡尔等人著，ICLR 2017年
[PDF]

概率递归状态空间模型
多尔等人著，ICML 2018年
[PDF]

利用概率动力学模型，在少数几次尝试中实现深度强化学习
楚亚等人著，NIPS 2018年
[PDF]

鲁棒的局部线性可控制嵌入
巴尼贾马利等人著，AISTATS 2018年
[PDF]

从像素中学习潜在动力学以进行规划
哈夫纳等人著，ICML 2019年
[PDF]

利用扩散进行规划，实现灵活的行为合成
詹纳等人著，ICML 2022年
[PDF]

一种基于层次贝叶斯的符号奖励机器逆向强化学习方法
周等人著，ICML 2022年
[PDF]

BDL与图数据（链接预测、图神经网络、知识图谱等）

关系深度学习：用于链接预测的深度潜在变量模型
作者：Wang 等，AAAI 2017
[PDF]

Know-Evolve：面向动态知识图谱的深度时序推理
作者：Trivedi 等，ICML 2017
[PDF]

Graphite：图的迭代生成建模
作者：Grover 等，ICML 2019
[PDF]

基于多媒体数据的链接预测关系变分自编码器
作者：Li 等，ACM MM 2017
[PDF]

随机块模型邂逅图神经网络
作者：Mehta 等，ICML 2019
[PDF]

稀疏图的可扩展深度生成建模
作者：Dai 等，ICML 2020
[PDF]

PGM-Explainer：面向图神经网络的概率图模型解释
作者：Vu 等，NIPS 2020
[PDF]

狄利克雷图变分自编码器
作者：Li 等，NIPS 2020
[PDF]

用于知识图谱多跳逻辑推理的 Beta 嵌入
作者：Ren 等，NIPS 2020
[PDF]

GeoDiff：用于分子构象生成的几何扩散模型
作者：Xu 等，ICLR 2022
[PDF]

基于随机微分方程系统的图评分生成建模
作者：Jo 等，ICML 2022
[PDF]

3D 中分子生成的等变扩散
作者：Hoogeboom 等，ICML 2022
[PDF]

LIMO：用于定向分子生成的潜在内生主义
作者：Eckmann 等，ICML 2022
[PDF]

3DLinker：用于分子连接子设计的 E(3) 等变变分自编码器
作者：Huang 等，ICML 2022
[PDF]

晶体扩散变分自编码器用于周期性材料生成
作者：Xie 等，ICLR 2022
[PDF]

OrphicX：受因果启发的潜在变量模型，用于解释图神经网络
作者：Lin 等，CVPR 2022
[PDF]

BDL与主题建模

用于标签推荐的关系堆叠去噪自编码器
作者：Wang 等，AAAI 2015
[PDF]

用于主题建模的可扩展深度泊松因子分析
作者：Gan 等，ICML 2015
[PDF]

具有主题层自适应随机梯度黎曼 MCMC 的深度潜在狄利克雷分配
作者：Cong 等，ICML 2017
[PDF]

主题模型的深度展开
作者：Chien 等，TPAMI 2017
[PDF]

用于科学论文分析的神经关系主题模型
作者：Bai 等，CIKM 2018
[PDF]

用于主题结构学习的狄利克雷信念网络
作者：Zhao 等，NIPS 2018
[PDF]

通过图泊松伽马信念网络进行深度关系主题建模
作者：Wang 等，NIPS 2020
[PDF]

锯齿型因子分解主题嵌入引导的伽马信念网络
作者：Duan 等，ICML 2021
[PDF]

泊松随机化的 DirBN：狄利克雷信念网络需要大突变
作者：Fan 等，ICML 2021
[PDF]

扭转扩散用于分子构象生成
作者：Jing 等，NIPS 2022
[PDF]

知识感知贝叶斯深度主题模型
作者：Wang 等，NIPS 2022
[PDF]

BDL与语音识别/合成

从序列数据中无监督学习解耦且可解释的表征
作者：Hsu 等，NIPS 2017
[PDF]

可扩展的因子化层次变分自编码器训练
作者：Hsu 等，Interspeech 2018
[PDF]

用于可控语音合成的层次生成建模
作者：Hsu 等，ICLR 2019
[PDF]

用于语音识别的循环泊松过程单元
作者：Huang 等，AAAI 2019
[PDF]

基于关系思维的语音识别深度图随机过程
作者：Huang 等，ICML 2020
[PDF]

DiffWave：用于音频合成的多功能扩散模型
作者：Kong 等，ICLR 2021
[PDF]

WaveGrad：估计波形生成的梯度
作者：Chen 等，ICLR 2021
[PDF]

Grad-TTS：用于文本到语音的扩散概率模型
作者：Popov 等，ICML 2021
[PDF]

STRODE：随机边界常微分方程
作者：Huang 等，ICML 2021
[PDF]

Guided-TTS：通过分类器引导的文本到语音扩散模型
作者：Kim 等，ICML 2022
[PDF]

基于扩散的语音转换，采用快速最大似然采样方案
作者：Popov 等，ICLR 2022
[PDF]

BDDM：双边去噪扩散模型，用于快速高质量的语音合成
作者：Lam 等，ICLR 2022
[PDF]

跨模态序列数据中的无监督错位定位及其在发音错误定位中的应用
作者：Wei 等，TMLR 2022
[PDF]

BDL与预测（时间序列分析）

DeepAR：基于自回归循环网络的概率预测
萨利纳斯等，2017年
[PDF]

用于时间序列预测的深度状态空间模型
兰加普拉姆等，NIPS 2018
[PDF]

用于预测的深度因子
王等，ICML 2019
[PDF]

基于样条分位数函数RNN的概率预测
加斯特豪斯等，AISTATS 2019
[PDF]

对概率自回归预测模型的对抗攻击
当-如等，ICML 2020
[PDF]

神经跳跃随机微分方程
贾等，NIPS 2019
[PDF]

利用潜在ODE对混合轨迹进行分割
施等，ICML 2021
[PDF]

用于概率时空预测的粒子流RNN
帕尔等，ICML 2021
[PDF]

面向层次化时间序列的一致性概率预测的端到端学习
兰加普拉姆等，ICML 2021
[PDF]

用于多变量概率时间序列预测的自回归去噪扩散模型
拉苏尔等，ICML 2021
[PDF]

用于时间序列的深度显式持续时间切换模型
安萨里等，NIPS 2021
[PDF]

用于多变量概率时间序列预测的自回归去噪扩散模型
拉苏尔等，ICML 2021
[PDF]

CSDI：用于概率时间序列插补的条件得分驱动扩散模型
田代等，NIPS 2021
[PDF]

TACTiS：面向时间序列的Transformer注意力耦合模型
德鲁安等，ICML 2022
[PDF]

从多模态时间序列中重建非线性动力系统
克莱默等，ICML 2022
[PDF]

用于多变量时间序列异常检测的深度变分图卷积循环网络
陈等，ICML 2022
[PDF]

基于双向先验模型的向量量化时间序列生成
李等，AISTATS 2023
[PDF]

通过反事实解释实现自我可解释的时间序列预测
严等，ICML 2023
[PDF] [参见BDL与医疗健康]

CauDiTS：多变量时间序列的因果解耦领域适应
陆等，ICML 2024
[PDF]

BDL与分布式/联邦学习

随机期望传播
李等，NIPS 2015
[PDF]

BDL与AI4Science

狄利克雷流匹配及其在DNA序列设计中的应用
斯塔克等，ICML 2024
[PDF]

粒子引导：使用扩散模型进行非独立同分布的多样化采样
科尔索等，ICLR 2024
[PDF]

用于复杂系统测试时自适应预测的稀疏扩散自编码器
程等，NeurIPS 2025
[PDF]

BDL与持续/终身学习

基于深度生成重放的持续学习
申等，NIPS 2017
[PDF]

持续无监督表征学习
饶等，NIPS 2019
[PDF]

跨域潜在同源性的终身解耦表征学习
阿基勒等，NIPS 2018
[PDF]

利用终身VAEGAN在多个数据域间学习潜在表征
叶等，ECCV 2020
[PDF]

用于无任务持续学习的神经狄利克雷过程混合模型
李等，ICLR 2020
[PDF]

BDL作为一种框架（杂项）

迈向贝叶斯深度学习：一个框架及若干现有方法
王等，TKDE 2016
[PDF]

将图模型与神经网络结合以实现结构化表示和快速推理
约翰逊等，NIPS 2016
[PDF]

基于能量的概念瓶颈模型：统一预测、概念干预与概率解释
许等，ICLR 2024
[PDF]

贝叶斯/概率神经网络作为BDL的构建模块

学习随机前馈网络
作者：Neal等，1990年技术报告
[PDF]

反向传播网络的实用贝叶斯框架
作者：MacKay等，1992年《神经计算》杂志
[PDF]

通过最小化权重的描述长度来保持神经网络简洁
作者：Hinton等，1993年COLT会议
[PDF]

基于随机梯度朗之万动力学的贝叶斯学习
作者：Welling等，2011年ICML会议
[PDF]

神经网络的实用变分推断
作者：Alex Graves，2011年NIPS会议
[PDF]

变分自编码器
作者：Kingma等，2014年ArXiv预印本
[PDF] [代码]

深度指数族
作者：Ranganath等，2015年AISTATS会议
[PDF]

神经网络中的权重不确定性
作者：Blundell等，2015年ICML会议
[PDF]

用于可扩展贝叶斯神经网络学习的概率反向传播
作者：Hernandez-Lobato等，2015年ICML会议
[PDF]

变分丢弃与局部重参数化技巧
作者：Kingma等，2015年NIPS会议
[PDF]

泊松伽玛信念网络
作者：Zhou等，2015年NIPS会议
[PDF]

深度泊松因子建模
作者：Henao等，2015年NIPS会议
[PDF]

自然参数网络：一类概率神经网络
作者：Wang等，2016年NIPS会议
[PDF] [项目页面] [代码]

对抗性变分贝叶斯：统一变分自编码器和生成对抗网络
作者：Mescheder等，2017年ICML会议
[PDF]

棒状断裂变分自编码器
作者：Nalisnick等，2017年ICLR会议
[PDF]

贝叶斯GAN
作者：Saatchi等，2017年NIPS会议
[PDF]

神经期望最大化
作者：Greff等，2017年NIPS会议
[PDF]

轻量级概率深度网络
作者：Gast等，2018年CVPR会议
[PDF]

具有分类层和最大池化层的概率神经网络中的前向传播
作者：Shekhovtsov等，2018年ICLR会议
[PDF]

Glow：带有可逆1×1卷积的生成流
作者：Kingma等，2018年NIPS会议
[PDF]

证据深度学习用于量化分类不确定性
作者：Sensoy等，2018年NIPS会议
[PDF]

ProbGAN：迈向具有理论保证的概率GAN
作者：He等，2019年ICLR会议
[PDF] [项目页面]

使用近似方差传播进行无采样认知不确定性估计
作者：Postels等，2019年ICCV会议
[PDF]

基于秩1因子的高效可扩展贝叶斯神经网络
作者：Dusenberry等，2020年ICML会议
[PDF]

神经聚类过程
作者：Pakman等，2020年ICML会议
[PDF]

即使只是稍微采用贝叶斯方法，也能解决ReLU网络中的过度自信问题
作者：Kristiadi等，2020年ICML会议
[PDF]

深度神经网络中的激活级不确定性
作者：Morales-Alvarez等，2021年ICLR会议
[PDF]

通过子网络推断进行贝叶斯深度学习
作者：Daxberger等，2021年ICML会议
[PDF]

关于使用概率神经网络进行异方差不确定性估计的陷阱
作者：Seitzer等，2022年ICLR会议
[PDF]

证据图灵过程
作者：Kandemir等，2022年ICLR会议
[PDF]

温度调节如何修复贝叶斯神经网络中的数据增强问题
作者：Bachmann等，2022年ICML会议
[PDF]

SIMPLE：用于k-子集采样的梯度估计器
作者：Ahmed等，2023年ICLR会议
[PDF]

贝叶斯深度学习的折叠推断
作者：Zeng等，2023年NeurIPS会议
[PDF]

变分不平衡回归：通过概率平滑实现公平的不确定性量化
作者：Wang等，2023年NeurIPS会议
[PDF]

BLoB：大型语言模型的反向传播式贝叶斯低秩适配
作者：Wang等，2024年NeurIPS会议
[PDF]

面向概率程序贝叶斯推断的模型引导流
作者：Ko等，2025年NeurIPS会议
[PDF]

大型语言模型低秩适配器的免训练贝叶斯化
作者：Shi等，2025年NeurIPS会议
[PDF]

BayesianDeepLearning-Survey 快速上手指南

工具简介： BayesianDeepLearning-Survey 并非一个可直接安装运行的软件库，而是一个持续更新的贝叶斯深度学习（BDL）学术资源汇总仓库。它整理了该领域的基础综述论文、核心算法代码实现、数据集以及按应用场景（如推荐系统、医疗、NLP、计算机视觉等）分类的最新研究文献。本指南将指导开发者如何高效利用该仓库获取学习资源和代码实现。

环境准备

由于本仓库主要包含文献链接和指向不同子项目的代码仓库链接，因此没有统一的系统要求或前置依赖。具体的环境配置取决于你选择研究的特定子课题（例如运行 CDL 推荐系统代码或 BDL 医疗模型）。

通用建议配置：

操作系统：Linux (Ubuntu/CentOS), macOS, 或 Windows (WSL2 推荐)
基础工具：
- git: 用于克隆仓库
- python: 3.7+ (大多数现代深度学习项目要求)
- pip 或 conda: Python 包管理工具
深度学习框架：根据具体子项目需求安装，通常包括：
- PyTorch
- TensorFlow / Keras
- MXNet (部分早期项目如 CDL 使用)

安装步骤

本仓库本身无需“安装”，只需克隆到本地即可浏览目录结构和文档。若需运行具体算法，请根据下文指引跳转到对应的子项目仓库。

1. 克隆主仓库

获取最新的综述列表和资源索引：

git clone https://github.com/js05212/BayesianDeepLearning-Survey.git
cd BayesianDeepLearning-Survey

2. 获取具体项目代码

仓库 README 中列出的每个研究论文都附带了代码链接（标记为 [[Code]]）。请以经典的 Collaborative Deep Learning (CDL) 为例，获取其实现代码：

# 示例：克隆 CDL 项目的 PyTorch/TensorFlow 实现
git clone https://github.com/js05212/CollaborativeDeepLearning-TensorFlow.git
# 或者 MXNet 版本
git clone https://github.com/js05212/MXNet-for-CDL.git

3. 安装子项目依赖

进入具体的子项目目录后，按照该项目自带的 README.md 或 requirements.txt 安装依赖。

# 以 TensorFlow 版 CDL 为例
cd CollaborativeDeepLearning-TensorFlow
pip install -r requirements.txt

提示：国内开发者如遇下载依赖慢，可使用清华源或阿里源加速：
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

基本使用

本仓库的核心用法是按需检索和复现研究。

场景一：查找特定领域的综述与论文

如果你需要查找“贝叶斯深度学习在推荐系统中的应用”相关论文：

打开本地克隆的 README.md 文件，或直接访问 GitHub 页面。
定位到 BDL and Recommender Systems 章节。
点击感兴趣的论文标题（如 Collaborative Variational Autoencoder for Recommender Systems）查看 PDF。
点击旁边的 [[Code]] 链接跳转至代码仓库进行复现。

场景二：运行一个经典示例 (以 CDL 为例)

假设你已克隆了 MXNet-for-CDL 项目并安装了依赖，以下是运行演示的基本流程：

准备数据：该项目通常需要 CiteULike 数据集。参考项目说明下载数据并放入指定目录（如 data/）。

# 示例：下载数据集 A (需在浏览器手动下载或通过脚本)
# 链接通常在子项目 README 中提供，如: https://github.com/js05212/citeulike-a

运行训练脚本：进入项目目录，执行提供的 Jupyter Notebook 或 Python 脚本。

# 如果使用 Jupyter Notebook 进行交互式学习
jupyter notebook collaborative-dl.ipynb

# 或者直接运行训练脚本 (具体命令视子项目而定)
python main.py --dataset citeulike-a

查看结果：程序运行结束后，终端将输出评估指标（如 Recall@K, NDCG@K），并在本地生成模型检查点或可视化图表。

场景三：追踪最新进展

该仓库是动态更新的。要获取最新加入的论文（如 2024-2025 年的最新研究）：

cd BayesianDeepLearning-Survey
git pull origin master

然后重新查阅 README.md 中各分类下的最新条目，特别是 BDL and NLP 或 BDL as a Framework 等活跃板块。

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

★ 349.3k|★★★☆☆|1周前

Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|2周前

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 160.4k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 109.2k|★★☆☆☆|昨天

开发框架图像Agent

gemini-cli

gemini-cli 是一款由谷歌推出的开源 AI 命令行工具，它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言，它提供了一条从输入提示词到获取模型响应的最短路径，无需切换窗口即可享受智能辅助。这款工具主要解决了开发过程中频繁上下文切换的痛点，让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用，还是执行复杂的 Git 操作，gemini-cli 都能通过自然语言指令高效处理。它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口，具备出色的逻辑推理能力；内置 Google 搜索、文件操作及 Shell 命令执行等实用工具；更独特的是，它支持 MCP（模型上下文协议），允许用户灵活扩展自定义集成，连接如图像生成等外部能力。此外，个人谷歌账号即可享受免费的额度支持，且项目基于 Apache 2.0 协议完全开源，是提升终端工作效率的理想助手。

★ 100.8k|★★☆☆☆|1周前

插件Agent图像

markitdown

MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器

★ 93.4k|★★☆☆☆|1周前

插件开发框架