Awesome-Diffusion-Models

12.3k 1k 非常简单 1 次阅读今天MIT开发框架图像

AI 解读由 AI 自动生成，仅供参考

Awesome-Diffusion-Models 是一个专注于扩散模型（Diffusion Models）的开源资源合集，旨在为社区提供一站式的学习与研究入口。随着扩散模型在图像生成、音频处理等领域展现出超越传统 GAN 的潜力，相关论文与技术资料爆发式增长，导致初学者和研究者难以高效筛选核心内容。该项目通过系统化的分类整理，解决了信息过载与检索困难的问题。

资源库涵盖了从基础理论到前沿应用的全方位内容，包括入门博客、数学推导教程、可运行的 Jupyter Notebook 代码，以及按视觉、音频、自然语言、表格数据等维度细分的海量学术论文索引。无论是想要从零开始理解扩散原理的开发者，还是追踪最新科研进展的研究人员，都能在此快速找到所需资料。其独特的亮点在于不仅罗列论文，更提供了由浅入深的学习路径和实用的代码示例，极大地降低了这一复杂技术的门槛。如果你正致力于生成式 AI 的开发或研究，Awesome-Diffusion-Models 将是不可或缺的导航指南。

使用场景

某医疗 AI 初创公司的算法团队正致力于利用扩散模型提升肺部 CT 影像的超分辨率重建效果，以辅助医生更早发现微小结节。

没有 Awesome-Diffusion-Models 时

文献检索如大海捞针：团队成员需在 arXiv、Google Scholar 等多个平台反复搜索，难以区分哪些是针对医学影像的专用扩散模型，哪些仅是通用理论。
入门门槛极高：面对复杂的数学推导，新手缺乏系统性的教程和带注释的代码笔记，往往花费数周才能复现基础模型。
技术选型盲目：由于缺乏对“逆问题求解”或“分割”等细分领域的综述整理，团队容易选错基线模型，导致实验方向偏差。
资源分散且过时：优质的博客解读、视频讲座和 Jupyter Notebook 散落在各处，难以确认最新进展，沟通成本巨大。

使用 Awesome-Diffusion-Models 后

精准定位垂直资源：团队直接通过"Medical Imaging"和"Inverse Problems"分类，快速锁定了多篇针对 CT 重建的核心论文与开源代码。
加速理解与复现：利用"Introductory Posts"和"Tutorial"栏目中带有详细数学推导和 Colab 实战笔记的资源，新人三天内即可跑通基准模型。
科学决策技术路线：参考"Survey"综述部分，团队清晰对比了不同架构在医学数据上的表现，迅速确定了最优改进方案。
一站式获取全栈资料：从理论视频到多模态应用案例，所有关键资源集中呈现，确保团队始终紧跟前沿，大幅缩短研发周期。

Awesome-Diffusion-Models 将原本需要数周的碎片化调研工作压缩至几天，让研发团队能专注于核心算法创新而非信息搜集。

运行环境要求

GPU

未说明

内存

未说明

依赖

notes该仓库（Awesome-Diffusion-Models）是一个关于扩散模型的资源、论文和教程的精选列表，本身不是一个可独立运行的软件工具或代码库，因此 README 中未包含具体的操作系统、硬件配置、Python 版本或依赖库安装要求。用户需根据列表中链接的具体子项目（如 DiffusionFastForward, Stable Diffusion 等）的各自文档来确认运行环境需求。部分列出的教程提供了 Google Colab 笔记本，可在云端免费使用 GPU 运行。

python未说明

快速开始

本仓库收录了关于扩散模型的资源与论文合集。

由于页面限制，本页面可能无法包含所有信息，请参阅此页面以获取完整内容。

资源
论文
- 综述
- 视觉
  - 生成
  - 分类
  - 分割
  - 图像转换
  - 逆问题
  - 医学影像
  - 多模态学习
  - 3D视觉
  - 对抗攻击
  - 其他
- 音频
  - 生成
  - 转换
  - 增强
  - 分离
  - 文本到语音
  - 其他
- 自然语言
- 表格与时间序列
  - 生成
  - 预测
  - 插补
  - 其他
- 图
  - 生成
  - 分子与材料生成
- 强化学习
- 理论
- 应用

资源

入门文章

:fast_forward: DiffusionFastForward: 01-扩散理论
米科瓦伊·切尔卡夫斯基 (@mikonvergence)
[网站]
2023年2月4日

扩散模型的工作原理：从头开始的数学推导
塞尔吉奥斯·卡拉扬纳科斯、尼科拉斯·阿达洛格鲁
[网站]
2022年9月24日

通往变分扩散损失之路
亚历克斯·阿莱米
[网站] [Colab]
2022年9月15日

注释版扩散模型
尼尔斯·罗格、卡希夫·拉苏尔
[网站]
2022年6月6日

基于扩散的模型的兴起
马切伊·多马加拉
[网站]
2022年6月6日

机器学习中的扩散模型简介
瑞安·奥康纳
[网站]
2022年5月12日

改进扩散模型作为GAN的替代方案
阿拉什·瓦赫达特和卡斯滕·克赖斯
[网站-第一部分] [网站-第二部分]
2022年4月26日

扩散概率模型简介
阿扬·达斯
[网站]
2021年12月4日

深度生成建模导论：基于扩散的深度生成模型
雅库布·托姆恰克
[网站]
2021年8月30日

什么是扩散模型？
莉莲·温格
[网站]
2021年7月11日

扩散模型作为一种VAE
安格斯·特纳
[网站]
2021年6月29日

通过估计数据分布的梯度进行生成建模
杨松
[网站]
2021年5月5日

入门论文

理解扩散模型：统一视角
卡尔文·卢
arXiv 2022. [论文]
2022年8月25日

如何训练你的基于能量的模型
杨松、迪德里克·P·金玛
arXiv 2022. [论文]
2021年1月9日

入门视频

:fast_forward: DiffusionFastForward
米科瓦伊·切尔卡夫斯基 (@mikonvergence)
[视频]
2023年3月4日

用PyTorch从零开始实现扩散模型
DeepFindr
[视频]
2022年7月18日

扩散模型 | 论文解读 | 数学详解
Outlier
[视频]
2022年6月6日

什么是扩散模型？
阿里·塞夫
[视频]
2022年4月20日

扩散模型解析
AI Coffee Break with Letitia
[视频]
2022年3月23日

入门讲座

去噪扩散生成建模：基础与应用
卡斯滕·克赖斯、高睿琪、阿拉什·瓦赫达特
[页面]
2022年6月19日

扩散概率模型
贾莎·索尔-迪克斯坦，MIT 6.S192 - 第22讲
[视频]
2022年4月19日

教程和 Jupyter Notebook

:fast_forward: DiffusionFastForward：在 Colab 中从头开始训练
米科瓦伊·切尔卡夫斯基 (@mikonvergence)
[GitHub] [笔记本]

diffusion-for-beginners
ozanciga
[GitHub]

超越扩散模型：什么是个性化图像生成？如何自定义图像合成？
J. 拉菲德·西迪基
[GitHub] [Medium]

Diffusion_models_tutorial
FilippoMB
[GitHub]

ScoreDiffusionModel
JeongJiHeon
[GitHub]

扩散模型的极简实现
VSehwag
[GitHub]

diffusion_tutorial
sunlin-ai
[GitHub]

去噪扩散概率模型
acids-ircam
[GitHub]

Centipede Diffusion
Zalring
[笔记本]

Deforum Stable Diffusion
deforum
[笔记本]

Stable Diffusion 插值
无
[笔记本]

Keras Stable Diffusion：GPU 入门示例
无
[笔记本]

Huemin Jax Diffusion
huemin-art
[笔记本]

Disco Diffusion
alembics
[笔记本]

简化版 Disco Diffusion
entmike
[笔记本]

WAS 的 Disco Diffusion - 人像生成器游乐场
WASasquatch
[笔记本]

Diffusers - Hugging Face
huggingface
[笔记本]

论文

调查

视频扩散模型综述
邢震、冯启俊、陈浩然、戴琪、胡汉、徐航、吴祖轩和蒋宇刚 arXiv 2023. [论文]
2023年10月16日

视觉计算中扩散模型的最新进展
Ryan Po、王一凡、Vladislav Golyanik、Kfir Aberman、Jonathan T. Barron、Amit H. Bermano、Eric Ryan Chan、Tali Dekel、Aleksander Holynski、Angjoo Kanazawa、C. Karen Liu、Lingjie Liu、Ben Mildenhall、Matthias Nießner、Björn Ommer、Christian Theobalt、Peter Wonka、Gordon Wetzstein
arXiv 2023. [论文]
2023年10月11日

记忆尽在眼前：扩散模型与联想记忆之间的惊人相似性综述
Benjamin Hoover、Hendrik Strobelt、Dmitry Krotov、Judy Hoffman、Zsolt Kira、Duen Horng Chau
arXiv 2023. [论文]
2023年9月28日

基于扩散的图像生成模型综述：问题及其解决方案
张天义、王铮、黄静、Mohiuddin Muhammad Tasnim、史伟
arXiv 2023. [论文]
2023年8月25日

用于图像修复与增强的扩散模型——全面综述
李欣、任玉林、金鑫、兰翠玲、王兴锐、曾文俊、王新超、陈志博
arXiv 2023. [论文]
2023年8月18日

结构化数据生成式扩散模型综合综述
Heejoon Koo、To Eun Kim
arXiv 2023. [论文]
2023年6月7日

扩散模型的设计基础：综述
常子怡、George A. Koulieris、Hubert P. H. Shum
arXiv 2023. [论文]
2023年6月7日

NLP中的扩散模型：综述
郝邹、金在明、姜东烨
arXiv 2023. [论文]
2023年5月24日

时间序列应用中的扩散模型：综述
林乐泉、李正坤、李瑞坤、李旭亮、高俊斌
arXiv 2023. [论文]
2023年5月1日

扩散模型知识蒸馏综合综述
罗伟健
arXiv 2023. [论文]
2023年4月9日

图扩散模型综述：科学领域中的生成式AI——分子、蛋白质与材料
张梦春、Maryam Qamar、姜泰九、郑宥娜、张晨爽、裴成浩、张朝宁
arXiv 2023. [论文]
2023年4月4日

用于语音合成的音频扩散模型：生成式AI中的文本到语音与语音增强综述
张晨爽、张朝宁、郑晟、张梦春、Maryam Qamar、裴成浩、权仁洙
arXiv 2023. [论文]
2023年3月23日

NLP中的扩散模型：综述
朱元松、赵宇
arXiv 2023. [论文]
2023年3月14日

生成式AI中的文本到图像扩散模型：综述
张晨爽、张朝宁、张梦春、权仁洙
arXiv 2023. [论文]
2023年3月14日

用于非自回归文本生成的扩散模型：综述
李一凡、周坤、韦恩·辛·赵、温继荣
arXiv 2023. [论文]
2023年3月12日

生物信息学中的扩散模型：深度学习革命的新浪潮正在上演
郭志业、刘健、王艳丽、陈孟睿、王多林、徐东、程建林
arXiv 2023. [论文]
2023年2月13日

图上的生成式扩散模型：方法与应用
范文奇、刘承毅、刘云清、李家通、李航、刘辉、唐继良、李青
arXiv 2023. [论文]
2023年2月6日

医学图像分析中的扩散模型：全面综述
Amirhossein Kazerouni、Ehsan Khodapanah Aghdam、Moein Heidari、Reza Azad、Mohsen Fayyaz、Ilker Hacihaliloglu、Dorit Merhof
arXiv 2022. [论文] [GitHub]
2022年11月14日

面向视觉任务的高效扩散模型：综述
Anwaar Ulhaq、Naveed Akhtar、Ganna Pogrebna
arXiv 2022. [论文]
2022年10月7日

视觉领域的扩散模型：综述
Florinel-Alin Croitoru、Vlad Hondru、Radu Tudor Ionescu、穆巴拉克·沙赫
arXiv 2022. [论文]
2022年9月10日

生成式扩散模型综述
曹汉群、谭诚、高章阳、陈广勇、彭安恒、Stan Z. Li
arXiv 2022. [论文]
2022年9月6日

扩散模型：方法与应用的全面综述
杨玲、张志龙、洪善达、张文涛
arXiv 2022. [论文]
2022年9月2日

视觉

生成

DiffEnc：带有学习编码器的变分扩散模型
Beatrix M. G. Nielsen、Anders Christensen、Andrea Dittadi、Ole Winther
arXiv 2023. [论文]
2023年10月30日

利用扩散模型提供的无限数据计划升级VAE训练
Tim Z. Xiao、Johannes Zenn、Robert Bamler
arXiv 2023. [论文]
2023年10月30日

成功将彩票假设应用于扩散模型
江超、惠波、刘博文、严达
arXiv 2023. [论文]
2023年10月28日

无噪声分数蒸馏
Oren Katzir、Or Patashnik、Daniel Cohen-Or、Dani Lischinski
arXiv 2023. [论文]
2023年10月26日

生成式扩散模型的统计热力学
Luca Ambrogioni
arXiv 2023. [论文]
2023年10月26日

通过同时估计图像和噪声来改进去噪扩散模型
张振凯、Krista A. Ehinger、汤姆·德拉蒙德
arXiv 2023. [论文]
2023年10月26日

层次化半隐式变分推断及其在加速扩散模型中的应用
于龙林、谢天宇、朱宇、杨彤、张向宇、张成
arXiv 2023. [论文] [GitHub]
2023年10月26日

RePoseDM：用于姿态引导图像合成的递归姿态对齐与梯度引导
Anant Khandelwal
arXiv 2023. [论文]
2023年10月24日

一致性模型训练技术的改进
宋扬、普拉富拉·达里瓦尔
arXiv 2023. [论文]
2023年10月22日

ScaleLong：通过扩展网络长跳跃连接实现更稳定的扩散模型训练
黄中展、周攀、严水成、林亮
NeurIPS 2023. [论文] [GitHub]
2023年10月20日

粒子引导：利用扩散模型进行非独立同分布的多样化采样
加布里埃莱·科尔索、许一伦、瓦伦丁·德·博尔托利、雷吉娜·巴尔齐莱、汤米·雅科拉
arXiv 2023. [论文] [GitHub]
2023年10月19日

闭式解扩散模型
克里斯托弗·斯卡维利斯、海茨·萨埃斯·德·奥卡里斯·博尔德、贾斯汀·所罗门
arXiv 2023. [论文]
2023年10月19日

阐明分类器引导扩散生成的设计空间
马佳俊、胡天阳、王文嘉、孙家诚
arXiv 2023. [论文] [GitHub]
2023年10月17日

BayesDiff：通过贝叶斯推断估计扩散过程中的像素级不确定性
寇思琪、甘磊、王德权、李崇轩、邓志杰
arXiv 2023. [论文]
2023年10月17日

无监督发现预训练扩散模型h空间中的可解释方向
张子健、刘鲁平、林志杰、朱一晨、赵舟
arXiv 2023. [论文]
2023年10月15日

借助时间步对齐器实现更精确的扩散模型加速
夏梦飞、沈宇君、雷昌松、周宇、易然、赵德丽、王文平、刘永进
arXiv 2023. [论文]
2023年10月14日

利用扩散模型进行未见图像合成
朱晔、吴宇、邓志伟、奥尔加·鲁萨科夫斯基、颜燕
arXiv 2023. [论文]
2023年10月13日

去偏训练扩散模型
于虎、沈力、黄杰、周曼、李洪生、赵峰
arXiv 2023. [论文]
2023年10月12日

神经扩散模型
格里戈里·巴托什、德米特里·韦特罗夫、克里斯蒂安·A·奈塞斯
arXiv 2023. [论文]
2023年10月12日

扩散生成模型的高效积分器
库沙格拉·潘迪、玛雅·鲁道夫、施特凡·曼特
arXiv 2023. [论文]
2023年10月11日

为高效、可重构且分辨率可变的扩散建模学习可堆叠、可跳过的乐高积木
郑煌杰、王振东、袁建波、宁广汉、何鹏程、游全增、杨红霞、周明远
arXiv 2023. [论文]
2023年10月10日

语言模型击败扩散模型——分词器是视觉生成的关键
于立军、何塞·莱萨马、尼特什·B·贡达瓦鲁普、卢卡·维尔萨里、苏基赫·孙、大卫·米嫩、程勇、阿格里姆·古普塔、顾雪野、亚历山大·G·豪普特曼、龚博清、杨明轩、伊尔凡·埃萨、戴维·A·罗斯、江璐
arXiv 2023. [论文] [GitHub]
2023年10月9日

扩散模型中可重复性和一致性的涌现
张慧杰、周金帆、陆义夫、郭敏哲、申丽悦、瞿青
arXiv 2023. [论文]
2023年10月8日

DiffNAS：通过提示更好的架构来自举扩散模型
李文浩、苏秀、尤珊、王飞、钱晨、徐畅
arXiv 2023. [论文]
2023年10月7日

观测引导的扩散概率模型
姜俊昊、崔珍英、崔成益、韩宝亨
arXiv 2023. [论文]
2023年10月6日

潜在一致性模型：以少步推理合成高分辨率图像
罗思勉、谭怡琴、黄龙波、李健、赵航
arXiv 2023. [论文]
2023年10月6日

去噪扩散步骤感知模型
杨帅、陈宇康、王洛州、刘舒、陈迎聪
arXiv 2023. [论文]
2023年10月5日

EfficientDM：低比特扩散模型的高效量化感知微调
何业飞、刘静、吴伟佳、周宏、庄博文
arXiv 2023. [论文]
2023年10月5日

利用扩散摊销MCMC学习基于能量的先验模型
余培宇、朱亚轩、谢思睿、马晓健、高瑞琪、朱松纯、吴颖年
NeurIPS 2023. [论文] [GitHub]
2023年10月5日

关于扩散模型中的记忆现象
顾翔明、杜超、庞天宇、李崇轩、林敏、王烨
arXiv 2023. [论文] [GitHub]
2023年10月4日

基于分组扩散过程的序列数据生成
李尚允、李佳莹、金贤洙、金俊浩、禹英贞
arXiv 2023. [论文]
2023年10月2日

一致性轨迹模型：学习扩散的概率流ODE轨迹
金东俊、赖介欣、廖伟祥、村田直树、泷田雄太、上坂俊光、何宇彤、三藤幸纪、斯特凡诺·埃尔蒙
arXiv 2023. [论文]
2023年10月1日

通过融合生成与分割完成视觉对象
李翔、陈银鹏、林忠清、丽塔·辛格、比克莎·拉杰、刘子成
arXiv 2023. [论文]
2023年10月1日

利用对比自监督和潜在扩散从脑活动解码真实图像
孙景元、李明晓、玛丽-弗朗辛·莫恩斯
arXiv 2023. [论文]
2023年9月30日

FashionFlow：利用扩散模型从静态图像动态合成时尚视频
塔辛·伊斯兰、阿丽娜·米隆、刘晓辉、李永民
arXiv 2023. [论文]
2023年9月29日

去噪扩散桥模型
周林奇、路亚伦、萨玛尔·汗纳、斯特凡诺·埃尔蒙
arXiv 2023. [论文]
2023年9月29日

DeeDiff：动态不确定性感知的早期退出策略，用于加速扩散模型生成
唐圣坤、王雅晴、丁才文、梁毅、李耀、徐东宽
arXiv 2023. [论文]
2023年9月29日

将扩散模型的ODE求解器提炼为更小的时间步
金相焕、唐浩、费舍尔·俞
arXiv 2023. [论文]
2023年9月28日

用于无监督图像生成和分割的因子化扩散架构
袁鑫、迈克尔·梅尔
arXiv 2023. [论文]
2023年9月27日

生成式埃舍尔网格
诺姆·艾格曼，蒂博·格鲁埃
arXiv 2023. [论文]
2023年9月25日

软混合去噪：超越扩散模型的表达瓶颈
李阳明，鲍里斯·范布雷格尔，米哈埃拉·范德沙尔
arXiv 2023. [论文]
2023年9月25日

GLOBER：基于全局引导视频解码器的一致性非自回归视频生成
孙明振，王伟宁，秦子涵，孙嘉辉，陈思涵，刘静
arXiv 2023. [论文] [GitHub]
2023年9月23日

生成模型中的分数失配
叶森茂，刘飞
arXiv 2023. [论文]
2023年9月20日

广义概率扩散尺度空间
帕斯卡尔·彼得
arXiv 2023. [论文]
2023年9月15日

生成式图像动力学
李正奇，理查德·塔克，诺亚·斯纳维利，亚历山大·霍林斯基
arXiv 2023. [论文] [项目]
2023年9月14日

Beta扩散
周明远，陈天琪，王振东，郑黄杰
NeurIPS 2023. [论文]
2023年9月14日

适应与扩散：基于潜在扩散模型的样本自适应重建
扎兰·法比安，伯克·蒂纳兹，马赫迪·索尔坦奥尔科塔比
arXiv 2023. [论文]
2023年9月12日

阐明扩散模型扩展反向时间随机微分方程的解空间
崔钦鹏，张欣怡，陆宗庆，廖清敏
arXiv 2023. [论文]
2023年9月12日

通过合作扩散恢复似然学习能量模型
朱雅轩，谢建文，吴英年，高瑞琪
arXiv 2023. [论文]
2023年9月10日

中继扩散：统一跨分辨率的扩散过程用于图像合成
滕佳燕，郑文迪，丁明，洪文义，王妮娇，杨卓毅，唐杰
arXiv 2023. [论文]
2023年9月4日

用于图像合成的梯度域扩散模型
龚元浩
arXiv 2023. [论文]
2023年9月5日

用于视频外扩的层次化掩码3D扩散模型
范达，郭超旭，龚立通，王彪，葛铁铮，蒋宇宁，罗春杰，詹建峰
arXiv 2023. [论文] [GitHub]
2023年9月5日

具有确定性归一化流先验的扩散模型
莫森·赞德，阿里·埃特马德，迈克尔·格林斯潘
arXiv 2023. [论文] [GitHub]
2023年9月3日

扩散惯性姿势器：从任意稀疏IMU配置中重建人体运动
汤姆·范沃韦，李承焕，安托万·法利斯，斯科特·德尔普，C·卡伦·刘
AAAI 2024. [论文]
2023年8月31日

通过神经符号约束对基于分数的生成模型进行条件化
达维德·斯卡索拉，塞巴斯蒂亚诺·萨卡尼，吉内夫拉·卡博内，卢卡·博尔托鲁西
arXiv 2023. [论文]
2023年8月31日

阐明扩散模型中的曝光偏差
孟宁，李明晓，苏建林，阿尔伯特·阿里·萨拉赫，伊蒂尔·奥纳尔·埃尔图格鲁尔
arXiv 2023. [论文]
2023年8月29日

残差去噪扩散模型
刘家伟，王强，范慧洁，王银农，唐延东，屈良琼
arXiv 2023. [论文] [GitHub]
2023年8月25日

通过对抗噪声实现扩散模型中的高效迁移学习
王希宇，林百炯，刘道昌，许畅
arXiv 2023. [论文]
2023年8月23日

利用自适应动量采样器提升扩散模型性能
王希宇，邓英勇，刘道昌，许畅
arXiv 2023. [论文]
2023年8月23日

Make-It-4D：从单张图像合成一致的长期动态场景视频
沈辽，李兴义，孙惠强，彭珏雯，冼可，曹志国，林国生
ACM MM 2023. [论文]
2023年8月20日

脉冲扩散：结合脉冲神经网络的向量量化离散扩散模型
刘明轩，温睿，陈宏
arXiv 2023. [论文]
2023年8月20日

SciRE-Solver：基于递归导数估计的分数积分求解器，用于高效采样扩散概率模型
李世贵，陈伟，曾德禄
arXiv 2023. [论文]
2023年8月15日

改进的指数积分器阶数分析与设计，用于扩散模型采样
张秦胜，宋嘉明，陈永鑫
arXiv 2023. [论文]
2023年8月4日

用于高分辨率图像合成的分块去噪扩散模型
丁征，张梦琪，吴嘉俊，涂卓文
arXiv 2023. [论文]
2023年8月2日

用于去噪扩散概率模型的空间-频率U型网络
袁欣，李林杰，王建峰，杨正源，林凯文，刘子诚，王丽娟
arXiv 2023. [论文]
2023年7月27日

使用扩散—生成对抗网络合成蜡染图案
欧内·奥克塔迪昂，诺万托·尤迪斯提拉，迪瓦·库尔尼亚宁蒂亚斯
arXiv 2023. [论文]
2023年7月22日

DPM-OT：一种基于最优传输的新扩散概率模型
李泽增，李盛豪，王展鹏，雷娜，罗钟轩，顾显峰
arXiv 2023. [论文] [GitHub]
2023年7月21日

带有动量的扩散采样以缓解发散伪影
苏提萨克·维扎德翁萨，沃拉梅特·钦楚塔坤，普拉穆克·孔古恩，阿米特·拉杰，苏帕索恩·苏瓦贾纳科恩
arXiv 2023. [论文]
2023年7月20日

潜在空间中的流匹配
段权，冯浩，阮平，陈英
arXiv 2023. [论文] [项目]
2023年7月17日

流形引导的扩散模型采样，用于无偏图像生成
苏兴哲，姜文文，宋津恩，高航，吴丰戈，郑昌文
arXiv 2023. [论文]
2023年7月17日

复杂性至关重要：重新思考生成建模的潜在空间
胡天阳，陈飞，王浩楠，李嘉伟，王文佳，孙嘉诚，李振国
arXiv 2023. [论文]
2023年7月17日

用于一致视觉合成的协作分数蒸馏
Subin Kim、Kyungmin Lee、June Suk Choi、Jongheon Jeong、Kihyuk Sohn、Jinwoo Shin
arXiv 2023年。[论文] [项目] [GitHub]
2023年7月4日

ProtoDiffusion：基于原型学习的无分类器扩散指导
Gulcin Baykal、Halil Faruk Karagoz、Taha Binhuraib、Gozde Unal
arXiv 2023年。[论文]
2023年7月4日

SDXL：改进用于高分辨率图像合成的潜在扩散模型
Dustin Podell、Zion English、Kyle Lacey、Andreas Blattmann、Tim Dockhorn、Jonas Müller、Joe Penna、Robin Rombach
arXiv 2023年。[论文] [GitHub]
2023年7月4日

用于时间一致性人体动画的双向时序扩散模型
Tserendorj Adiya、Sanghun Kim、Jung Eun Lee、Jae Shin Yoon、Hwasup Lim
arXiv 2023年。[论文]
2023年7月2日

脉冲去噪扩散概率模型
Jiahang Cao、Ziqing Wang、Hanzhong Guo、Hao Cheng、Qiang Zhang、Renjing Xu
arXiv 2023年。[论文]
2023年6月29日

DomainStudio：使用有限数据微调扩散模型以实现领域驱动的图像生成
Jingyuan Zhu、Huimin Ma、Jiansheng Chen、Jian Yuan
arXiv 2023年。[论文]
2023年6月25日

具有显式转移概率的解耦扩散模型
Yuhang Huang、Zheng Qin、Xinwang Liu、Kai Xu
arXiv 2023年。[论文]
2023年6月23日

利用扩散模型对单张图像进行连续布局编辑
Zhiyuan Zhang、Zhitong Huang、Jing Liao
arXiv 2023年。[论文]
2023年6月22日

半隐式去噪扩散模型（SIDDMs）
Yanwu Xu、Mingming Gong、Shaoan Xie、Wei Wei、Matthias Grundmann、kayhan Batmanghelich、Tingbo Hou
arXiv 2023年。[论文]
2023年6月21日

消除扩散模型中的利普希茨奇点
Zhantao Yang、Ruili Feng、Han Zhang、Yujun Shen、Kai Zhu、Lianghua Huang、Yifei Zhang、Yu Liu、Deli Zhao、Jingren Zhou、Fan Cheng
arXiv 2023年。[论文]
2023年6月20日

GD-VDM：通过生成深度提升基于扩散的视频生成
Ariel Lapid、Idan Achituve、Lior Bracha、Ethan Fetaya
arXiv 2023年。[论文]
2023年6月19日

利用扩散模型进行图像调和
Jiajie Li、Jian Wang、Chen Wang、Jinjun Xiong
arXiv 2023年。[论文]
2023年6月17日

在去噪辅助下训练扩散分类器
Chandramouli Sastry、Sri Harsha Dumpala、Sageev Oore
arXiv 2023年。[论文]
2023年6月15日

具有显式抽象控制的条件化人体草图合成
Dar-Yen Chen
arXiv 2023年。[论文]
2023年6月15日

利用掩码Transformer快速训练扩散模型
Hongkai Zheng、Weili Nie、Arash Vahdat、Anima Anandkumar
arXiv 2023年。[论文] [GitHub]
2023年6月15日

面向可控海报布局生成的关系感知扩散模型
Fengheng Li、An Liu、Wei Feng、Honghe Zhu、Yaoyu Li、Zheng Zhang、Jingjing Lv、Xin Zhu、Junjie Shen、Zhangang Lin、Jingping Shao
arXiv 2023年。[论文]
2023年6月15日

OMS-DPM：优化扩散概率模型的调度方案
Enshu Liu、Xuefei Ning、Zinan Lin、Huazhong Yang、Yu Wang
arXiv 2023年。[论文]
2023年6月15日

DORSal：用于场景中以物体为中心的表示的扩散等
Allan Jabri、Sjoerd van Steenkiste、Emiel Hoogeboom、Mehdi S. M. Sajjadi、Thomas Kipf
arXiv 2023年。[论文]
2023年6月13日

快速扩散模型
Zike Wu、Pan Zhou、Kenji Kawaguchi、Hanwang Zhang
arXiv 2023年。[论文] [GitHub]
2023年6月12日

ADDP：通过交替去噪扩散过程学习用于图像识别和生成的通用表示
Changyao Tian、Chenxin Tao、Jifeng Dai、Hao Li、Ziheng Li、Lewei Lu、Xiaogang Wang、Hongsheng Li、Gao Huang、Xizhou Zhu
arXiv 2023年。[论文]
2023年6月8日

多架构多专家扩散模型
Yunsung Lee、Jin-Young Kim、Hyojun Go、Myeongho Jeong、Shinhyeok Oh、Seungtaek Choi
arXiv 2023年。[论文]
2023年6月8日

利用欧几里得距离函数解释和改进扩散模型
Frank Permenter、Chenyang Yuan
arXiv 2023年。[论文]
2023年6月8日

具有局部—全局上下文引导的视频扩散模型
Siyuan Yang、Lu Zhang、Yu Liu、Zhizhuo Jiang、You He
IJCAI 2023年。[论文] [GitHub]
2023年6月5日

用于视觉探索的大脑扩散：利用大规模生成模型进行皮层发现
Andrew F. Luo、Margaret M. Henderson、Leila Wehbe、Michael J. Tarr
arXiv 2023年。[论文]
2023年6月5日

通过并行分数匹配加速扩散模型训练并改进密度估计
Etrit Haxholli、Marco Lorenzi
arXiv 2023年。[论文]
2023年6月5日

用于扩散模型的时间动态量化
Junhyuk So、Jungwon Lee、Daehyun Ahn、Hyungjun Kim、Eunhyeok Park
arXiv 2023年。[论文]
2023年6月4日

利用去噪器表示从无条件扩散模型进行条件化生成
Alexandros Graikos、Srikar Yellapragada、Dimitris Samaras
BMVC 2023年。[论文] [GitHub]
2023年6月2日

通过属性和语义掩码对扩散模型进行条件化以生成人脸
Nico Giambi、Giuseppe Lisanti
arXiv 2023年。[论文]
2023年6月1日

差异扩散：赋予每个像素其强度
Eran Levin、Ohad Fried
arXiv 2023年。[论文]
2023年6月1日

解决神经网络中语义与视觉对齐的不一致问题
Natalie Abreu、Nathan Vaska、Victoria Helus
arXiv 2023年。[论文]
2023年6月1日

扩散模型中的负迁移问题研究
高孝俊、金珍英、李润成、李承贤、吴信赫、文炯敦、崔承泽
arXiv 2023. [论文]
2023年6月1日

扩散模型的几何视角
陈德芳、周振宇、梅建平、沈春华、陈纯、王灿
arXiv 2023. [论文]
2023年5月31日

生成式扩散模型中的自发对称性破缺
加布里埃尔·拉亚、卢卡·安布罗吉奥尼
arXiv 2023. [论文]
2023年5月31日

扰动辅助样本合成：一种用于不确定性量化的新方法
刘一飞、沈雷克斯、沈晓彤
arXiv 2023. [论文]
2023年5月30日

一行代码的数据平滑技术提升基于似然的生成模型优化效果
潘巴贤、朱利奥·弗朗泽塞、皮耶特罗·米基亚尔迪、毛里齐奥·菲利波内
arXiv 2023. [论文]
2023年5月30日

环境扩散：从噪声数据中学习干净分布
扬尼斯·达拉斯、库林·沙阿、尤瓦尔·达甘、阿拉文德·戈拉科塔、亚历山德罗斯·G·迪马基斯、亚当·克利万斯
arXiv 2023. [论文]
2023年5月30日

面向扩散模型的精确无数据量化方法
王昌源、王子威、徐秀伟、唐言松、周杰、陆继文
arXiv 2023. [论文]
2023年5月30日

BRIGHT：基于哈希表组的图像集合双层特征表示
杨丁东、王义志、阿里·马赫达维-阿米里、张浩
arXiv 2023. [论文] [项目]
2023年5月29日

Diff-Instruct：一种从预训练扩散模型迁移知识的通用方法
罗伟健、胡天阳、张世峰、孙家诚、李正国、张志华
arXiv 2023. [论文]
2023年5月29日

学会跳跃：为生成建模稀疏化与稠密化潜在计数
陈天奇、周明远
ICML 2023. [论文] [GitHub]
2023年5月28日

重建心灵之眼：基于对比学习与扩散先验的fMRI到图像转换
保罗·S·斯科蒂、阿特马迪普·班纳吉、吉米·古德、斯特潘·沙巴林、亚历克斯·阮、伊森·科恩、艾丹·J·登普斯特、娜塔莉·韦尔林德、埃拉德·云德勒、大卫·魏斯伯格、肯尼思·A·诺曼、塔尼什克·马修·亚伯拉罕
arXiv 2023. [论文] [GitHub]
2023年5月29日

对比、注意力与扩散：从大脑活动解码高分辨率图像
孙静远、李明晓、陈子娇、张云昊、王绍楠、玛丽-弗朗辛·莫恩斯
arXiv 2023. [论文]
2023年5月26日

扩散模型的并行采样
安迪·施、苏尼尔·贝尔卡尔、斯特法诺·埃尔蒙、多尔萨·萨迪格、尼玛·阿纳里
arXiv 2023. [论文] [GitHub]
2023年5月25日

通过跳跃扩散模型实现跨维度生成建模
安德鲁·坎贝尔、威廉·哈维、克里斯蒂安·魏尔巴赫、瓦伦丁·德·博尔托利、汤姆·雷因福思、阿诺·杜塞
arXiv 2023. [论文]
2023年5月25日

UDPM：上采样扩散概率模型
沙迪·阿布-侯赛因、拉贾·吉里耶斯
arXiv 2023. [论文]
2023年5月25日

将GAN与基于分数的扩散模型统一为生成粒子模型
让-伊夫·弗朗切斯基、迈克·加特雷尔、路多维克·多斯桑托斯、蒂博·伊森努特、埃马纽埃尔·德·贝泽纳克、米凯尔·陈、阿兰·拉科托马蒙吉
arXiv 2023. [论文]
2023年5月25日

DuDGAN：通过双重扩散改进条件类别GAN
廉泰勋、李敏赫
arXiv 2023. [论文]
2023年5月24日

通过偏移时间步采样缓解扩散模型中的曝光偏差
李明晓、屈婷玉、孙伟、玛丽-弗朗辛·莫恩斯
arXiv 2023. [论文]
2023年5月24日

通过单一扩散模型实现稳健分类
陈焕然、董银鹏、王正毅、杨晓、段成奇、苏航、朱军
arXiv 2023. [论文]
2023年5月24日

关于扩散模型的泛化能力
易明阳、孙家诚、李正国
arXiv 2023. [论文]
2023年5月24日

VDT：基于Transformer的视频扩散实证研究
陆浩宇、杨国兴、费南怡、霍宇琪、陆志武、罗平、丁明宇
arXiv 2023. [论文] [GitHub]
2023年5月22日

电影级心像景观：从脑活动中高质量重建视频
陈子娇、秦佳欣、周娟·海伦
arXiv 2023. [论文] [项目]
2023年5月19日

PTQD：扩散模型的精准训练后量化方法
何叶飞、刘鲁平、刘静、吴伟嘉、周宏、庄博文
arXiv 2023. [论文]
2023年5月18日

黑屏扩散：离散状态空间中的生成式扩散模型
哈维尔·E·桑托斯、扎卡里·R·福克斯、尼古拉斯·卢伯斯、林燕婷
arXiv 2023. [论文]
2023年5月18日

扩散模型的结构化剪枝
方功凡、马新寅、王新超
arXiv 2023. [论文] [GitHub]
2023年5月18日

追赶蒸馏：只需训练一次即可加速采样
邵士通、戴旭、尹守义、李路军、陈焕然、胡洋
arXiv 2023. [论文]
2023年5月18日

可控的心灵视觉扩散模型
曾博文、李尚林、刘旭辉、高思成、姜晓龙、唐旭、胡耀、刘建壮、张宝昌
arXiv 2023. [论文]
2023年5月17日

基于扩散的面部生成模型中的偏差分析
马尔莎·V·佩雷拉、维沙尔·M·帕特尔
arXiv 2023. [论文]
2023年5月10日

扩散ODE的最大似然估计改进方法
郑凯文、卢程、陈建飞、朱军
ICML 2023. [论文]
2023年5月6日

LEO：用于人类视频合成的生成式潜在图像动画器
王耀辉、马欣、陈新元、安蒂察·丹切娃、戴博、乔宇
arXiv 2023. [论文] [项目] [GitHub]
2023年5月6日

迭代α-(去)混合：一种极简的确定性扩散模型
埃里克·海茨、洛朗·贝尔库尔、托马斯·尚邦
SIGGRAPH 2023。[论文]
2023年5月5日

通过引导式随机搜索从人类脑活动中重建已见图像
里斯·克尼兰德、乔丁·奥赫达、吉斯莱恩·圣伊夫、托马斯·纳塞拉里斯
arXiv 2023。[论文]
2023年4月30日

基于运动条件的扩散模型用于可控视频合成
蔡世恩·陈、林志豪、曾宏宇、林宗毅、杨明轩
arXiv 2023。[论文] [项目]
2023年4月27日

基于分数的生成模型：通过反向随机微分方程实现逆向与生成
王子浩
arXiv 2023。[论文]
2023年4月26日

利用潜在分类器指导探索组合式视觉生成
史长浩、倪浩淼、李凯、韩绍博、梁明福、马丁·任强·闵
CVPR研讨会2023。[论文]
2023年4月25日

补丁扩散：更快速且更节省数据的扩散模型训练
王振东、蒋一凡、郑黄杰、王培浩、何鹏程、王章阳、陈伟祖、周明远
arXiv 2023。[论文]
2023年4月25日

变分扩散自编码器：具有无条件扩散先验的深度潜在变量模型
乔治奥斯·巴佐利斯、扬·斯坦丘克、卡罗拉-比比安妮·舍恩利布
arXiv 2023。[论文]
2023年4月24日

LaMD：用于视频生成的潜在运动扩散模型
胡耀思、陈振中、罗冲
arXiv 2023。[论文]
2023年4月23日

前瞻扩散概率模型用于改进均值估计
张国强、新和健太、W·巴斯蒂安·克莱因
CVPR 2023。[论文] [GitHub]
2023年4月22日

NeuralField-LDM：基于层次化潜在扩散模型的场景生成
金承旭、布拉德利·布朗、尹康雪、卡斯滕·克莱斯、卡佳·施瓦茨、李大清、罗宾·伦巴赫、安东尼奥·托拉尔巴、桑雅·菲德勒
CVPR 2023。[论文]
2023年4月19日

利用潜在指纹为图像生成模型溯源
聂广宇、金昌勋、杨业洲、任毅
arXiv 2023。[论文]
2023年4月17日

个性化扩散的身份编码器
苏宇川、陈嘉谦、李彦东、赵洋、张涵、龚博青、王慧生、贾旭辉
arXiv 2023。[论文]
2023年4月14日

基于补丁生成的内存高效扩散概率模型
荒川真卫、津岛秀树、堀田大地、田中圭太郎、森岛重雄
arXiv 2023。[论文]
2023年4月14日

DCFace：基于双重条件扩散模型的合成人脸生成
金民哲、刘峰、阿尼尔·贾因、刘晓明
arXiv 2023。[论文] [GitHub]
2023年4月14日

DiffFit：通过简单的参数高效微调解锁大型扩散模型的迁移能力
谢恩泽、姚磊威、石汉、刘志立、周大泉、刘兆强、李家伟、李正国
arXiv 2023。[论文]
2023年4月13日

RAFT：用于生成式基础模型对齐的奖励排序微调
董汉泽、熊伟、迪潘舒·戈亚尔、潘锐、刁世哲、张继鹏、舒卡顺、张彤
arXiv 2023。[论文]
2023年4月13日

DreamPose：基于稳定扩散的时尚图像到视频合成
约翰娜·卡拉丝、亚历山大·霍林斯基、王廷春、伊拉·凯梅尔马赫-施利策曼
arXiv 2023。[论文] [项目][GitHub]
2023年4月12日

反射扩散模型
艾伦·卢、斯特法诺·埃尔蒙
ICML 2023。[论文] [项目] [GitHub]
2023年4月10日

二值潜在扩散
王泽、王江、刘子成、邱强
arXiv 2023。[论文]
2023年4月10日

扩散模型作为掩码自编码器
陈伟、卡尔蒂凯亚·曼加拉姆、黄柏尧、李阳浩、范浩奇、徐虎、王慧宇、谢慈航、艾伦·尤伊尔、克里斯托夫·费希滕霍费尔
arXiv 2023。[论文] [项目]
2023年4月6日

基于类别亲和力迁移的少样本语义图像合成
玛琳·卡雷尔、雅各布·韦贝克、斯蒂芬·拉图利耶
CVPR 2023。[论文]
2023年4月5日

EGC：基于扩散能量模型的图像生成与分类
郭秋山、马超凡、姜毅、袁泽寰、于一舟、罗平
arXiv 2023。[论文] [项目]
2023年4月4日

用于快速稳定扩散的令牌合并
丹尼尔·博利亚、朱迪·霍夫曼
arXiv 2023。[论文] [GitHub]
2023年3月30日

深入探讨扩散模型中的参数高效微调
项晨东、鲍帆、李崇轩、苏航、朱俊
arXiv 2023。[论文]
2023年3月31日

-Diff：采用子采样平滑状态实现无限分辨率扩散
萨姆·邦德-泰勒、克里斯·G·威尔科克斯
arXiv 2023。[论文]
2023年3月31日

使用2D扩散模型进行3D感知图像生成
相建峰、杨交龙、黄彬彬、佟鑫
arXiv 2023。[论文] [项目]
2023年3月31日

基于姿态引导的扩散模型实现一致的视图合成
曾宏宇、李钦波、金昌日、苏希卜·阿尔西桑、黄家斌、约翰内斯·科普夫
CVPR 2023。[论文]
2023年3月30日

DiffCollage：利用扩散模型并行生成大规模内容
张秦盛、宋嘉铭、黄迅、陈永信、刘明宇
CVPR 2023。[论文] [项目]
2023年3月30日

掩码扩散Transformer是一种强大的图像合成器
高尚华、周攀、程明明、颜水成
arXiv 2023。[论文] [GitHub]
2023年3月25日

基于潜在流扩散模型的条件图像到视频生成
倪浩淼、史昌昊、李凯、黄莎伦·X、马丁·任强·闵
CVPR 2023。[论文] [GitHub]
2023年3月24日

NUWA-XL：用于超长视频生成的扩散叠加扩散
殷圣明、吴晨飞、杨欢、王建峰、王晓东、倪明恒、杨正元、李林杰、刘树光、杨帆、傅建龙、龚明、王丽娟、刘子成、李厚强、段楠
arXiv 2023。[论文] [项目]
2023年3月22日

以对象为中心的槽位扩散
蒋金东、邓飞、高谭·辛格、安成镇
arXiv 2023。[论文]
2023年3月20日

LDMVFI：基于潜在扩散模型的视频帧插值
达尼尔·多利坤、张凡、大卫·布尔
arXiv 2023。[论文]
2023年3月16日

通过最小信噪比加权策略实现高效的扩散训练
杭天凯、顾书阳、李辰、鲍建敏、陈栋、胡汉、耿欣、郭百宁
arXiv 2023。[论文]
2023年3月16日

VideoFusion：用于高质量视频生成的分解式扩散模型
CVPR 2023。[论文]
2023年3月15日

通过力场构建实现可解释的ODE风格生成式扩散模型
金伟扬、朱永沛、彭宇曦
arXiv 2023。[论文]
2023年3月14日

用于标记化图像合成的正则化向量量化
张佳辉、詹方能、克里斯蒂安·特奥巴尔特、陆世坚
arXiv 2023。[论文]
2023年3月11日

PARASOL：用于扩散图像合成的参数化风格控制
杰玛·卡内特·塔雷斯、丹·鲁塔、杜氏图、约翰·科洛莫斯
arXiv 2023。[论文]
2023年3月11日

Brain-Diffuser：利用生成式潜在扩散模型从fMRI信号重建自然场景
富尔坎·厄兹切利克、鲁芬·范鲁伦
arXiv 2023。[论文]
2023年3月9日

多层级扩散：用于图像生成的无限维基于分数的扩散模型
保罗·哈格曼、拉尔斯·鲁托、加布里埃莱·施泰德尔、妮可·田娇·杨
arXiv 2023。[论文]
2023年3月8日

TRACT：具有传递闭包时间蒸馏的去噪扩散模型
大卫·贝尔特洛、阿诺·奥特夫、林杰瑞、迪安·昂·亚普、翟双飞、胡思源、郑丹尼尔、沃尔特·塔尔博特、古艾瑞克
arXiv 2023。[论文]
2023年3月7日

增强空间中的生成式扩散：完整配方
库沙格拉·潘迪、斯蒂芬·曼特
arXiv 2023。[论文]
2023年3月3日

一致性模型
宋洋、普拉富尔·达里瓦尔、马克·陈、伊利亚·苏茨克维尔
arXiv 2023。[论文]
2023年3月2日

扩散概率场
庄培叶、萨米拉·阿卜纳尔、顾家涛、亚历克斯·施温格、乔舒亚·M·萨斯金德、米格尔·安赫尔·巴乌蒂斯塔
ICLR 2023。[论文]
2023年3月1日

无监督发现扩散模型中的语义潜在方向
朴勇贤、权珉基、赵英孝、禹英中
arXiv 2023。[论文]
2023年2月24日

减、再利用、循环：基于能量的扩散模型与MCMC的组合生成
杜一伦、康纳·德肯、罗宾·斯特鲁德尔、约书亚·B·特南鲍姆、桑德·迪勒曼、罗布·费格斯、雅莎·索尔-迪克斯坦、阿尔诺·杜塞、威尔·格拉斯沃思
arXiv 2023。[论文] [项目]
2023年2月22日

通过单张图像上的自监督扩散学习3D摄影视频
王晓东、吴晨飞、殷圣明、倪明恒、王建峰、李林杰、杨正元、杨帆、王丽娟、刘子成、方跃健、段楠
arXiv 2023。[论文]
2023年2月21日

关于校准扩散概率模型
庞天宇、卢程、杜超、林敏、严水成、邓志杰
arXiv 2023。[论文] [GitHub]
2023年2月21日

少量标签下，扩散模型与半监督学习者相互受益
游泽斌、钟勇、鲍凡、孙嘉诚、李崇轩、朱俊
arXiv 2023。[论文]
2023年2月21日

使用预训练扩散模型进行跨领域合成
罗伊·哈赫诺奇、赵明睿、纳达夫·奥尔泽赫、里农·加尔、阿里·马赫达维-阿米里、丹尼尔·科恩-奥尔、阿米特·海姆·伯曼诺
arXiv 2023。[论文] [GitHub]
2023年2月20日

基于修复的生成模型
崔在穆、朴艺森、姜明珠
arXiv 2023。[论文]
2023年2月20日

一致扩散模型：通过学习保持一致性来缓解采样漂移
扬尼斯·达拉斯、尤瓦尔·达甘、亚历山德罗斯·G·迪马基斯、康斯坦提诺斯·达斯卡拉基斯
arXiv 2023。[论文] [GitHub]
2023年2月17日

LayoutDiffuse：将基础扩散模型适配用于布局到图像生成
程佳欣、梁晓、石兴健、何通、肖天军、李牧
arXiv 2023。[论文]
2023年2月16日

投影潜在空间中的视频概率扩散模型
柳始贤、孙基赫、金秀彬、申振宇
arXiv 2023。[论文] [GitHub]
2023年2月15日

DiffFaceSketch：基于草图引导的潜在扩散模型实现高保真人脸图像合成
彭毅臣、赵春琪、谢浩然、福里佐·月冈、宫田和典
arXiv 2023。[论文]
2023年2月14日

在哪里扩散、如何扩散以及如何回归：多变量扩散的自动化学习
拉加夫·辛哈尔、马克·戈德斯坦、拉杰什·兰加纳特
arXiv 2023。[论文]
2023年2月14日

预处理基于分数的生成模型
张莉、马恒远、朱夏田、冯建峰
arXiv 2023。[论文] GitHub]
2023年2月13日

星形去噪扩散概率模型
安德烈·奥霍京、德米特里·莫尔恰诺夫、弗拉基米尔·阿尔希普金、格里戈里·巴尔托什、艾贝克·阿拉诺夫、德米特里·韦特罗夫
arXiv 2023。[论文]
2023年2月10日

UniPC：用于扩散模型快速采样的统一预测-校正框架
赵文亮、白璐嘉、饶永明、周杰、陆继文
arXiv 2023。[论文] [项目] [GitHub]
2023年2月9日

基于分数的生成模型的几何结构
桑德什·吉米雷、刘金阳、阿曼德·科马斯、达文·希尔、阿里亚·马苏米、奥克塔维娅·坎普斯、珍妮弗·戴伊
arXiv 2023。[论文]
2023年2月9日

Q-Diffusion：量化扩散模型
李秀宇、连龙、刘义江、杨焕瑞、董振、丹尼尔·康格、张尚航、库尔特·凯茨勒
arXiv 2023。[论文]
2023年2月8日

PFGM++：释放受物理启发的生成模型的潜力
许一伦、刘子明、田勇龙、童尚远、马克斯·泰格马克、汤米·雅各拉
arXiv 2023。[论文] [GitHub]
2023年2月8日

长 horizon 温度缩放
安迪·史密斯、多尔萨·萨迪格、斯特法诺·埃尔蒙
arXiv 2023。[论文]
2023年2月7日

Spatial Functa：将 Functa 扩展到 ImageNet 分类与生成任务
马蒂亚斯·鲍尔、埃米利安·杜邦、安迪·布洛克、丹·罗森鲍姆、乔纳森·施瓦茨、金贤植
arXiv 2023。[论文]
2023年2月6日

ShiftDDPMs：通过平移扩散轨迹探索条件扩散模型
张子健、赵舟、于俊、田琪
AAAI 2023。[论文]
2023年2月5日

基于分数的生成模型的分解与组合
桑德什·吉米雷、阿曼德·科马斯、达文·希尔、阿里亚·马苏米、奥克塔维娅·坎普斯、珍妮弗·戴伊
arXiv 2023。[论文] [GitHub]
2023年2月5日

用于降低扩散模型中分数估计方差的稳定目标场
许一伦、童尚远、汤米·雅各拉
ICLR 2023。[论文] [GitHub]
2023年2月1日

DisDiff：无监督解耦扩散概率模型
杨涛、王宇旺、吕燕、郑南宁
NeurIPS 2023。[论文]
2023年1月31日

利用捷径微调优化 DDPM 采样
范颖、李康旭
arXiv 2023。[论文]
2023年1月31日

联合扩散模型学习数据表示
卡米尔·德贾、托马什·特热钦斯基、雅库布·M·托姆恰克
arXiv 2023。[论文]
2023年1月31日

ERA-Solver：用于快速采样扩散概率模型的误差鲁棒 Adams 求解器
李圣猛、刘露萍、柴增浩、李润楠、谭旭
arXiv 2023。[论文]
2023年1月30日

不要偏心：扩散模型中的少数群体引导
严素彬、叶宗哲
arXiv 2023。[论文] [GitHub]
2023年1月29日

利用分裂数值方法加速引导式扩散采样
苏提萨克·维扎德翁萨、苏帕索恩·苏瓦贾纳科恩
ICLR 2023。[论文]
2023年1月27日

输入扰动可减少扩散模型中的暴露偏差
孟宁、恩维尔·桑吉内托、安杰洛·波雷洛、西蒙·卡尔德拉拉、丽塔·库奇阿拉
arXiv 2023。[论文] [GitHub]
2023年1月27日

最小化基于 ODE 的生成模型的轨迹曲率
李相允、金凡洙、叶宗哲
arXiv 2023。[论文]
2023年1月27日

论噪声调度对扩散模型的重要性
陈婷
arXiv 2023。[论文]
2023年1月26日

simple diffusion：面向高分辨率图像的端到端扩散模型
埃米尔·霍赫博姆、乔纳森·希克、蒂姆·萨利曼斯
arXiv 2023。[论文]
2023年1月26日

通过 MMD 微调实现去噪扩散模型的快速推理
埃马努埃莱·艾耶洛、迭戈·瓦尔塞西亚、恩里科·马利
arXiv 2023。[论文] [GitHub]
2023年1月19日

探索用于图像扩散模型的 Transformer 主干网络
普林西·查哈尔
arXiv 2022。[论文]
2022年12月27日

从预训练的扩散概率模型中进行无监督表征学习
张子健、赵舟、林志杰
arXiv 2022。[论文]
2022年12月26日

迭代生成中的可扩展自适应计算
艾伦·贾布里、大卫·弗利特、陈婷
arXiv 2022。[论文]
2022年12月22日

分层分支扩散模型：用于高效且可解释的多类别条件生成
亚历克斯·M·曾、托马索·比安卡拉尼、马克斯·申、加布里埃莱·斯卡利亚
arXiv 2022。[论文]
2022年12月21日

MM-Diffusion：学习用于音频和视频联合生成的多模态扩散模型
阮路丹、马一洋、杨欢、何慧国、刘贝、傅建龙、袁景元、金琴、郭百宁
arXiv 2022。[论文] [GitHub]
2022年12月19日

基于 Transformer 的可扩展扩散模型
威廉·皮布尔斯、谢赛宁
arXiv 2022。[论文] [项目] [GitHub]
2022年12月19日

DAG：基于去噪扩散概率模型的深度感知引导
金京年、张宇锡、李圭成、洪秀成、徐俊英、金承龙
arXiv 2022。[论文] [项目]
2022年12月17日

迈向实用的即插即用扩散模型
高孝俊、李云成、金镇英、李承贤、郑明浩、李贤胜、崔承泽
arXiv 2022。[论文]
2022年12月12日

语义脑解码：从 fMRI 到视觉刺激的概念相似图像重建
马泰奥·费兰特、托马索·博卡托、尼古拉·托斯基
arXiv 2022。[论文]
2022年12月13日

MAGVIT：掩码生成式视频 Transformer
于立军、程勇、孙基赫、何塞·莱萨马、张汉、常慧文、亚历山大·G·豪普特曼、杨明轩、郝源、伊尔凡·埃萨、姜陆
arXiv 2022。[论文] [项目]
2022年12月10日

扩散视频自编码器：通过解耦视频编码实现时序一致的人脸视频编辑
金京满、沈夏珍、金贤洙、崔允哲、金俊浩、梁恩浩
arXiv 2022年。[论文]
2022年12月6日

基于扩散模型的像素级引导细粒度图像编辑
松永直树、石井正人、早川明夫、铃木健二、成平拓也
arXiv 2022年。[论文]
2022年12月5日

VIDM：视频隐式扩散模型
梅康富、Vishal M. Patel
arXiv 2022年。[论文] [项目] [GitHub]
2022年12月1日

为什么条件生成模型比无条件模型更好？
鲍帆、李崇轩、孙嘉诚、朱俊
arXiv 2022年。[论文]
2022年12月1日

基于潜在扩散模型的高保真引导图像合成
贾斯吉拉特·辛格、斯蒂芬·古尔德、郑亮
arXiv 2022年。[论文] [项目]
2022年11月30日

基于分数的连续时间离散扩散模型
孙浩然、于立军、戴博、戴尔·舒尔曼、戴汉军
arXiv 2022年。[论文]
2022年11月30日

小波扩散模型是快速且可扩展的图像生成器
何峰、段权、陈英
arXiv 2022年。[论文]
2022年11月29日

维度可变的扩散过程
张翰、冯瑞丽、杨占涛、黄良华、刘宇、张一飞、沈宇君、赵德利、周景仁、程凡
arXiv 2022年。[论文]
2022年11月29日

在基于分数的扩散模型中利用判别器指导细化生成过程
金东俊、金英民、姜完模、文一哲
arXiv 2022年。[论文]
2022年11月28日

瘦身版扩散概率模型
杨星毅、周大泉、冯家仕、王新超
arXiv 2022年。[论文]
2022年11月27日

通过算子学习加速扩散模型采样
郑洪凯、聂伟力、阿拉什·瓦赫达特、卡米亚尔·阿齐扎德内谢利、安尼玛·阿南德库马尔
arXiv 2022年。[论文]
2022年11月24日

用于任意长度高保真视频生成的潜在视频扩散模型
何英青、杨天宇、张勇、山英、陈启峰
arXiv 2022年。[论文]
2022年11月23日

以例为画：基于示例的扩散模型图像编辑
杨斌欣、顾书阳、张博、张婷、陈雪瑾、孙晓燕、陈栋、温芳
arXiv 2022年。[论文]
2022年11月23日

SinDiffusion：从单张自然图像中学习扩散模型
王伟伦、包建敏、周文刚、陈冬冬、陈栋、袁陆、李厚强
arXiv 2022年。[论文] [GitHub]
2022年11月22日

基于分类器特征蒸馏加速扩散采样
孙武杰、陈德芳、王灿、叶德士、冯艳、陈春
arXiv 2022年。[论文]
2022年11月22日

SceneComposer：任意层级语义图像合成
曾宇、林哲、张建明、刘庆、约翰·科洛莫斯、杰森·库恩、Vishal M. Patel
arXiv 2022年。[论文] [项目]
2022年11月21日

基于扩散的场景图到图像生成，结合掩码对比预训练
杨玲、黄志林、宋洋、洪申达、李国豪、张文韬、崔彬、伯纳德·加内姆、杨明轩
arXiv 2022年。[论文]
2022年11月21日

SinFusion：在单张图像或视频上训练扩散模型
雅尼夫·尼坎金、尼夫·海姆、米哈尔·伊拉尼
arXiv 2022年。[论文]
2022年11月21日

MagicVideo：利用潜在扩散模型高效生成视频
周大泉、王伟民、严汉淑、吕薇薇、朱一哲、冯家仕
arXiv 2022年。[论文] [项目]
2022年11月20日

超越大脑的视觉：用于视觉解码的稀疏掩码建模条件扩散模型
陈子娇、秦佳欣、项天歌、岳万琳、周娟·海伦
arXiv 2022年。[论文] [项目] [GitHub]
2022年11月13日

基于扩散模型的少样本图像生成
朱京元、马慧敏、陈建生、袁健
arXiv 2022年。[论文]
2022年11月7日

从去噪扩散到去噪马尔可夫模型
乔·本顿、史宇阳、瓦伦丁·德·博托利、乔治·德利吉安尼斯、阿尔诺·杜塞
arXiv 2022年。[论文] [GitHub]
2022年11月7日

用于条件GAN和扩散模型的高效空间稀疏推理
李牧扬、林继、孟晨霖、斯特凡诺·埃尔蒙、韩松、朱俊彦
NeurIPS 2022年。[论文] [GitHub]
2022年11月4日

基于扩散过程的最优控制视角下的扩散生成模型
尤利乌斯·伯纳、洛伦茨·里希特、卡伦·乌尔里希
NeurIPS研讨会2022年。[论文]
2022年11月2日

通过扩散过程实现熵神经最优传输
尼基塔·古什金、亚历山大·科列索夫、亚历山大·科罗京、德米特里·韦特罗夫、叶夫根尼·布尔纳耶夫
arXiv 2022年。[论文]
2022年11月2日

DPM-Solver++：扩散概率模型引导采样的快速求解器
卢成、周宇浩、鲍帆、陈建飞、李崇轩、朱俊
NeurIPS 2022（口头报告）。[论文] [GitHub]
2022年11月2日

基于分数的去噪扩散，采用非各向同性高斯噪声模型
维克拉姆·沃莱蒂、克里斯托弗·帕尔、亚当·奥伯曼
NeurIPS研讨会2022年。[论文]
2022年10月21日

扩散模型的深度均衡方法
阿什维尼·波克莱、耿正阳、齐科·科尔特
NeurIPS 2022年。[论文] [GitHub]
2022年10月23日

基于扩散模型的表征学习
杰雷米亚斯·特劳布
arXiv 2022年。[论文] [GitHub]
2022年10月20日

自引导扩散模型
Vincent Tao Hu、David W Zhang、Yuki M. Asano、Gertjan J. Burghouts、Cees G. M. Snoek
arXiv 2022年。[论文] [项目]
2022年10月12日

GENIE：高阶去噪扩散求解器
Tim Dockhorn、Arash Vahdat、Karsten Kreis
NeurIPS 2022。[论文] [项目 [GitHub]
2022年10月11日

f-DM：通过渐进式信号变换的多阶段扩散模型
Jiatao Gu、Shuangfei Zhai、Yizhe Zhang、Miguel Angel Bautista、Josh Susskind
arXiv 2022年。[论文] [项目]
2022年10月10日

关于引导式扩散模型的蒸馏
Chenlin Meng、Ruiqi Gao、Diederik P. Kingma、Stefano Ermon、Jonathan Ho、Tim Salimans
arXiv 2022年。[论文]
2022年10月6日

利用自注意力指导提升扩散模型采样质量
Susung Hong、Gyuseong Lee、Wooseok Jang、Seungryong Kim
arXiv 2022年。[论文] [项目]
2022年10月3日

OCD：使用条件扩散模型学习过拟合
Shahar Shlomo Lutati、Lior Wolf
arXiv 2022年。[论文] [GitHub]
2022年10月2日

野外生成的人脸：Stable Diffusion、Midjourney 和 DALL-E 2 的定量比较
Ali Borji
arXiv 2022年。[论文] [GitHub]
2022年10月2日

用于加速基于扩散的生成模型的去噪 MCMC
Beomsu Kim、Jong Chul Ye
arXiv 2022年。[论文] [GitHub]
2022年9月29日

万物皆可言说：基于分数的扩散模型的 ViT 主干网络
Fan Bao、Chongxuan Li、Yue Cao、Jun Zhu
arXiv 2022年。[论文]
2022年9月25日

神经小波域扩散用于 3D 形状生成
Ka-Hei Hui、Ruihui Li、Jingyu Hu、Chi-Wing Fu
arXiv 2022年。[论文]
2022年9月19日

能否仅使用完全合成的数据训练分割模型？
Virginia Fernandez、Walter Hugo Lopez Pinaya、Pedro Borges、Petru-Daniel Tudosiu、Mark S Graham、Tom Vercauteren、M Jorge Cardoso
arXiv 2022年。[论文]
2022年9月17日

模糊扩散模型
Emiel Hoogeboom、Tim Salimans
arXiv 2022年。[论文]
2022年9月12日

软扩散：针对一般性损坏的分数匹配
Giannis Daras、Mauricio Delbracio、Hossein Talebi、Alexandros G. Dimakis、Peyman Milanfar
arXiv 2022年。[论文]
2022年9月12日

使用 Token-Critic 改进掩码图像生成
José Lezama、Huiwen Chang、Lu Jiang、Irfan Essa
arXiv 2022年。[论文]
2022年9月9日

让我们架起桥梁：理解与扩展扩散生成模型
Xingchao Liu、Lemeng Wu、Mao Ye、Qiang Liu
arXiv 2022年。[论文]
2022年8月31日

Frido：用于复杂场景图像合成的特征金字塔扩散模型
Wan-Cyuan Fan、Yen-Chun Chen、DongDong Chen、Yu Cheng、Lu Yuan、Yu-Chiang Frank Wang
arXiv 2022年。[论文]
2022年8月29日

利用扩散模型从笔触和草图中生成自适应逼真的图像
Shin-I Cheng、Yu-Jie Chen、Wei-Chen Chiu、Hsin-Ying Lee、Hung-Yu Tseng
arXiv 2022年。[论文] [项目]
2022年8月26日

冷扩散：在无噪声情况下逆向任意图像变换
Arpit Bansal、Eitan Borgnia、Hong-Min Chu、Jie S. Li、Hamid Kazemi、Furong Huang、Micah Goldblum、Jonas Geiping、Tom Goldstein
arXiv 2022年。[论文] [GitHub]
2022年8月19日

利用稳健分类器指导增强基于扩散的图像合成
Bahjat Kawar、Roy Ganz、Michael Elad
arXiv 2022年。[论文]
2022年8月18日

你的 ViT 其实是一个混合判别—生成式的扩散模型
Xiulong Yang、Sheng-Min Shih、Yinlin Fu、Xiaoting Zhao、Shihao Ji
arXiv 2022年。[论文] [GitHub]
2022年8月16日

将正则化薛定谔桥随机过程应用于生成建模
Ki-Ung Song
arXiv 2022年。[论文] [GitHub]
2022年8月15日

模拟比特：利用自条件扩散模型生成离散数据
Ting Chen、Ruixiang Zhang、Geoffrey Hinton
arXiv 2022年。[论文]
2022年8月8日

金字塔去噪扩散概率模型
Dohoon Ryu、Jong Chul Ye
arXiv 2022年。[论文]
2022年8月3日

用于粗细结合图像合成的扩散模型渐进式去模糊
Sangyun Lee、Hyungjin Chung、Jaehyeon Kim、Jong Chul Ye
arXiv 2022年。[论文] [GitHub]
2022年7月16日

通过分块提升扩散模型效率
Troy Luhman、Eric Luhman
arXiv 2022年。[论文] [GitHub]
2022年7月9日

利用预处理扩散采样加速基于分数的生成模型
Hengyuan Ma、Li Zhang、Xiatian Zhu、Jianfeng Feng
ECCV 2022。[论文]
2022年7月5日

SPI-GAN：通过直线插值蒸馏基于分数的生成模型
Jinsung Jeon、Noseong Park
arXiv 2022年。[论文]
2022年6月29日

面向条件扩散生成的熵驱动采样与训练方案
Shengming Li、Guangcong Zheng、Hui Wang、Taiping Yao、Yang Chen、Shoudong Ding、Xi Li
arXiv 2022年。[论文]
2022年6月23日

利用逆向热扩散进行生成建模
Severi Rissanen、Markus Heinonen、Arno Solin
arXiv 2022年。[论文] [项目]
2022年6月21日

扩散模型作为即插即用先验
Alexandros Graikos、Nikolay Malkin、Nebojsa Jojic、Dimitris Samaras
NeurIPS 2022。[论文] [GitHub]
2022年6月17日

一种灵活的扩散模型
杜伟涛、杨涛、张鹤、杜元奇
ICML 2023。[论文]
2022年6月17日

基于高斯扩散的有损压缩
卢卡斯·泰斯、蒂姆·萨利曼斯、马修·D·霍夫曼、法比安·门策尔
arXiv 2022。[论文]
2022年6月17日

通过高阶去噪得分匹配对基于分数的扩散ODE进行最大似然训练
陆成、郑凯文、鲍帆、陈建飞、李崇轩、朱军
ICML 2022。[论文] [GitHub]
2022年6月16日

在扩散概率模型中利用不精确均值估计最优协方差
鲍帆、李崇轩、孙嘉诚、朱军、张博
ICML 2022。[论文] [GitHub]
2022年6月15日

用于视频预测和填补的扩散模型
托比亚斯·赫佩、阿拉什·梅尔久、斯特凡·鲍尔、迪德里克·尼尔森、安德烈亚·迪塔迪
arXiv 2022。[论文]
2022年6月15日

用于跨模态和条件生成的离散对比扩散
朱晔、吴宇、凯尔·奥尔谢夫斯基、任健、谢尔盖·图利亚科夫、严燕
arXiv 2022。[论文] [GitHub]
2022年6月15日

gDDIM：广义去噪扩散隐式模型
张秦生、陶默雷、陈永鑫
arXiv 2022。[论文] [GitHub]
2022年6月11日

足够了吗？基于分数的生成模型中扩散时间的研究
朱利奥·弗朗泽塞、西蒙·罗西、杨立轩、亚历山德罗·菲纳莫雷、达里奥·罗西、毛里齐奥·菲利波内、皮耶特罗·米基亚尔迪
arXiv 2022。[论文]
2022年6月10日

使用去噪扩散概率模型结合多模态先验进行图像生成
尼廷·戈帕拉克里希南·奈尔、韦莱·格达拉·查敏达·班达拉、维沙尔·M·帕特尔
arXiv 2022。[论文]
2022年6月10日

加速用于高分辨率图像合成的基于分数的生成模型
马恒远、张莉、朱夏田、张静峰、冯建峰
arXiv 2022。[论文]
2022年6月8日

Diffusion-GAN：用扩散训练GAN
王振东、郑黄杰、何鹏程、陈伟柱、周明远
arXiv 2022。[论文]
2022年6月5日

DPM-Solver：一种快速的ODE求解器，可在约10步内完成扩散概率模型采样
陆成、周宇浩、鲍帆、陈建飞、李崇轩、朱军
NeurIPS 2022。[论文] [GitHub]
2022年6月2日

阐明基于扩散的生成模型的设计空间
泰罗·卡拉斯、米卡·艾塔拉、蒂莫·艾拉、萨穆利·莱内
NeurIPS 2022。[论文]
2022年6月1日

关于分析基于扩散的深度生成模型的生成与去噪能力
卡米尔·德贾、安娜·库齐娜、托马什·特日钦斯基、雅库布·M·汤姆恰克
NeurIPS 2022。[论文]
2022年5月31日

少样本扩散模型
乔治奥·詹诺内、迪德里克·尼尔森、奥勒·温特
arXiv 2022。[论文]
2022年5月30日

用于离去噪模型的连续时间框架
安德鲁·坎贝尔、乔·本顿、瓦伦丁·德·博尔托利、汤姆·雷恩福思、乔治·德利吉安尼迪斯、阿诺·杜塞
arXiv 2022。[论文]
2022年5月30日

隐式非线性扩散模型的最大似然训练
金东俊、罗炳厚、权世正、李东洙、姜完模、文一哲
NeurIPS 2022。[论文]
2022年5月27日

通过提前停止扩散过程加速扩散模型
吕兆阳、徐旭东、杨策源、林大华、戴博
ICML 2022。[论文]
2022年5月25日

长视频的灵活扩散建模
威廉·哈维、赛义德·纳德里帕里齐、瓦登·马斯拉尼、克里斯蒂安·魏尔巴赫、弗兰克·伍德
arXiv 2022。[论文] [GitHub]
2022年5月23日

MCVD：用于预测、生成和插值的掩码条件视频扩散
维克拉姆·沃莱蒂、亚历克西娅·若利库尔-马蒂诺、克里斯托弗·帕尔
NeurIPS 2022。[论文] [GitHub]
2022年5月19日

关于如何通过条件化输入噪声实现扩散模型的可控图像生成
维丹特·辛格、苏尔甘·詹迪亚尔、阿尤什·乔普拉、西达尔特·拉梅什、巴拉吉·克里希纳穆提、维尼特·N·巴拉苏布拉马尼安
CVPR研讨会2022。[论文]
2022年5月8日

子空间扩散生成模型
景博文、加布里埃莱·科尔索、雷纳托·贝林吉耶里、汤米·雅各拉
arXiv 2022。[论文] [GitHub]
2022年5月3日

利用指数积分器快速采样扩散模型
张秦生、陈永鑫
arXiv 2022。[论文]
2022年4月29日

半参数化神经网络图像合成
安德烈亚斯·布拉特曼、罗宾·隆巴赫、卡恩·奥克泰、乔纳斯·穆勒、比约恩·奥默
NeurIPS 2022。[论文]
2022年4月25日

视频扩散模型
乔纳森·霍、蒂姆·萨利曼斯、阿列克谢·格里琴科、威廉·陈、穆罕默德·诺鲁齐、大卫·J·弗利特
NeurIPS 2022。[论文]
2022年4月7日

面向感知优先的扩散模型训练
崔主荣、李宗范、申彩勋、金成元、金贤宇、尹成路
CVPR 2022。[论文] [GitHub]
2022年4月1日

利用扩散模型从低密度区域生成高保真数据
维卡什·塞瓦格、卡内尔·哈齐尔巴斯、阿尔伯特·戈尔多、菲拉特·厄兹格内尔、克里斯蒂安·坎通·费雷尔
arXiv 2022。[论文]
2022年3月31日

用于反事实解释的扩散模型
纪尧姆·热讷雷、洛伊克·西蒙、弗雷德里克·朱里
arXiv 2022。[论文]
2022年3月29日

用于条件性基于分数的数据生成的去噪似然得分匹配
赵晨浩、孙伟芳、程柏文、罗怡辰、张家哲、刘宇伦、张雨琳、陈佳平、李春毅
ICLR 2022。[论文]
2022年3月27日

用于视频生成的扩散概率建模
杨瑞涵、普拉卡尔·斯里瓦斯塔瓦、施特凡·曼特
arXiv 2022。[论文] [GitHub]
2022年3月16日

动态双输出扩散模型
亚尼夫·本尼，利奥尔·沃尔夫
CVPR 2022. [论文]
2022年3月8日

基于扩散薛定谔桥的条件模拟
史宇阳，瓦伦丁·德·博尔托利，乔治·德利吉安尼迪斯，阿诺·杜塞
arXiv 2022. [论文]
2022年2月27日

用于反事实估计的扩散因果模型
佩德罗·桑切斯，索蒂里奥斯·A·察法塔里斯
PMLR 2022. [论文]
2022年2月21日

流形上扩散模型的伪数值方法
刘路平，任毅，林志杰，赵周
ICLR 2022. [论文] [GitHub]
2022年2月20日

截断扩散概率模型
郑黄杰，何鹏程，陈伟祖，周明远
arXiv 2022. [论文]
2022年2月19日

通过最优传输理解DDPM潜在编码
瓦伦丁·赫鲁尔科夫，伊万·奥谢列杰茨
arXiv 2022. [论文]
2022年2月14日

通过优化采样质量来学习扩散模型的快速采样器
丹尼尔·沃森，威廉·陈，乔纳森·霍，穆罕默德·诺鲁齐
ICLR 2022. [论文]
2022年2月11日

扩散桥与向量量化变分自编码器
马克斯·科恩，纪尧姆·基斯佩，西尔万·勒科尔夫，查尔斯·奥利翁，埃里克·穆兰
ICML 2022. [论文]
2022年2月10日

用于快速采样扩散模型的渐进蒸馏
蒂姆·萨利曼斯，乔纳森·霍
ICLR 2022. [论文]
2022年2月1日

Analytic-DPM：扩散概率模型中最佳逆向方差的解析估计
范宝，李崇轩，朱俊，张博
ICLR 2022. [论文]
2022年1月17日

DiffuseVAE：从低维潜在空间高效、可控且高保真地生成图像
库沙格拉·潘迪，阿维迪普·穆克吉，皮尤什·赖，阿比舍克·库马尔
arXiv 2022. [论文] [GitHub]
2022年1月2日

利用理想导数的去噪扩散概率模型的伊藤-泰勒采样方案
立花秀行，五町吾，稻原宗义，片山洋太郎，渡边洋太郎
arXiv 2021. [论文]
2021年12月26日

GLIDE：基于文本引导的扩散模型实现逼真图像生成与编辑
亚历克斯·尼科尔，普拉富拉·达里瓦尔，阿迪提亚·拉梅什，普拉纳夫·夏亚姆，帕梅拉·米什金，鲍勃·麦格鲁，伊利亚·苏茨克维尔，马克·陈
ICML 2021. [论文] [GitHub]
2021年12月20日

基于潜在扩散模型的高分辨率图像合成
罗宾·隆巴赫，安德烈亚斯·布拉特曼，多米尼克·洛伦茨，帕特里克·埃瑟，比约恩·奥默
arXiv 2021. [论文] [GitHub]
2021年12月20日

重尾去噪分数匹配
雅各布·迪西，尼古拉·西米季耶夫斯基，皮耶特罗·利奥
arXiv 2021. [论文]
2021年12月17日

高保真可视化你的自监督表征所了解的内容
弗洛里安·博尔德斯，兰德尔·巴莱斯特里耶罗，帕斯卡尔·文森特
arXiv 2021. [论文]
2021年12月16日

用去噪扩散GANs解决生成学习三难问题
肖志胜，卡斯滕·克莱斯，阿拉什·瓦哈特
arXiv 2021. [论文] [项目]
2021年12月15日

基于分数的生成模型与临界阻尼朗之万扩散
蒂姆·多克霍恩，阿拉什·瓦哈特，卡斯滕·克莱斯
ICLR 2022. [论文] [项目]
2021年12月14日

免费获得更多控制！基于语义扩散指导的图像合成
刘希辉，朴东赫，萨曼内·阿扎迪，龚章，阿尔曼·乔皮基扬，胡宇晓，亨弗里·施伊，安娜·罗尔巴赫，特雷弗·达雷尔
arXiv 2021. [论文]
2021年12月10日

在向量量化建模中使用离散扩散实现全局上下文，用于图像生成
胡明辉，王宇杰，谭哲仁，杨建飞，P.N.苏甘坦
arXiv 2021. [论文]
2021年12月3日

扩散自编码器：迈向有意义且可解码的表征
孔帕特·普里恰库尔，纳塔纳特·恰提，苏提萨克·维扎德翁萨，苏帕松·苏瓦贾纳科恩
CVPR 2022. [论文] [项目] [GitHub]
2021年12月30日

基于分数的扩散模型的条件图像生成
格奥尔吉奥斯·巴佐利斯，扬·斯坦丘克，卡罗拉-比比安·舍恩利布，克里斯蒂安·埃特曼
arXiv 2021. [论文]
2021年11月26日

释放Transformer的力量：利用离散吸收扩散进行并行标记预测，从而从向量量化代码快速生成高分辨率图像
萨姆·邦德-泰勒，彼得·赫西，佐佐木浩，托比·P·布雷肯，克里斯·G·威尔科克斯
arXiv 2021. [论文] [GitHub]
2021年11月24日

扩散归一化流
秦盛·张，陈永鑫
NeurIPS 2021. [论文] [GitHub]
2021年10月14日

去噪扩散伽马模型
埃利亚·纳赫马尼，罗宾·圣罗马，利奥尔·沃尔夫
arXiv 2021. [论文]
2021年10月10日

基于分数的大型最优传输生成神经网络
马克斯·丹尼尔斯，泰勒·马努，保罗·汉德
arXiv 2021. [论文]
2021年10月7日

基于分数的生成分类器
罗兰·S·齐默曼，卢卡斯·肖特，宋阳，本杰明·A·邓恩，大卫·A·克林特
arXiv 2021. [论文]
2021年10月1日

无分类器扩散指导
乔纳森·霍，蒂姆·萨利曼斯
NeurIPS研讨会 2021. [论文]
2021年9月28日

双边去噪扩散模型
马克斯·W·Y·林，王军，黄荣杰，苏丹，于东
arXiv 2021. [论文] [项目]
2021年8月26日

ImageBART：利用多项式扩散实现双向上下文，用于自回归图像合成
帕特里克·埃瑟，罗宾·隆巴赫，安德烈亚斯·布拉特曼，比约恩·奥默
NeurIPS 2021. [论文] [项目]
2021年8月19日

ILVR：去噪扩散概率模型的条件化方法
崔柱荣、金成元、郑勇贤、权英俊、尹成浩
ICCV 2021（口头报告）。[论文] [GitHub]
2021年8月6日

SDEdit：基于随机微分方程的引导式图像生成与编辑
孟晨琳、何宇彤、宋扬、宋嘉明、吴家俊、朱俊彦、斯特凡诺·埃尔蒙
ICLR 2022。[论文] [项目] [GitHub]
2021年8月2日

离散状态空间中的结构化去噪扩散模型
雅各布·奥斯汀、丹尼尔·D·约翰逊、乔纳森·霍、丹尼尔·塔洛、里安妮·范登贝格
NeurIPS 2021。[论文]
2021年7月7日

变分扩散模型
迪德里克·P·金格玛、蒂姆·萨利曼斯、本·普尔、乔纳森·霍
arXiv 2021。[论文] [GitHub]
2021年7月1日

变分自编码器中的扩散先验
安托万·韦亨凯尔、吉勒斯·卢佩
ICML研讨会2021。[论文]
2021年6月29日

基于薛定谔桥的深度生成学习
王戈菲、焦玉玲、徐倩、王洋、杨灿
ICML 2021。[论文]
2021年6月19日

非高斯去噪扩散模型
埃利亚·纳赫马尼、罗宾·圣罗马、利奥尔·沃尔夫
arXiv 2021。[论文] [项目]
2021年6月14日

D2C：用于少样本条件生成的扩散—去噪模型
阿比谢克·辛哈、宋嘉明、孟晨琳、斯特凡诺·埃尔蒙
NeurIPS 2021。[论文] [项目] [GitHub]
2021年6月12日

潜在空间中的基于分数的生成建模
阿拉什·瓦赫达特、卡斯滕·克莱斯、扬·考茨
arXiv 2021。[论文]
2021年6月10日

学习如何高效地从扩散概率模型中采样
丹尼尔·沃森、乔纳森·霍、穆罕默德·诺鲁齐、威廉·陈
arXiv 2021。[论文]
2021年6月7日

基于扩散的生成模型与分数匹配的变分视角
黄锦伟、林在贤、亚伦·库维尔
NeurIPS 2021。[论文] [GitHub]
2021年6月5日

软截断：一种用于高精度分数估计的通用训练技术，适用于基于分数的扩散模型
金东俊、申承宰、宋京佑、姜完模、文一哲
ICML 2022。[论文]
2021年6月10日

具有分数基生成建模应用的扩散薛定谔桥
瓦伦丁·德·博尔托利、詹姆斯·桑顿、杰里米·亨格、阿诺·杜塞特
arXiv 2021。[论文] [项目] [GitHub]
2021年6月1日

关于扩散概率模型的快速采样
孔志峰、魏平
ICML研讨会2021。[论文] [GitHub]
2021年5月31日

用于高保真图像生成的级联扩散模型
乔纳森·霍、奇特万·萨哈里亚、威廉·陈、大卫·J·弗利特、穆罕默德·诺鲁齐、蒂姆·萨利曼斯
JMLR 2021。[论文] [项目]
2021年5月30日

使用基于分数的模型生成数据时必须快速进行
亚历克西娅·若利科厄尔-马蒂诺、李可、雷米·皮谢-泰耶费尔、塔尔·卡赫曼、伊万尼斯·米特利亚加斯
arXiv 2021。[论文] [GitHub]
2021年5月28日

扩散模型在图像合成方面超越GAN
普拉富拉·达里瓦尔、亚历克斯·尼科尔
arXiv 2021。[论文] [GitHub]
2021年5月11日

通过迭代精炼实现图像超分辨率
奇特万·萨哈里亚、乔纳森·霍、威廉·陈、蒂姆·萨利曼斯、大卫·J·弗利特、穆罕默德·诺鲁齐
arXiv 2021。[论文] [项目] [GitHub]
2021年4月15日

生成式扩散模型的噪声估计
罗宾·圣罗马、埃利亚·纳赫马尼、利奥尔·沃尔夫
arXiv 2021。[论文]
2021年4月6日

改进的去噪扩散概率模型
亚历克斯·尼科尔、普拉富拉·达里瓦尔
ICLR 2021。[论文] [GitHub]
2021年2月18日

基于分数的扩散模型的最大似然训练
宋扬、康纳·德肯、伊恩·默里、斯特凡诺·埃尔蒙
arXiv 2021。[论文]
2021年1月22日

在迭代生成模型中进行知识蒸馏以提高采样速度
埃里克·卢曼、特洛伊·卢曼
arXiv 2021。[论文] [GitHub]
2021年1月7日

通过扩散恢复似然学习基于能量的模型
高瑞琪、宋扬、本·普尔、吴迎年、迪德里克·P·金格玛
ICLR 2021。[论文] [GitHub]
2020年12月15日

通过随机微分方程进行基于分数的生成建模
宋扬、贾莎·索尔-迪克斯坦、迪德里克·P·金格玛、阿比舍克·库马尔、斯特凡诺·埃尔蒙、本·普尔
ICLR 2021（口头报告）。[论文] [GitHub]
2020年11月26日

基于能量的潜在变量模型中得分函数的变分（梯度）估计
范宝、许坤、李崇轩、洪兰青、朱军、张波
ICML 2021。[论文]
2020年10月16日

去噪扩散隐式模型
宋嘉明、孟晨琳、斯特凡诺·埃尔蒙
ICLR 2021。[论文] [GitHub]
2020年10月6日

对抗性分数匹配及图像生成的改进采样
亚历克西娅·若利科厄尔-马蒂诺、雷米·皮谢-泰耶费尔、雷米·塔谢·德斯·孔布斯、伊万尼斯·米特利亚加斯
ICLR 2021。[论文] [GitHub]
2020年9月11日

去噪扩散概率模型
乔纳森·霍、阿贾伊·贾因、皮特·阿贝尔
NeurIPS 2020. [论文] [GitHub] [GitHub2]
2020年6月19日

基于分数的生成模型训练改进技术
宋洋、斯特凡诺·埃尔蒙
NeurIPS 2020. [论文] [GitHub]
2020年6月16日

通过估计数据分布的梯度进行生成建模
宋洋、斯特凡诺·埃尔蒙
NeurIPS 2019. [论文] [项目] [GitHub]
2019年7月12日

神经随机微分方程：扩散极限下的深度潜在高斯模型
贝琳达·曾、马克西姆·拉金斯基
arXiv 2019. [论文]
2019年5月23日

利用非平衡热力学进行深度无监督学习
雅莎·索尔-迪克斯坦、埃里克·A·魏斯、尼鲁·马赫斯瓦拉纳森、苏里亚·甘古利
ICML 2015. [论文] [GitHub]
2015年3月2日

分类

基于似然的异常检测：利用去噪扩散概率模型
约瑟夫·古迪尔、尼尔·D·F·坎贝尔
BMVC 2023. [论文]
2023年10月26日

多尺度扩散去噪平滑
郑宗宪、申振宇
NeurIPS 2023. [论文]
2023年10月25日

DiffRef3D：一种基于扩散的三维目标检测提案精炼框架
金世浩、具仁勇、李仁英、朴炳俊、金昌植
arXiv 2023. [论文]
2023年10月25日

扩散模型的去噪任务路由
朴炳俊、禹相珉、高孝俊、金珍英、金昌植
arXiv 2023. [论文]
2023年10月11日

利用基于扩散的图像变体在受污染数据上进行稳健训练
卢卡斯·斯特鲁佩克、马丁·B·亨舍尔、克利夫顿·波斯、多米尼克·欣特斯多夫、克里斯蒂安·克尔斯廷
arXiv 2023. [论文] [GitHub]
2023年10月10日

梦想不可能：利用扩散模型进行异常想象
杜雪峰、孙义友、朱晓进、李一轩
NeurIPS 2023. [论文] [GitHub]
2023年9月23日

基于语言-视觉模型的零样本目标计数
徐静怡、黎辉、季米特里斯·萨马拉斯
CVPR 2023. [论文] [GitHub]
2023年9月22日

PSDiff：用于人员搜索的扩散模型，具有迭代和协作式精炼功能
贾成友、罗敏楠、党卓航、戴广、常小军、王京东、郑庆华
arXiv 2023. [论文]
2023年9月20日

超越生成：利用文本到图像模型进行目标检测和分割
葛云浩、许嘉树、布赖恩·N·隆·赵、尼尔·乔希、劳伦特·伊蒂、维巴夫·维尼特
arXiv 2023. [论文] [GitHub]
2023年9月12日

DiffusionEngine：扩散模型作为可扩展的目标检测数据引擎
张曼琳、吴杰、任宇熙、李明、秦杰、肖学峰、刘伟、王睿、郑敏、Andy J. Ma
arXiv 2023. [论文] [项目] [GitHub]
2023年9月7日

基于扩散的随机框法三维目标检测
周鑫、侯晶华、姚婷婷、梁定康、刘哲、邹志康、叶晓青、程建伟、白翔
PRCV 2023. [论文]
2023年9月5日

扩散模型作为表征学习器
杨兴义、王新超
ICCV 2023. [论文]
2023年8月21日

DiffusionTrack：用于多目标跟踪的扩散模型
罗润、宋子凯、马林涛、魏锦林、杨伟、杨敏
arXiv 2023. [论文]
2023年8月19日

DiffGuard：利用预训练扩散模型进行语义不匹配引导的异常检测
高瑞源、赵晨晨、洪兰清、许强
arXiv 2023. [论文]
2023年8月15日

IDiff-Face：基于合成数据的人脸识别，通过气泡状身份条件扩散模型
法迪·布特罗斯、乔纳斯·亨利·格雷贝、阿尔扬·库伊珀、纳塞尔·达默
ICCV 2023. [论文]
2023年8月9日

利用合成数据解决数据不平衡问题：从数据角度出发的基线方法
尹月彬、南贤宇、崔元锡、金娜英、郭秀河、吴泰贤
arXiv 2023. [论文]
2023年8月2日

用于伪装物体检测的扩散模型
陈振楠、高荣荣、向天竹、林凡
ECAI 2023. [论文]
2023年8月1日

DiffPose：用于视频中人体姿态估计的时空扩散模型
冯润阳、高一星、谢泽豪、马雪晴、张炯镇
arXiv 2023. [论文]
2023年7月31日

MetaDiff：基于条件扩散的元学习，用于少样本学习
张宝权、于德民
arXiv 2023. [论文]
2023年7月31日

弱监督目标定位的生成式提示模型
赵宇中、叶奇祥、吴伟佳、沈春华、万芳
ICCV 2023. [论文] [GitHub]
2023年7月19日

扩散模型在图像分类上击败GAN
苏米克·穆克霍帕迪亚、马修·格威利亚姆、瓦察尔·阿加瓦尔、纳米塔·帕德马纳班、阿尔恰娜·斯瓦米纳坦、斯里尼迪·黑吉德、周天毅、阿比纳夫·施里瓦斯塔瓦
arXiv 2023. [论文]
2023年7月17日

从扩散到困惑：基于扩散模型为目标检测器生成自然主义对抗补丁
林硕延、厄尼·楚、林哲贤、陈俊诚、王家靖
arXiv 2023. [论文]
2023年7月16日

DreamTeacher：利用深度生成模型对图像骨干网络进行预训练
李大青、凌欢、阿姆兰·卡尔、大卫·阿库尼亚、金承旭、卡斯滕·克莱斯、安东尼奥·托拉尔巴、桑雅·菲德勒
arXiv 2023. [论文] [项目]
2023年7月14日

ProtoDiff：通过任务引导的扩散模型学习原型网络
杜英俊、肖泽浩、廖圣才、西斯·斯诺克
arXiv 2023。[论文]
2023年6月26日

掩码扩散模型是快速学习者
雷家琛、程鹏、巴忠杰、任奎
arXiv 2023。[论文]
2023年6月20日

渲染器是优秀的零样本表征学习器：探索用于度量学习的扩散潜变量
迈克尔·唐、大卫·舒斯廷
arXiv 2023。[论文]
2023年6月19日

大数据神话：利用扩散模型生成数据集以训练深度检测模型
罗伊·沃特曼、玛雅·阿盖伊、克拉斯·迪克斯特拉
arXiv 2023。[论文]
2023年6月16日

高光谱图像分类与扩散模型的结合：一种无监督特征学习框架
周静怡、盛嘉木、范佳源、叶鹏、何彤、王斌、陈涛
arXiv 2023。[论文]
2023年6月15日

DDLP：基于深度动态潜粒子的无监督以物体为中心的视频预测
塔尔·丹尼尔、阿维夫·塔马尔
arXiv 2023。[论文]
2023年6月9日

ADDP：利用交替去噪扩散过程学习用于图像识别与生成的通用表征
田昌耀、陶晨欣、戴继峰、李浩、李子恒、陆磊威、王小刚、李洪生、黄高、朱锡舟
arXiv 2023。[论文]
2023年6月8日

利用去噪器表征从无条件扩散模型进行条件生成
亚历山德罗斯·格莱科斯、斯里卡尔·耶拉普拉加达、迪米特里斯·萨马拉斯
BMVC 2023。[论文] [GitHub]
2023年6月2日

DiffCLIP：利用稳定扩散实现语言驱动的3D分类
沈思恬、朱子林、范琳倩、张哈里、吴新晓
arXiv 2023。[论文]
2023年5月25日

凭空训练：用生成数据提升图像分类性能
周永超、赫什马特·萨哈克、吉米·巴
arXiv 2023。[论文] [项目] [GitHub]
2023年5月24日

来自扩散模型的合成数据是否已准备好用于知识蒸馏？
李政、李宇轩、赵鹏海、宋仁杰、李翔、杨健
arXiv 2023。[论文] [GitHub]
2023年5月22日

利用文本到图像扩散模型提升人-物体交互检测能力
杨洁、李炳良、杨丰宇、曾爱玲、张磊、张瑞茂
arXiv 2023。[论文]
2023年5月20日

Meta-DM：扩散模型在少样本学习中的应用
胡文韬、蒋秀蓉、刘嘉润、杨雨琪、田慧
arXiv 2023。[论文]
2023年5月14日

类别平衡扩散模型
秦一鸣、郑黄杰、姚江超、周明远、张娅
CVPR 2023。[论文]
2023年4月30日

来自扩散模型的合成数据提升了ImageNet分类性能
谢库菲·阿齐齐、西蒙·科恩布利斯、奇特万·萨哈里亚、穆罕默德·诺鲁齐、大卫·J·弗利特
arXiv 2023。[论文]
2023年4月17日

OVTrack：开放词汇多目标跟踪
李思远、托比亚斯·费舍尔、柯磊、丁恒辉、马丁·丹内尔扬、余斐
arXiv 2023。[论文]
2023年4月17日

你的扩散模型其实是一个零样本分类器
亚历山大·C·李、米希尔·普拉布德赛、希瓦姆·杜格尔、埃利斯·布朗、迪帕克·帕塔克
arXiv 2023。[论文] [项目]
2023年3月28日

文本到图像扩散模型是零样本分类器
凯文·克拉克、普里扬克·贾尼
arXiv 2023。[论文]
2023年3月27日

基于扩散去噪平滑的认证且对抗鲁棒的分布外检测
尼古拉·佛朗哥、丹尼尔·科尔斯、珍妮特·米里亚姆·洛伦茨、卡斯滕·罗舍尔、施特凡·根内曼
arXiv 2023。[论文]
2023年3月27日

CIFAKE：图像分类及对AI生成合成图像的可解释性识别
乔丹·J·伯德、艾哈迈德·洛特菲
arXiv 2023。[论文]
2023年3月24日

去噪扩散自编码器是统一的自监督学习器
向伟来、杨宏宇、黄迪、王云鸿
arXiv 2023。[论文] )]
2023年3月17日

借助稳定扩散提升零样本分类中合成数据的多样性
乔丹·希帕德、阿诺德·威廉、阮清坚、向伟、克林顿·福克斯
arXiv 2023。[论文]
2023年2月7日

假装直到成功：从一个合成的ImageNet克隆中学习
梅尔特·布伦特·萨里伊尔迪兹、卡尔泰克·阿拉哈里、黛安·拉尔吕斯、扬尼斯·卡兰蒂迪斯
CVPR 2023。[论文] [项目]
2022年12月16日

DiffAlign：基于扩散合成与对齐的少样本学习
阿尼凯特·罗伊、安舒尔·沙阿、凯图尔·沙阿、阿尼尔班·罗伊、拉马·切拉帕
arXiv 2022。[论文]
2022年12月11日

用于分布外检测的感知机偏置扩散去噪过程
刘路平、任毅、程熙泽、赵周
arXiv 2022。[论文] [GitHub]
2022年11月21日

DiffusionDet：用于目标检测的扩散模型
陈寿发、孙培泽、宋义兵、罗平
arXiv 2022。[论文] [GitHub]
2022年11月17日

用于分布外检测的去噪扩散模型
马克·S·格雷厄姆、沃尔特·H.L.皮纳亚、彼得鲁-丹尼尔·图多修、帕拉什凯夫·纳切夫、塞巴斯蒂安·乌尔塞林、M·豪尔赫·卡多索
arXiv 2022。[论文] [GitHub]
2022年11月14日

一种简单、高效且可扩展的对比掩码自编码器，用于学习视觉表征
什洛克·米什拉、乔舒亚·罗宾逊、常慧雯、大卫·雅各布斯、亚伦·萨尔纳、亚伦·马斯基诺特、迪利普·克里希南
arXiv 2022。[论文]
2022年10月30日

从点到函数：扩散模型中的无限维表征
萨尔塔克·米塔尔、纪йом·拉若伊、斯特凡·鲍尔、阿拉什·梅赫久
arXiv 2022。[论文] [GitHub]
2022年10月25日

回旋镖：基于扩散模型的图像流形局部采样
洛伦佐·卢齐、阿里·西亚库希、保罗·M·梅耶、何塞·卡斯科-罗德里格斯、理查德·巴拉纽克
arXiv 2022年。[论文] [Colab]
2022年10月21日

通过分类器（无）引导的元学习
埃尔维斯·纳瓦、小林诚二、尹一飞、罗伯特·K·卡茨施曼、本杰明·F·格雷韦
arXiv 2022年。[论文]
2022年10月17日

分割

利用基础模型对医学图像进行单样本定位与分割
迪帕·阿南德、古鲁纳特·雷迪·M、瓦尼卡·辛格哈尔、达特什·D·桑巴格、希里拉姆·KS、乌代·帕蒂尔、奇特雷斯·布尚、卡维塔·马尼克坎、戴伟·圭、拉凯什·穆利克、阿维纳什·戈帕尔、帕尔明德·巴蒂亚、塔哈·卡斯-豪特
arXiv 2023年。[论文]
2023年10月28日

基于条件扩散模型的语义保持图像编码
弗朗切斯科·佩佐内、奥斯曼·穆萨、朱塞佩·凯雷、塞尔吉奥·巴尔巴罗萨
arXiv 2023年。[论文]
2023年10月24日

基于扩散的数据增强用于细胞核图像分割
于欣怡、李冠斌、楼伟、刘思琪、万翔、陈燕、李浩峰
arXiv 2023年。[论文]
2023年10月22日

EMIT-Diff：通过文本引导的扩散模型提升医学图像分割效果
张哲远、姚兰红、王斌、德贝什·贾、埃莉夫·凯莱斯、阿尔派·梅代塔利贝约卢、乌拉斯·巴格奇
arXiv 2023年。[论文]
2023年10月19日

借助图像提示的基础模型实现无需训练的开放世界分割
唐律、蒋鹏涛、肖浩克、李博
arXiv 2023年。[论文]
2023年10月17日

面向体数据医学图像分割的通用半监督框架
王浩楠、李晓梦
NeurIPS 2023年。[论文] [GitHub]
2023年10月17日

受控扩散图像增强在弱监督语义分割中的应用
吴旺宇、戴天宏、黄晓伟、马飞、肖继民
arXiv 2023年。[论文]
2023年10月15日

引导式扩散：一种用于即插即用条件图像合成的通用框架
尼廷·戈帕拉克里希南·奈尔、阿努普·切里安、苏哈斯·洛希特、叶王、小池俊明、维沙尔·M·帕特尔、蒂姆·K·马克斯
ICCV 2023年。[论文]
2023年9月30日

分解式扩散架构用于无监督图像生成与分割
袁鑫、迈克尔·梅尔
arXiv 2023年。[论文]
2023年9月27日

数据集扩散：基于扩散的合成数据集生成用于像素级语义分割
阮光、武壮、陈英、阮恢
arXiv 2023年。[论文]
2023年9月25日

马赛克融合：扩散模型作为大词汇量实例分割的数据增强工具
谢家豪、李伟、李向泰、刘子威、翁业顺、陈昌洛伊
arXiv 2023年。[论文] [GitHub]
2023年9月22日

超越生成：利用文生图模型进行目标检测与分割
葛云浩、徐嘉树、布莱恩·N·赵、尼尔·乔希、劳伦特·伊蒂、维巴夫·维尼特
arXiv 2023年。[论文] [GitHub]
2023年9月12日

在扩散模型中引入形状先验模块用于医学图像分割
张志清、范国佳、刘天勇、李楠、刘宇阳、刘子宇、董灿伟、周守军
arXiv 2023年。[论文]
2023年9月12日

从文本到掩码：利用文生图扩散模型的注意力机制定位实体
肖长明、杨琦、周峰、张昌水
arXiv 2023年。[论文]
2023年9月8日

SLiMe：像我一样分割
阿里萨加尔·卡尼、赛义德·阿斯加里·塔加纳基、阿迪提亚·桑吉、阿里·马赫达维·阿米里、加桑·哈马尔内
arXiv 2023年。[论文] [GitHub]
2023年9月6日

扩散模型其实是无需训练的开放词汇语义分割器
王景隆、李夏伟、张静、许青源、周秦、于倩、盛璐、徐东
arXiv 2023年。[论文]
2023年9月6日

GenSelfDiff-HIS：利用扩散进行组织病理学图像分割的生成式自监督
维什努瓦尔丹·普尔马、苏哈斯·斯里纳特、塞山·斯里兰加拉詹、安恰尔·卡卡尔、普拉托什·A·P
arXiv 2023年。[论文] [GitHub]
2023年9月4日

注意力即标注：利用扩散生成图像和伪掩码用于弱监督语义分割
吉桥亮太、大冢悠也、土井健二、田中智弘
AAAI 2022年。[论文]
2023年9月4日

ArSDM：采用自适应精炼语义扩散模型合成结肠镜检查图像
杜宇浩、江云成、谭双义、吴旭升、窦祺、李振、李冠斌、万翔
arXiv 2023年。[论文]
2023年9月3日

Ref-Diff：利用生成模型实现零样本指代图像分割
倪明恒、张亚博、冯凯来、李晓明、郭艺文、左望蒙
arXiv 2023年。[论文]
2023年8月31日

基于掩码条件扩散的模态循环用于MRI中的无监督异常分割
梁子云、哈里·安东尼、费利克斯·瓦格纳、康斯坦丁诺斯·卡姆尼察斯
arXiv 2023年。[论文]
2023年8月30日

基于扩散去噪模型的医学图像分割循环训练策略
傅永冠、李艺文、沙希尔·U·赛义德、马修·J·克拉克森、胡一鹏
arXiv 2023年。[论文] [GitHub]
2023年8月30日

扩散、注意与分割：使用Stable Diffusion实现无监督零样本分割
田俊娇、拉维莎·阿加瓦尔、安德烈娅·科拉科、佐尔特·基拉、玛尔·冈萨雷斯-弗兰科
arXiv 2023年。[论文]
2023年8月23日

基于扩散的带标签指导图像转换用于领域自适应语义分割
彭多、胡平、邱红可、刘俊
arXiv 2023年。[论文]
2023年8月23日

DMCVR：基于形态学指导的扩散模型用于三维心脏体积重建
何晓晓、谭超伟、韩立功、刘博、莱昂·阿克塞尔、李康、迪米特里斯·N·梅塔克萨斯
MICCAI 2023年。[论文] [GitHub]
2023年8月18日

掩码扩散模型作为自监督表征学习器
潘子轩、陈建旭、史一宇
arXiv 2023年。[论文]
2023年8月10日

DermoSegDiff：用于皮肤病变勾画的边界感知分割扩散模型
阿夫辛·博佐尔普尔、优赛夫·萨德盖伊、阿米尔侯赛因·卡泽鲁尼、雷扎·阿扎德、多丽特·梅尔霍夫
MICCAI研讨会 2023年。[论文] [GitHub]
2023年8月5日

DiffusePast：基于扩散的生成式回放用于类别增量语义分割
陈景凡、王宇熙、王鹏飞、陈晓、张兆翔、雷震、李青
arXiv 2023年。[论文]
2023年8月2日

DAVIS：基于生成式扩散模型的高质量视听分离
黄超、苏珊·梁、田亚鹏、阿努拉格·库马尔、徐晨亮
arXiv 2023年。[论文]
2023年7月31日

使用扩散模型进行牙科X线图像分割的预训练
杰雷米·鲁索、克里斯蒂安·阿拉卡、艾玛·科维利、伊波利特·马亚尔、劳拉·米斯拉奇、威利·奥
arXiv 2023年。[论文]
2023年7月26日

FEDD——公平、高效且多样化的基于扩散的病变分割与恶性度分类
埃克托·卡里翁、纳尔吉斯·诺鲁齐
MICCAI 2023年。[论文] [GitHub]
2023年7月21日

DreamTeacher：利用深度生成模型预训练图像骨干网络
李代庆、胡安·凌、阿姆兰·卡尔、大卫·阿库纳、金承昱、卡斯滕·克莱斯、安东尼奥·托拉尔巴、桑雅·菲德勒
arXiv 2023年。[论文] [项目]
2023年7月14日

通过提示引导扩散表征实现跨域语义分割
龚锐、马丁·丹内尔扬、孙汉、胡里奥·德尔加多·曼加斯、卢克·范古尔
arXiv 2023年。[论文]
2023年7月5日

DifFSS：用于少样本语义分割的扩散模型
谭伟民、陈思远、严波
arXiv 2023年。[论文]
2023年7月3日

借助扩散模型迈向更优的认证分割
奥斯曼·劳西、亚历山大·阿拉乌若、纪йом·沙萨尼翁、玛丽-皮埃尔·雷韦尔、西达尔特·加格、法尔沙德·霍拉米、玛丽亚·瓦卡洛普卢
arXiv 2023年。[论文]
2023年6月16日

用于零样本开放词汇分割的扩散模型
劳里纳斯·卡拉齐亚、伊罗·莱娜、安德烈亚·韦达尔迪、克里斯蒂安·鲁普雷希特
arXiv 2023年。[论文]
2023年6月15日

利用扩散模型进行医学图像分割的标注者共识预测
托默·阿米特、什穆埃尔·希赫鲁尔、塔尔·沙哈拉巴尼、利奥尔·沃尔夫
arXiv 2023年。[论文]
2023年6月15日

生成式语义通信：超越比特恢复的扩散模型
埃莱奥诺拉·格拉斯丘奇、塞尔吉奥·巴尔巴罗萨、达尼洛·孔米涅洛
arXiv 2023年。[论文] [GitHub]
2023年6月7日

用于弱监督医学图像分割的条件扩散模型
胡新荣、陈宇珍、何宗毅、史一宇
arXiv 2023年。[论文]
2023年6月6日

DFormer：扩散引导的通用图像分割Transformer
王贺峰、曹佳乐、拉奥·穆罕默德·安维尔、谢进、法哈德·沙赫巴兹·汗、庞燕伟
arXiv 2023年。[论文] [GitHub]
2023年6月6日

采用掩码先验建模的去噪扩散语义分割
赖泽强、段宇辰、戴继峰、李子恒、傅颖、李洪生、乔宇、王文海
arXiv 2023年。[论文]
2023年6月2日

基于扩散模型的半监督超声图像分割中的多级全局上下文交叉一致性模型
唐凤河、丁建瑞、王灵涛、冼敏、宁春平
arXiv 2023年。[论文] [GitHub]
2023年5月16日

从噪声中回响：利用扩散模型生成合成超声图像以辅助真实图像分割
大卫·斯托亚诺夫斯基、乌希奥·埃尔米达、巴勃罗·拉马塔、阿里安·贝奇里、阿尔贝托·戈麦斯
arXiv 2023年。[论文]
2023年5月9日

单次操作即可个性化Segment Anything Model
张仁睿、蒋正凯、郭子宇、闫士林、潘俊廷、董浩、高鹏、李洪生
arXiv 2023年。[论文] [GitHub]
2023年5月4日

利用生成式扩散特征无监督发现三维层次结构
努里斯拉姆·图尔辛别克、马克·尼特哈默
arXiv 2023年。[论文]
2023年4月28日

DiffuseExpand：利用扩散模型扩充二维医学图像分割数据集
邵世通、袁晓涵、黄振、邱子明、王帅、周凯文
arXiv 2023年。[论文] [GitHub]
2023年4月26日

用于组织病理学中稳健图像分割的真实数据增强
莎拉·切赫尼卡、詹姆斯·鲍尔、卡勒姆·阿瑟斯、坎迪斯·鲁福斯、伯恩哈德·凯因茨
arXiv 2023年。[论文]
2023年4月19日

去噪扩散医学模型
范玉辉、陈明权
IEEE ISBI 2023年。[论文]
2023年4月19日

利用扩散模型进行模糊医学图像分割
艾蒙·拉赫曼、杰娅·玛丽亚·约瑟·瓦拉纳拉苏、伊尔克尔·哈奇哈利洛卢、维沙尔·M·帕特尔
CVPR 2023年。[论文] [GitHub]
2023年4月10日

BerDiff：用于医学图像分割的条件伯努利扩散模型
陈涛、王晨辉、单宏明
arXiv 2023年。[论文]
2023年4月10日

分布对齐扩散与原型引导网络用于无监督领域自适应分割
周海鹏、朱磊、周雨音
arXiv 2023年。[论文]
2023年3月22日

基于扩散自编码器的语义潜在空间回归用于椎体骨折分级
马蒂亚斯·凯彻、马坦·阿塔德、大卫·辛茨、亚历山德拉·S·格尔辛、萨拉·C·福尔曼、索菲娅·S·戈勒、尤尔根·魏辛格、乔恩·里舍夫斯基、安娜-索菲娅·迪特里希、本尼迪克特·维斯特勒、扬·S·基尔施克、纳西尔·纳瓦布
arXiv 2023年。[论文]
2023年3月21日

LD-ZNet：一种基于文本的图像分割潜在扩散方法
库提利亚·普纳弗、巴拉特·辛格、帕拉比·戈什、贝赫贾特·西迪奎、戴维·雅各布斯
arXiv 2023年。[论文]
2023年3月22日

DiffuMask：利用扩散模型合成带有像素级标注的图像用于语义分割
吴伟嘉、赵宇中、Mike Zheng Shou、周宏、沈春华
arXiv 2023年。[论文] [项目]
2023年3月21日

以物体为中心的槽位扩散
蒋金东、邓飞、高谭·辛格、安成镇
arXiv 2023年。[论文]
2023年3月20日

Diff-UNet：一种嵌入扩散网络的体积分割方法
邢兆虎、万亮、傅华柱、杨光、朱磊
arXiv 2023年。[论文] [GitHub]
2023年3月18日

DiffusionSeg：将扩散模型应用于无监督目标发现
马超凡、杨宇桓、鞠晨、张飞、刘金祥、王宇、张亚、王延峰
arXiv 2023年。[论文]
2023年3月17日

基于条件分类扩散模型的随机分割
卢卡斯·茨宾登、拉尔斯·多伦博斯、西奥多罗斯·皮萨斯、拉斐尔·斯兹尼特曼、巴勃罗·马尔克斯-内伊拉
ICCV 2023。[论文] [GitHub]
2023年3月15日

DiffBEV：用于鸟瞰感知的条件扩散模型
邹佳宇、朱正、叶云、王兴刚
arXiv 2023年。[论文]
2023年3月15日

在三维多类别分割中，训练策略与评估对齐对于扩散模型的重要性
付云冠、李艺文、沙希尔·U·赛义德、马修·J·克拉克森、胡一鹏
arXiv 2023年。[论文] [GitHub]
2023年3月10日

MaskDiff：利用扩散概率模型建模掩码分布以实现少样本实例分割
黎明权、阮氏谭、黎仲义、杜清端、杜明宁、陈明哲
arXiv 2023年。[论文]
2023年3月9日

基于文本到图像扩散模型的开放词汇全景分割
徐家瑞、刘思飞、阿拉什·瓦赫达特、卞元民、王晓龙、莎莉妮·德梅洛
arXiv 2023年。[论文] [项目]
2023年3月8日

MedSegDiff-V2：基于Transformer的扩散医学图像分割
吴俊德、傅饶、方慧慧、张宇、许燕武
arXiv 2023年。[论文]
2023年1月19日

DiffusionInst：用于实例分割的扩散模型
顾轩宣、陈浩星、徐卓尔、兰军、孟昌华、王伟强
arXiv 2022年。[论文] [GitHub]
2022年12月6日

利用递归噪声扩散从航拍图像进行多类别分割
本尼迪克特·科尔拜因松、克里斯蒂安·米科瓦伊奇克
arXiv 2022年。[论文]
2022年12月1日

Peekaboo：文本到图像扩散模型是零样本分割器
瑞安·伯格特、坎查娜·拉纳辛格、李翔、迈克尔·S·柳
arXiv 2022年。[论文]
2022年11月23日

利用深度生成网络进行亚型平衡以改进HER2肿瘤分割
马蒂亚斯·厄特尔、雅娜·莫尼乌斯、马蒂亚斯·吕布纳、卡罗尔·I·盖珀特、邱静娜、弗劳克·维尔姆、阿恩特·哈特曼、马蒂亚斯·W·贝克曼、彼得·A·法辛、安德烈亚斯·迈尔、拉莫娜·埃尔伯、卡塔琳娜·布赖宁格
arXiv 2022年。[论文]
2022年11月11日

MedSegDiff：基于扩散概率模型的医学图像分割
吴俊德、方慧慧、张宇、杨业辉、许燕武
arXiv 2022年。[论文]
2022年11月1日

通过预分割扩散采样加速医学图像分割中的扩散模型
郭旭涛、杨燕武、叶晨菲、尚陆、向阳、马婷
arXiv 2022年。[论文]
2022年10月27日

基于解剖学约束的CT图像转换用于异质性血管分割
吉安马尔科·拉巴贝拉、海瑟姆·布赛德、弗朗切斯科·马索、萨宾·萨尔纳基、劳伦斯·鲁埃、皮耶特罗·戈里、伊莎贝尔·布洛赫
BMVC 2022。[论文]
2022年10月4日

用于自监督血管分割的扩散对抗性表征学习
金宝河、吴有珍、叶钟哲
arXiv 2022年。[论文]
2022年9月29日

是否可以用完全合成的数据训练分割模型？
弗吉尼亚·费尔南德斯、沃尔特·雨果·洛佩斯·皮纳亚、佩德罗·博尔赫斯、彼特鲁-丹尼尔·图多修、马克·S·格雷厄姆、汤姆·韦尔考特伦、M·豪尔赫·卡多索
arXiv 2022年。[论文]
2022年9月17日

让我们架起桥梁：理解与扩展扩散生成模型
刘兴超、吴乐萌、叶茂、刘强
arXiv 2022年。[论文]
2022年8月31日

基于扩散模型的语义图像合成
王伟伦、鲍建敏、周文刚、陈冬冬、陈东、袁璐、李厚强
arXiv 2022年。[论文]
2022年6月30日

利用去噪扩散概率模型进行遥感变化检测（分割）
韦莱·格达拉·查敏达·班达拉、尼廷·戈帕克里希南·奈尔、维沙尔·M·帕特尔
arXiv 2022年。[论文] [GitHub]
2022年6月23日

扩散模型作为即插即用先验
亚历山德罗斯·格莱科斯、尼古拉·马尔金、内博伊沙·约伊奇、季米特里斯·萨马拉斯
arXiv 2022年。[论文]
2022年6月17日

利用扩散模型快速进行无监督脑部异常检测与分割
沃尔特·H·L·皮纳亚、马克·S·格雷厄姆、罗伯特·格雷、佩德罗·F·达科斯塔、彼特鲁-丹尼尔·图多修、保罗·赖特、易·H·马赫、安德鲁·D·麦金农、詹姆斯·T·特奥、罗尔夫·雅格尔、大卫·韦林、杰兰特·里斯、帕拉什凯夫·纳切夫、塞巴斯蒂安·乌尔塞林、M·豪尔赫·卡多索
MICCAI 2022。[论文]
2022年6月7日

用于语义分割的解码器去噪预训练
埃曼努埃尔·布雷蒙格·阿西杜、西蒙·科恩布利特、陈婷、尼基·帕尔马尔、马蒂亚斯·明德勒、穆罕默德·诺鲁齐
arXiv 2022年。[论文]
2022年5月23日

用于隐式图像分割集成的扩散模型
朱莉娅·沃勒布、罗宾·桑德库勒、弗洛伦丁·比德尔、菲利普·瓦尔马吉亚、菲利普·C·卡坦
MIDL 2021。[论文]
2021年12月6日

基于扩散模型的标签高效语义分割
德米特里·巴拉丘克、伊万·鲁巴切夫、安德烈·沃伊诺夫、瓦伦丁·赫鲁尔科夫、阿廖姆·巴班科
ICLR 2021。[论文] [GitHub]
2021年12月6日

SegDiff：基于扩散概率模型的图像分割
托梅尔·阿米特、埃利亚·纳赫马尼、塔尔·沙哈尔巴尼、利奥尔·沃尔夫
arXiv 2021。[论文]
2021年12月1日

Argmax 流与多项式扩散：学习分类分布
埃米尔·霍格博姆、迪德里克·尼尔森、普里扬克·贾尼、帕特里克·福雷、马克斯·韦林
NeurIPS 2021。[论文]
2021年2月10日

图像转换

潜在扩散反事实解释
卡里姆·法里德、西蒙·施罗迪、马克思·阿古斯、托马斯·布罗克斯
arXiv 2023。[论文]
2023年10月10日

基于相位内容融合扩散模型与方向分布一致性的少样本模型适配
胡腾、张江宁、刘亮、易然、寇思琪、朱浩坤、陈旭、王亚彪、王成杰、马立壮
ICCV 2023。[论文]
2023年9月7日

潜画家
苏世杰
arXiv 2023。[论文]
2023年8月31日

基于扩散模型的零样本反转过程用于图像属性编辑
冯占波、凌泽南、龚赐、周峰、李杰、罗伯特·C·邱
arXiv 2023。[论文]
2023年8月30日

DiffI2I：高效的图像到图像转换扩散模型
夏斌、张宇伦、王世银、王一彤、吴兴隆、田亚鹏、杨文明、拉杜·蒂莫特费、卢克·范古尔
arXiv 2023。[论文]
2023年8月26日

SSMG：空间-语义地图引导的自由形式布局到图像生成扩散模型
贾承友、罗敏楠、党卓航、戴广、常晓军、王梦梦、王京东
arXiv 2023。[论文]
2023年8月20日

MeDM：具有时间对应指导的中介图像扩散模型，用于视频到视频的转换
厄尼·楚、黄祖轩、林硕延、陈俊诚
arXiv 2023。[论文] [项目]
2023年8月19日

风格扩散：通过扩散模型实现可控的解耦风格迁移
王志忠、赵磊、邢伟
arXiv 2023。[论文]
2023年8月15日

逆向逆向：基于示例的素描到照片合成，无需训练即可通过随机微分方程实现
邢锡明、王闯、周海涛、胡志豪、李崇轩、徐东、于倩
arXiv 2023。[论文]
2023年8月15日

利用外观流驾驭扩散模型的力量，实现高质量虚拟试穿
苟俊宏、孙思宇、张建富、司建楼、钱晨、张丽清
ACM MM 2023。[论文]
2023年8月11日

去噪扩散模型中的头部旋转
安德烈亚·阿斯佩尔蒂、加布里埃莱·科拉苏翁诺、安东尼奥·格拉
arXiv 2023。[论文]
2023年8月11日

基于潜在扩散模型的真实感且保留身份的图像情感操控
伊万尼斯·皮库利斯、帕纳约蒂斯·P·菲尔恩提西斯、彼得罗斯·马拉戈斯
arXiv 2023。[论文]
2023年8月6日

SDDM：基于流形上的分数分解扩散模型，用于无配对图像到图像的转换
孙士坤、魏龙辉、邢俊良、贾佳、田琦
ICML 2023。[论文]
2023年8月4日

使用扩散模型在图像之间进行插值
王健君、波琳娜·戈兰德
ICML 研讨会 2023。[论文] [项目] [GitHub]
2023年7月24日

TF-ICON：基于扩散的免训练跨域图像合成
陆诗琳、刘燕竹、康永健
ICCV 2023。[论文] [GitHub]
2023年7月24日

DiffuseGAE：从解耦表示中实现可控且高保真的图像操控
冷毅鹏、黄强娟、王志远、刘阳阳、张浩宇
arXiv 2023。[论文]
2023年7月12日

DIFF-NST：用于可变形神经风格迁移的扩散交织
丹·鲁塔、杰玛·卡内特·塔雷斯、安德鲁·吉尔伯特、埃利·谢赫特曼、尼古拉斯·科尔金、约翰·科洛莫斯塞
arXiv 2023。[论文]
2023年7月9日

使用扩散模型进行局部控制的颜色调色板应用
瓦伊巴夫·瓦维拉拉、大卫·福赛思
arXiv 2023。[论文]
2023年7月6日

DragonDiffusion：在扩散模型上实现拖拽式操控
丛茂、王新涛、宋继冲、山英、张健
arXiv 2023。[论文] [项目]
2023年7月5日

DragDiffusion：利用扩散模型进行交互式基于点的图像编辑
石宇俊、薛楚晖、潘家春、张文庆、谭文义、白松
arXiv 2023。[论文]
2023年6月26日

ArtFusion：使用双重条件潜在扩散模型实现可控的任意风格迁移
陈达仁
arXiv 2023。[论文] [GitHub]
2023年6月15日

InfoDiffusion：利用信息最大化扩散模型进行表征学习
王英恒、亚伊尔·希夫、亚伦·戈卡斯兰、潘伟申、王飞、克里斯托弗·德萨、沃洛迪米尔·库列绍夫
ICML 2023。[论文]
2023年6月14日

TryOnDiffusion：两个 UNet 的故事
朱路洋、杨大伟、泰勒·朱、菲茨姆·雷达、威廉·陈、萨哈里亚·奇特万、穆罕默德·诺鲁齐、伊拉·凯梅尔马赫尔-施利策曼
CVPR 2023。[论文]
2023年6月14日

利用非对称梯度指导改进基于扩散的图像转换
权基贤、叶宗哲
arXiv 2023。[论文]
2023年6月7日

DiffSketching：基于扩散模型的草图控制图像合成
王强、孔迪、林凤音、齐永刚
arXiv 2023。[论文]
2023年5月30日

通过对齐扩散反演链实现真实世界图像变化
张月晨、邢金波、埃里克·洛、贾佳亚
arXiv 2023年。[论文]
2023年5月30日

Photoswap：图像中的个性化主体替换
顾静、王怡琳、赵楠轩、傅祖睿、熊伟、刘青、张志飞、张鹤、张建明、郑贤俊、王新埃里克
arXiv 2023年。[论文] [项目]
2023年5月29日

利用自动扩散增强技术丰富您的视觉数据集
丽莎·邓拉普、艾莉莎·宇野、张翰、杨杰志、约瑟夫·E·冈萨雷斯、特雷弗·达雷尔
arXiv 2023年。[论文] [GitHub]
2023年5月25日

基于神经薛定谔桥的非配对图像到图像转换
金宝洙、权基贤、金宽永、叶宗哲
arXiv 2023年。[论文] [GitHub]
2023年5月24日

受热力学启发的网络用于合成孔径雷达到光学图像的转换
张明进、徐嘉敏、何成宇、商文腾、李云松、高信博
arXiv 2023年。[论文]
2023年5月23日

扩散模型中的空文本引导其实是一位卡通风格创作者
赵晶、郑和亮、王超悦、兰龙、黄万荣、杨文静
arXiv 2023年。[论文] [项目] [GitHub]
2023年5月11日

利用丰富提示进行零样本图像转换的扩散模型再生成学习
林宇培、张森、杨晓军、王肖、史玉凯
arXiv 2023年。[论文] [项目]
2023年5月8日

层次化扩散自编码器与解耦图像操控
陆泽宇、吴承悦、陈欣远、王耀辉、乔宇、刘熙晖
arXiv 2023年。[论文]
2023年4月24日

DiffusionRig：用于人脸外观编辑的个性化先验学习
丁征、张宣儿、夏志浩、拉尔斯·耶贝、涂卓文、张秀明
CVPR 2023年。[论文] [项目] [GitHub]
2023年4月13日

基于属性引导的扩散模型进行人脸动画
曾博文、刘旭辉、高思诚、刘博宇、李宏、刘建庄、张宝昌
arXiv 2023年。[论文]
2023年4月6日

基于草图的参考图像合成：结构感知扩散模型的应用
金康烈、朴成贤、李俊洙、秋在国
arXiv 2023年。[论文]
2023年3月31日

扩散模型中h空间涌现的免训练风格迁移
郑在锡、权珉奇、禹英贞
arXiv 2023年。[论文] [项目] [GitHub]
2023年3月27日

基于扩散的目标采样器用于无监督域适应
张宇龙、陈书豪、张宇、陆江刚
arXiv 2023年。[论文]
2023年3月17日

StyO：仅需一次即可为您的面部风格化
李博南、张子程、聂学成、韩聪颖、胡银涵、郭天德
arXiv 2023年。[论文]
2023年3月6日

DiffFashion：基于参考的时尚设计——扩散模型的结构感知迁移
曹世东、柴文浩、郝圣宇、张艳婷、陈航越、王高昂
arXiv 2023年。[论文]
2023年2月14日

I2SB：图像到图像的薛定谔桥
刘冠宏、阿拉什·瓦赫达特、黄德安、埃万格洛斯·A·西奥多鲁、聂伟力、阿尼玛·阿南德库马尔
arXiv 2023年。[论文] [项目]
2023年2月12日

通过互信息引导的随机扩散实现零样本跨模态数据转换
王子浩、杨英宇、马克西姆·塞尔梅桑、埃尔韦·德林热特、欧娜·吴
arXiv 2023年。[论文]
2023年1月31日

DiffFace：基于扩散的人脸交换——结合面部指导
金基洪、金允浩、赵锡柱、徐俊英、南智秀、李奎哲、金承龙、李光熙
arXiv 2022年。[论文] [项目]
2022年12月27日

HS-Diffusion：学习语义引导的扩散模型用于头部交换
王庆河、刘丽洁、华淼、何倩、朱鹏飞、曹冰、胡庆华
arXiv 2022年。[论文]
2022年12月13日

基于反演的扩散模型创意迁移
张宇鑫、黄妮莎、唐凡、黄海斌、马崇阳、董伟明、许昌盛
CVPR 2023年。[论文] [GitHub]
2022年11月23日

基于去噪扩散模型的人物图像合成
安坎·库马尔·布尼亚、萨尔曼·汗、希沙姆·乔拉卡尔、拉奥·穆罕默德·安维尔、约尔马·拉科宁、穆巴拉克·沙赫、法哈德·沙赫巴兹·汗
arXiv 2022年。[论文]
2022年11月22日

统一扩散模型的潜在空间及其在循环扩散和指导中的应用
吴亨利、费尔南多·德拉托雷
arXiv 2022年。[论文] [GitHub-1] [GitHub-2]
2022年10月11日

基于解剖约束的CT图像转换用于异质性血管分割
贾马尔科·拉巴贝拉、海瑟姆·布赛德、弗朗切斯科·马索、萨宾·萨尔纳基、劳伦斯·鲁埃、皮耶特罗·戈里、伊莎贝尔·布洛赫
BMVC 2022年。[论文]
2022年10月4日

基于解耦风格与内容表征的扩散图像转换
权基贤、叶宗哲
arXiv 2022年。[论文]
2022年9月30日

MIDMs：匹配交错扩散模型用于基于示例的图像转换
徐俊英、李圭成、赵锡柱、李智英、金承龙
arXiv 2022年。[论文] [项目]
2022年9月22日

利用基于补丁的去噪扩散模型在恶劣天气条件下恢复视觉
奥赞·厄兹德尼兹吉、罗伯特·莱根斯坦
arXiv 2022年。[论文]
2022年7月29日

非均匀扩散模型
乔治奥斯·巴佐利斯、扬·斯坦丘克、卡罗拉-比比安·舍恩利布、克里斯蒂安·埃特曼
arXiv 2022年。[论文]
2022年7月20日

基于对抗扩散模型的无监督医学图像转换
穆扎费尔·厄兹贝伊、萨尔曼·U·H·达尔、哈桑·A·贝德尔、奥纳特·达尔马兹、沙班·厄兹图尔克、阿尔珀·京格尔、托尔加·丘库尔
arXiv 2022年。[论文]
2022年7月17日

EGSDE：基于能量引导随机微分方程的非配对图像到图像转换
赵敏、鲍帆、李崇轩、朱俊
arXiv 2022年。[论文]
2022年7月14日

用于跨模态和条件生成的离散对比扩散模型
朱叶、吴宇、凯尔·奥尔谢夫斯基、任健、谢尔盖·图利亚科夫、严燕
arXiv 2022年。[论文] [GitHub]
2022年6月15日

预训练是图像到图像转换的全部需求
王腾飞、张婷、张博、欧阳浩、陈东、陈启峰、文芳
arXiv 2022年。[论文] [项目] [GitHub]
2022年5月25日

VQBB：基于向量量化布朗桥的图像到图像转换
李博、薛凯涛、刘斌、赖宇坤
arXiv 2022年。[论文]
2022年5月16日

图像到图像转换的瑞士军刀：多任务扩散模型
朱莉娅·沃勒布、罗宾·桑德库勒、弗洛伦丁·比德尔、菲利普·C·卡廷
arXiv 2022年。[论文]
2022年4月6日

用于图像到图像转换的双重扩散隐式桥梁
苏璇、宋嘉明、孟晨琳、斯特凡诺·埃尔蒙
arXiv 2022年。[论文]
2022年3月16日

去噪扩散修复模型
巴哈贾特·卡瓦尔、迈克尔·埃拉德、斯特凡诺·埃尔蒙、宋嘉明
NeurIPS 2022。[论文]
2022年1月27日

DiffuseMorph：利用扩散模型在连续轨迹上进行无监督可变形图像配准
金宝河、韩仁华、叶宗哲
arXiv 2021年。[论文]
2021年12月9日

扩散自编码器：迈向有意义且可解码的表征
孔帕特·普里查库尔、纳塔纳特·恰提、苏提萨克·维扎德翁萨、苏帕索恩·苏瓦贾纳科恩
arXiv 2021年。[论文] [项目]
2021年12月30日

基于分数函数的扩散模型的条件图像生成
乔治奥斯·巴佐利斯、扬·斯坦丘克、卡罗拉-比比安妮·舍恩利布、克里斯蒂安·埃特曼
arXiv 2021年。[论文]
2021年11月26日

ILVR：去噪扩散概率模型的条件化方法
崔柱荣、金成元、郑容贤、权英俊、尹成路
ICCV 2021（口头报告）。[论文] [GitHub]
2021年8月6日

UNIT-DDPM：基于去噪扩散概率模型的非配对图像转换
佐佐木博史、克里斯·G·威尔科克斯、托比·P·布雷肯
arXiv 2021年。[论文]
2021年4月12日

反问题

EDiffSR：用于遥感图像超分辨率的有效扩散概率模型
肖毅、袁强强、蒋奎、何江、金先宇、张良培
arXiv 2023年。[论文]
2023年10月30日

面向低光照图像增强的全局结构感知扩散过程
侯锦辉、朱志宇、侯俊辉、刘辉、曾焕强、袁辉
arXiv 2023年。[论文]
2023年10月26日

从后验采样到图像修复中的有意义多样性
诺亚·科恩、希拉·马诺尔、尤瓦尔·巴哈特、托梅尔·米哈伊利
arXiv 2023年。[论文]
2023年10月24日

扩散模型辅助的密度估计生成模型监督学习
刘艳芳、杨茗蕾、张泽中、鲍峰、曹彦钊、张冠楠
arXiv 2023年。[论文]
2023年10月22日

基于仿射卷积网络的高质量三维人脸重建
林志谦、林江科、李林成、袁义、邹正霞
arXiv 2023年。[论文]
2023年10月22日

通过潜在扩散进行图像超分辨率：采样空间专家混合与频率增强解码器方法
罗峰、项金喜、张俊、韩晓、杨伟
arXiv 2023年。[论文]
2023年10月18日

迈向在超低比特率下实现完美真实感的图像压缩
玛琳·卡雷伊、马修·J·马基利、雅各布·韦尔贝克、斯蒂芬·拉图利耶
arXiv 2023年。[论文]
2023年10月16日

AutoDIR：基于潜在扩散的全自动一体化图像修复
姜一彤、张兆阳、薛天凡、顾金伟
arXiv 2023年。[论文]
2023年10月16日

探索用于人脸变形的扩散自编码器设计空间
赞德·布莱辛格姆、刘晨
arXiv 2023年。[论文]
2023年10月14日

基于扩散模型的低剂量CT迭代重建及扩散先验正则化
夏文军、石勇毅、牛创、丛文祥、王戈
arXiv 2023年。[论文]
2023年10月10日

SMRD：基于SURE的鲁棒MRI重建，结合扩散模型
巴图·厄兹图尔克勒、刘超、本杰明·埃克哈特、莫特扎·马尔达尼、宋嘉明、扬·考茨
MICCAI 2023。[论文] [GitHub]
2023年10月3日

条件扩散蒸馏
梅康福、毛里西奥·德尔布拉西奥、侯赛因·塔莱比、涂正中、维沙尔·M·帕特尔、佩曼·米兰法尔
arXiv 2023年。[论文]
2023年10月2日

CommIN：作为反问题的语义图像通信，基于INN引导的扩散模型
陈家康、游迪、代尼兹·居恩杜兹、皮埃尔·路易吉·德拉戈蒂
arXiv 2023年。[论文]
2023年10月2日

针对反问题的提示调优潜在扩散模型
郑炯镇、叶宗哲、佩曼·米兰法尔、毛里西奥·德尔布拉西奥
arXiv 2023年。[论文]
2023年10月2日

引导扩散：一种通用的即插即用条件图像合成框架
尼廷·戈帕克里希南·奈尔、阿努普·切里安、苏哈斯·洛希特、王晔、小池晃明、维沙尔·M·帕特尔、蒂姆·K·马克斯
ICCV 2023。[论文]
2023年9月30日

从触觉生成视觉场景
杨丰宇、张佳诚、安德鲁·欧文斯
ICCV 2023。[论文] [项目]
2023年9月26日

用于高分辨率低光照图像增强的自举扩散模型曲线估计
黄建诚、刘一凡、陈世峰
arXiv 2023年。[论文]
2023年9月26日

用于半监督多域翻译的扩散模型中的多重噪声
Tsiry Mayet、Simon Bernard、Clement Chatelain、Romain Herault
arXiv 2023年。[论文]
2023年9月25日

用于无监督域适应的领域引导条件扩散模型
Yulong Zhang、Shuhao Chen、Weisen Jiang、Yu Zhang、Jiangang Lu、James T. Kwok
arXiv 2023年。[论文]
2023年9月23日

基于扩散模型的车牌超分辨率
Sawsan AlHalawani、Bilel Benjdira、Adel Ammar、Anis Koubaa、Anas M. Ali
arXiv 2023年。[论文]
2023年9月21日

去阴影一切：当Segment Anything模型遇上零样本去阴影
Xiao Feng Zhang、Tian Yi Song、Jia Wei Yao
arXiv 2023年。[论文]
2023年9月21日

基于扩散编辑的人脸老化
Xiangyi Chen、Stéphane Lathuilière
arXiv 2023年。[论文]
2023年9月20日

PGDiff：通过部分引导实现多功能人脸修复的扩散模型指导方法
Peiqing Yang、Shangchen Zhou、Qingyi Tao、Chen Change Loy
NeurIPS 2023。[论文] [GitHub]
2023年9月19日

用于细节保留图像去噪的重建与生成扩散模型
Yujin Wang、Lingen Li、Tianfan Xue、Jinwei Gu
arXiv 2023年。[论文]
2023年9月19日

Gradpaint：基于梯度引导的扩散模型修复
Asya Grechka、Guillaume Couairon、Matthieu Cord
arXiv 2023年。[论文]
2023年9月18日

AdBooster：利用稳定扩散外延生成个性化广告创意
Veronika Shilova、Ludovic Dos Santos、Flavian Vasile、Gaëtan Racic、Ugo Tanielian
arXiv 2023年。[论文]
2023年9月8日

基于Transformer的扩散模型结合非均匀采样跳跃策略的水下图像增强
Yi Tang、Takafumi Iwaguchi、Hiroshi Kawasaki
ACM MM 2023。[论文] [GitHub]
2023年9月7日

使用代理分数基先验的高效贝叶斯计算成像
Berthy T. Feng、Katherine L. Bouman
arXiv 2023年。[论文]
2023年9月5日

具有领域条件先验指导的扩散建模，用于加速MRI和qMRI重建
Wanyu Bian、Albert Jang、Fang Liu
arXiv 2023年。[论文]
2023年9月2日

针对高度欠采样MRI重建的相关性和多频扩散建模
Yu Guan、Chuanming Yu、Shiyu Lu、Zhuoxu Cui、Dong Liang、Qiegen Liu
arXiv 2023年。[论文] [GitHub]
2023年9月2日

快速扩散EM：一种用于盲逆问题的扩散模型，应用于反卷积
Charles Laroche、Andrés Almansa、Eva Coupete
arXiv 2023年。[论文] [GitHub]
2023年9月1日

通过在双域中插入扩散先验实现无监督CT金属伪影去除
Xuan Liu、Yaoqin Xie、Songhui Diao、Shan Tan、Xiaokun Liang
arXiv 2023年。[论文]
2023年8月31日

用于稀疏视角CT重建的分阶段小波优化精炼扩散模型
Kai Xu、Shiyu Lu、Bin Huang、Weiwen Wu、Qiegen Liu
arXiv 2023年。[论文]
2023年8月30日

物理信息驱动的DeepMRI：从热扩散到k空间插值的桥梁
Zhuo-Xu Cui、Congcong Liu、Xiaohong Fan、Chentao Cao、Jing Cheng、Qingyong Zhu、Yuanyuan Liu、Sen Jia、Yihang Zhou、Haifeng Wang、Yanjie Zhu、Jianping Zhang、Qiegen Liu、Dong Liang
arXiv 2023年。[论文]
2023年8月30日

DiffBIR：迈向基于生成式扩散先验的盲图像修复
Xinqi Lin、Jingwen He、Ziyan Chen、Zhaoyang Lyu、Ben Fei、Bo Dai、Wanli Ouyang、Yu Qiao、Chao Dong
arXiv 2023年。[论文] [GitHub]
2023年8月29日

像素感知稳定扩散用于真实感图像超分辨率和个性化风格化
Tao Yang、Peiran Ren、Xuansong Xie、Lei Zhang
AAAI 2024。[论文]
2023年8月28日

用于稳定超稀疏视角CT重建的数据迭代优化分数模型
Weiwen Wu、Yanyang Wang
arXiv 2023年。[论文]
2023年8月28日

残差去噪扩散模型
Jiawei Liu、Qiang Wang、Huijie Fan、Yinong Wang、Yandong Tang、Liangqiong Qu
arXiv 2023年。[论文] [GitHub]
2023年8月25日

Diff-Retinex：用生成式扩散模型重新思考低光照图像增强
Xunpeng Yi、Han Xu、Hao Zhang、Linfeng Tang、Jiayi Ma
ICCV 2023。[论文]
2023年8月25日

利用高效扩散去噪概率模型从低剂量PET合成全剂量PET
Shaoyan Pan、Elham Abouei、Junbo Peng、Joshua Qian、Jacob F Wynne、Tonghe Wang、Chih-Wei Chang、Justin Roper、Jonathon A Nye、Hui Mao、Xiaofeng Yang
arXiv 2023年。[论文]
2023年8月24日

InverseSR：使用潜在扩散模型进行3D脑部MRI超分辨率
Jueqi Wang、Jacob Levman、Walter Hugo Lopez Pinaya、Petru-Daniel Tudosiu、M. Jorge Cardoso、Razvan Marinescu
MICCAI 2023。[论文] [GitHub]
2023年8月23日

基于扩散模型的高质量图像去雾
Hu Yu、Jie Huang、Kaiwen Zheng、Man Zhou、Feng Zhao
arXiv 2023年。[论文]
2023年8月23日

用于真实场景去雾的频率补偿扩散模型
Jing Wang、Songtao Wu、Kuanhong Xu、Zhiqiang Yuan
arXiv 2023年。[论文]
2023年8月21日

具有辅助指导的对比扩散模型，用于粗粒度到细粒度的PET重建
Zeyu Han、Yuhan Wang、Luping Zhou、Peng Wang、Binyu Yan、Jiliu Zhou、Yan Wang、Dinggang Shen
MICCAI 2023。[论文] [GitHub]
2023年8月20日

DiffLLE：用于无监督低光照图像增强的扩散引导域校准
Shuzhou Yang、Xuanyu Zhang、Yinhuai Wang、Jiwen Yu、Yuhan Wang、Jian Zhang
arXiv 2023年。[论文]
2023年8月18日

用于图像修复的粗细结合扩散Transformer学习
王丽燕、杨钦宇、王聪、王伟、潘金山、苏志勋
arXiv 2023年。[论文]
2023年8月17日

蒙特卡洛引导的贝叶斯线性反问题扩散模型
加布里埃尔·卡多索、亚齐德·贾纳蒂·伊德里西、西尔万·勒科夫、埃里克·穆兰
arXiv 2023年。[论文]
2023年8月15日

视觉皮层的几何结构及其在图像修复与增强中的应用
弗朗切斯科·巴莱林、埃尔伦德·格隆格
arXiv 2023年。[论文] [GitHub]
2023年8月15日

YODA：仅扩散区域——一种基于区域掩码的扩散方法用于图像超分辨率
布莱恩·B·莫瑟、斯坦尼斯拉夫·弗罗洛夫、费德里科·劳厄、塞巴斯蒂安·帕拉西奥、安德烈亚斯·登格尔
arXiv 2023年。[论文]
2023年8月15日

TextDiff：基于掩码引导的残差扩散模型用于场景文本图像超分辨率
刘宝林、杨宗源、王鹏飞、周俊杰、刘子琪、宋子怡、刘妍、熊永平
AAAI 2024。[论文]
2023年8月13日

CLE Diffusion：可控光照增强扩散模型
殷雨阳、徐德佳、谭创创、刘平、赵瑶、魏云超
arXiv 2023年。[论文] [项目] [GitHub]
2023年8月13日

稀疏标注下的扩散增强深度预测
李佳琪、王一然、黄子豪、郑景宏、冼可、曹志国、张建明
arXiv 2023年。[论文]
2023年8月4日

基于扩散模型的绘画风格图像和谐化
陆凌霄、李江通、曹俊彦、牛莉、张立青
arXiv 2023年。[论文]
2023年8月4日

基于扩散模型的无参考各向同性三维电子显微镜重建
李京润、郑元基
arXiv 2023年。[论文]
2023年8月3日

用于MRI重建的傅里叶约束扩散桥梁学习
穆罕默德·U·米尔扎、奥纳特·达尔马兹、哈桑·A·贝德尔、戈克贝尔克·埃尔马斯、耶尔马兹·科尔克马兹、阿尔珀·贡古尔、萨尔曼·UH·达尔、托尔加·丘库尔
arXiv 2023年。[论文]
2023年8月2日

基于去噪扩散恢复模型的超声图像重建
张宇欣、克莱芒·于诺、热罗姆·伊迪耶、黛安娜·马特乌斯
MICCAI研讨会2023年。[论文] [GitHub]
2023年7月29日

LLDiffusion：在扩散模型中学习退化表征以用于低光图像增强
王涛、张凯浩、邵子谦、罗文翰、比约恩·斯滕格、金泰均、刘伟、李洪东
arXiv 2023年。[论文]
2023年7月27日

利用扩散概率模型修复组织学图像中的伪影
何振奇、何俊俊、叶进、沈义清
arXiv 2023年。[论文] [GitHub]
2023年7月26日

ResShift：通过残差移位实现高效图像超分辨率的扩散模型
岳宗生、王建毅、陈昌礼
arXiv 2023年。[论文] [GitHub]
2023年7月23日

基于潜在扩散模型的迭代重建用于稀疏数据重构
何林超、严鸿宇、罗梦婷、罗坤明、王旺、杜文超、陈虎、杨鸿宇、张毅
arXiv 2023年。[论文]
2023年7月22日

PartDiff：基于部分扩散模型的图像超分辨率
赵凯、凌宇恒、庞凯峰、郑浩鑫、成庆贤
arXiv 2023年。[论文]
2023年7月21日

基于参考的绘画风格图像修复：跨越野生参考域差距
徐德佳、许兴谦、丛文燕、休谟里·史密斯、王章洋
arXiv 2023年。[论文] [项目]
2023年7月20日

AnyDoor：零样本对象级图像定制
陈曦、黄良华、刘宇、沈宇君、赵德利、赵恒爽
arXiv 2023年。[论文] [项目]
2023年7月18日

通过迭代扩散模型及更进一步实现真实人脸修复
赵阳、侯廷博、苏宇川、贾旭辉、李延东、马蒂亚斯·格鲁德曼
ICCV 2023。[论文]
2023年7月18日

潜在空间中的流匹配
权道、郝丰、彬阮、英陈
arXiv 2023年。[论文] [项目]
2023年7月17日

通过潜在扩散模型实现保留身份的人脸老化
苏迪普塔·班纳吉、戈文德·米塔尔、阿梅亚·乔希、钦迈·赫格德、纳西尔·梅蒙
IJCB 2023。[论文]
2023年7月17日

通过硬数据一致性利用潜在扩散模型求解反问题
宋博文、权秀敏、张泽诚、胡新宇、屈青、沈丽悦
arXiv 2023年。[论文]
2023年7月16日

ExposureDiffusion：学习曝光以增强低光图像
王宇飞、余易、杨文瀚、郭兰青、周立培、柯亚历克斯、温碧涵
arXiv 2023年。[论文]
2023年7月15日

DDGM：通过基于梯度的最小化过程中的扩散去噪来解决反问题
凯尔·路德、H·塞巴斯蒂安·升
arXiv 2023年。[论文]
2023年7月11日

通过自适应嵌入与集成技术刺激扩散模型进行图像去噪
李彤、冯汉森、王立志、熊志伟、黄华
arXiv 2023年。[论文]
2023年7月8日

IPO-LDM：基于潜在扩散模型的深度辅助360度室内RGB全景图外扩
吴天昊、郑传霞、詹达珍
arXiv 2023年。[论文] [GitHub]
2023年7月6日

使用条件扩散将单张LDR图像转换为HDR图像
德维普·达拉尔、高塔姆·瓦希什塔、普拉杰瓦尔·辛格、尚穆加纳坦·拉曼
arXiv 2023年。[论文]
2023年7月6日

ACDMSR：加速的单幅图像超分辨率条件扩散模型
牛阿喜、范春中、张康、孙金秋、朱宇、权仁素、张燕宁
arXiv 2023年。[论文]
2023年7月3日

LEDITS：利用DDPM反演与语义指导进行真实图像编辑
利诺伊·察班、阿波利纳里奥·帕索斯
arXiv 2023年。[论文]
2023年7月2日

通过潜在扩散模型的后验采样可证明地求解线性逆问题
利图·劳特、内金·拉乌夫、扬尼斯·达拉斯、康斯坦丁·卡拉马尼斯、亚历山德罗斯·G·迪马基斯、桑杰·沙科泰
arXiv 2023年。[论文] [GitHub]
2023年7月2日

用于无监督AS-OCT图像去斑的保内容扩散模型
李三谦、东田里纱、傅华柱、李恒、牛静轩、刘江
arXiv 2023年。[论文]
2023年6月30日

基于展开式扩散模型的自监督MRI重建
尤尔马兹·科尔克马兹、托尔加·丘库尔、维沙尔·帕特尔
arXiv 2023年。[论文]
2023年6月29日

SVNR：基于去噪扩散的空间变噪声去除
娜阿玛·珀尔、亚伦·布罗德斯基、达娜·伯曼、阿萨夫·佐梅特、亚历克斯·拉夫·阿查、丹尼尔·科恩-奥尔、丹尼·利希金斯基
arXiv 2023年。[论文]
2023年6月28日

缓解基于分数的扩散模型中的色彩偏移
凯瑟琳·德克、托比亚斯·比绍夫
arXiv 2023年。[论文]
2023年6月27日

基于扩散模型的航天卫星低光照图像增强
朱一满、王璐、袁静怡、郭宇
arXiv 2023年。[论文]
2023年6月25日

DiffInfinite：通过组织病理学中的并行随机补丁扩散进行大尺寸掩膜图像合成
马可·阿韦尔萨、加布里埃尔·诺比斯、米里亚姆·海格勒、凯·斯坦德沃斯、米哈埃拉·奇里卡、罗德里克·默里-史密斯、艾哈迈德·阿拉、卢卡斯·鲁夫、丹妮拉·伊万诺娃、沃伊切赫·萨梅克、弗雷德里克·克劳申、布鲁诺·桑吉内蒂、路易斯·奥阿拉
arXiv 2023年。[论文]
2023年6月23日

基于扩散的随机再生模型用于风噪降低
让-玛丽·勒梅西耶、约阿希姆·蒂曼、拉斐尔·科宁、蒂莫·格尔克曼
arXiv 2023年。[论文]
2023年6月22日

DiffuseIR：用于三维显微图像各向同性重建的扩散模型
潘明杰、甘雨露、周方旭、刘嘉铭、王爱民、张尚航、李大伟
arXiv 2023年。[论文]
2023年6月21日

HSR-Diff：基于条件扩散模型的高光谱图像超分辨率
吴婵悦、王栋、毛涵宇、李颖
arXiv 2023年。[论文]
2023年6月21日

带前向模型的扩散：无需直接监督即可求解随机逆问题
阿尤什·特瓦里、尹天威、乔治·卡泽纳韦特、塞蒙·雷奇科夫、乔舒亚·B·特南鲍姆、弗雷多·杜兰、威廉·T·弗里曼、文森特·西茨曼
arXiv 2023年。[论文]
2023年6月20日

利用扩散概率模型进行深度超声去噪
霍贾特·阿斯加里安德霍尔迪、索班·古达尔齐、阿德里安·巴萨拉布、哈桑·里瓦兹
arXiv 2023年。[论文]
2023年6月12日

迈向物理场景的视觉基础模型
切坦·帕拉梅什瓦拉、亚历山德罗·阿基莱、马修·特格、李晓龙、莫佳伟、马修·特格、阿什温·斯瓦米纳坦、CJ·泰勒、迪拉·文卡特拉曼、费晓晗、斯特凡诺·索阿托
arXiv 2023年。[论文]
2023年6月6日

INDigo：一种由INN引导的用于逆问题的概率扩散算法
游迪、安德烈亚斯·弗洛罗斯、皮埃尔·路易吉·德拉戈蒂
arXiv 2023年。[论文]
2023年6月5日

扩散模型在光流和单目深度估计中的惊人有效性
索拉布·萨克赛纳、查尔斯·赫尔曼、许俊华、阿比谢克·卡尔、穆罕默德·诺鲁齐、德庆·孙、大卫·J·弗利特
arXiv 2023年。[论文]
2023年6月2日

从预训练扩散生成模型中解构任意尺度的超分辨率能力
李瑞斌、周启华、郭松、张杰、郭景才、姜新阳、沈义飞、韩振华
arXiv 2023年。[论文]
2023年6月1日

基于小波的扩散模型用于低光照图像增强
江海、罗傲、韩松臣、范浩强、刘帅成
arXiv 2023年。[论文]
2023年6月1日

面向基于扩散的图像修复的统一条件框架
张毅、石晓宇、李大松、王小刚、王健、李洪生
arXiv 2023年。[论文]
2023年5月31日

利用数据一致性直接构建扩散桥梁以解决逆问题
郑炯镇、金正率、叶宗哲
arXiv 2023年。[论文]
2023年5月31日

通过捷径采样加速用于逆问题的扩散模型
刘功业、孙浩泽、李佳怡、殷菲、杨宇久
arXiv 2023年。[论文]
2023年5月26日

看，不用手！自我中心视频的智能体-环境分解
马修·昌、阿迪提亚·普拉卡什、索拉布·古普塔
arXiv 2023年。[论文] [项目]
2023年5月25日

用于低剂量CT图像去噪的扩散概率先验
刘璇、谢耀钦、刁松辉、谭山、梁晓坤
arXiv 2023年。[论文]
2023年5月25日

通过最优边界条件求解扩散ODE以实现更好的图像超分辨率
马一洋、杨欢、杨文翰、付建龙、刘佳莹
arXiv 2023年。[论文]
2023年5月24日

WaveDM：用于图像修复的小波基扩散模型
黄毅、黄建诚、刘建庄、于东、吕家熙、陈世峰
arXiv 2023年。[论文]
2023年5月23日

双扩散：用于遥感图像盲超分辨率重建的双重条件去噪扩散概率模型
徐孟泽、马杰、朱媛媛
arXiv 2023年。[论文] [GitHub]
2023年5月20日

UniControl：用于野外可控视觉生成的统一扩散模型
秦灿、张书、于宁、冯一浩、杨欣怡、周英博、王欢、胡安·卡洛斯·涅布雷斯、熊才明、西尔维奥·萨瓦雷斯、斯特凡诺·埃尔蒙、傅云、徐然
arXiv 2023年。[论文]
2023年5月18日

金字塔扩散模型用于低光照图像增强
周德伟、杨宗鑫、杨毅
arXiv 2023年。[论文]
2023年5月17日

用于射电干涉图像重建的条件去噪扩散概率模型
王若琪、陈卓阳、罗琼、王峰
arXiv 2023年。[论文]
2023年5月16日

用于即插即用图像修复的去噪扩散模型
朱元志、张凯、梁静云、曹杰章、文碧涵、拉杜·蒂莫夫特、吕克·范古尔
arXiv 2023。[论文] [GitHub]
2023年5月15日

利用扩散先验进行真实世界图像超分辨率
王建义、岳宗胜、周尚晨、陈家健、罗伊·陈
arXiv 2023。[论文] [项目] [GitHub]
2023年5月11日

基于变分深度扩散的湍流大气校正
王锡军、圣地亚哥·洛佩斯-塔皮亚、安格洛斯·K·卡察格洛斯
arXiv 2023。[论文]
2023年5月8日

用于人像的可控光线扩散
大卫·富奇克、凯尔文·里特兰德、詹姆斯·维科尔、肖恩·法内洛、塞尔吉奥·奥尔茨-埃斯科拉诺、布赖恩·库尔斯、丹尼尔·西科拉、罗希特·潘迪
arXiv 2023。[论文]
2023年5月8日

DiffBFR：基于自举的扩散模型用于盲态人脸修复
邱新民、韩聪颖、张子诚、李博楠、郭天德、聂学成
arXiv 2023。[论文]
2023年5月8日

基于扩散模型的真实场景去噪
杨程、梁丽静、苏志勋
arXiv 2023。[论文]
2023年5月8日

从变分视角看如何用扩散模型求解逆问题
莫尔特扎·马尔达尼、宋嘉明、扬·考茨、阿拉什·瓦赫达特
arXiv 2023。[论文]
2023年5月7日

利用联合扩散注意力模型从高场和超高场磁共振图像合成PET图像
谢涛峰、曹晨涛、崔卓旭、郭宇、吴彩英、王雪梅、李庆宁、胡占利、孙涛、桑子儒、周一航、朱彦杰、梁东、金启宇、陈国清、王海峰
arXiv 2023。[论文]
2023年5月6日

DocDiff：基于残差扩散模型的文档增强
杨宗源、刘宝林、熊永平、易兰、吴贵斌、唐晓军、刘子琪、周俊杰、张星
arXiv 2023。[论文] [GitHub]
2023年5月6日

利用从噪声数据中学习到的基于分数的生成先验求解逆问题
阿萨德·阿里、马里乌斯·阿尔文特、西达尔特·库马尔、乔纳森·I·塔米尔
arXiv 2023。[论文]
2023年5月2日

基于自相似性的光声血管造影超分辨率——由手绘涂鸦生成
马元征、周旺婷、马睿、杨思华、唐言松、关勋
arXiv 2023。[论文]
2023年5月2日

基于分数的扩散模型作为逆向成像的原理性先验
伯西·T·冯、杰米·史密斯、迈克尔·鲁宾斯坦、常慧雯、凯瑟琳·L·鲍曼、威廉·T·弗里曼
arXiv 2023。[论文]
2023年4月23日

通过搭便车模型改进基于扩散的图像着色
刘汉元、邢金波、谢敏山、李承泽、王天赐
arXiv 2023。[论文] [项目]
2023年4月21日

DiFaReli：扩散人脸重照明
蓬塔瓦特·蓬勒特纳帕功、农塔瓦特·特里通、苏帕索恩·苏瓦贾纳科恩
arXiv 2023。[论文] [项目]
2023年4月19日

Inpaint Anything：Segment Anything与图像修复相遇
余涛、冯润生、冯若雨、刘锦明、金鑫、曾文俊、陈志博
arXiv 2023。[论文] [GitHub]
2023年4月13日

Refusion：利用潜在空间扩散模型实现大尺寸逼真图像修复
罗子威、弗雷德里克·K·古斯塔夫森、赵郑、延斯·舍伦德、托马斯·B·舍恩
arXiv 2023。[论文] [GitHub]
2023年4月17日

SPIRiT-Diffusion：自一致性驱动的加速MRI扩散模型
崔卓旭、曹晨涛、程静、贾森、郑海荣、梁东、朱彦杰
arXiv 2023。[论文]
2023年4月11日

使用无条件生成式扩散先验进行零样本CT视野补全
徐凯文、阿拉文德·R·克里希南、李天佐、霍元凯、金·L·桑德勒、法比安·马尔多纳多、本内特·A·兰德曼
arXiv 2023。[论文]
2023年4月7日

SketchFFusion：基于草图引导的扩散模型图像编辑
毛伟航、韩博、王子豪
arXiv 2023。[论文]
2023年4月6日

Inst-Inpaint：用扩散模型指示移除物体
艾哈迈特·布拉克·耶尔迪里姆、韦达特·巴达伊、埃尔库特·埃尔德姆、艾库特·埃尔德姆、艾赛古尔·敦达尔
arXiv 2023。[论文] [项目]
2023年4月6日

利用去噪扩散隐式模型实现连贯的图像修复
张冠华、季宝基、张阳、于默、汤米·雅各拉、常世宇
arXiv 2023。[论文] [GitHub]
2023年4月6日

基于频率引导的扩散模型实现零样本医学图像转换
李云翔、邵华杰、梁晓、陈立远、李瑞琪、江斯蒂夫、王晶、张友
arXiv 2023。[论文]
2023年4月5日

告别低分辨率：一种基于扩散-小波的图像超分辨率方法
布莱恩·莫瑟、斯坦尼斯拉夫·弗罗洛夫、费德里科·劳厄、塞巴斯蒂安·帕拉西奥、安德烈亚斯·登格尔
arXiv 2023。[论文]
2023年4月4日

CoreDiff：上下文误差调制的广义扩散模型，用于低剂量CT去噪及泛化
高齐、李子龙、张俊平、张毅、单鸿明
arXiv 2023。[论文]
2023年4月4日

用于统一图像修复与增强的生成式扩散先验
费本、吕兆阳、潘亮、张俊哲、杨卫东、罗天悦、张博、戴博
CVPR 2023。[论文]
2023年4月3日

用于连续超分辨率的隐式扩散模型
高思成、刘旭辉、曾博文、许晟、李燕京、罗晓燕、刘建庄、甄宪彤、张宝昌
CVPR 2023。[论文]
2023年3月29日

DiracDiffusion：保证数据一致性的去噪与增量重建
扎兰·法比安、贝尔克·蒂纳兹、马赫迪·索尔坦奥尔科塔比
arXiv 2023。[论文]
2023年3月25日

MindDiffuser：基于语义与结构扩散的人脑活动可控图像重建
陆一卓、杜昌德、王典鹏、何慧光
arXiv 2023年。[论文]
2023年3月24日

DisC-Diff：用于多对比度MRI超分辨率的解耦条件扩散模型
毛晔、江兰、陈曦、李超
arXiv 2023年。[论文]
2023年3月23日

基于子体积的去噪扩散概率模型：用于不完全数据下的锥束CT重建
夏文俊、牛闯、丛文祥、王革
arXiv 2023年。[论文]
2023年3月22日

AIGC图像的感知质量评估探索
张子成、李春毅、孙伟、刘晓红、闵雄阔、翟广涛
arXiv 2023年。[论文]
2023年3月22日

直接迭代反演：一种替代去噪扩散的图像恢复方法
毛里西奥·德尔布拉西奥、佩曼·米兰法尔
arXiv 2023年。[论文]
2023年3月20日

用于均匀扩散修复的高效4K掩膜神经网络生成
卡尔·施拉德、帕斯卡·彼得、尼克拉斯·坎珀、约阿希姆·魏克特
arXiv 2023年。[论文]
2023年3月17日

低光照图像增强的去噪扩散后处理
萨瓦斯·帕纳吉托、安娜·S·博斯曼
arXiv 2023年。[论文]
2023年3月16日

SUD2：基于去噪扩散模型的监督用于图像重建
马修·A·陈、肖恩·I·杨、克里斯托弗·A·梅茨勒
arXiv 2023年。[论文]
2023年3月16日

DiffIR：高效的图像恢复扩散模型
夏彬、张玉伦、王世银、王一彤、吴兴隆、田亚鹏、杨文铭、卢克·范古尔
arXiv 2023年。[论文]
2023年3月16日

ResDiff：结合CNN与扩散模型的图像超分辨率
尚书瑶、单正阳、刘广星、张静林
arXiv 2023年。[论文]
2023年3月15日

类别引导的图像到图像扩散：基于明场图像和类别标签的细胞着色
扬·奥斯卡·克罗斯-扎米尔斯基、普拉文·安南德、盖伊·威廉姆斯、伊丽莎白·穆谢、王银海、卡罗拉-比比安妮·舍恩利布
arXiv 2023年。[论文] [GitHub]
2023年3月15日

用于磁共振图像对比度协调的扩散模型
艾丽西亚·杜雷尔、朱莉娅·沃莱布、弗洛伦丁·比德尔、蒂姆·辛内克、马蒂亚斯·韦格尔、罗宾·桑德库勒、克里斯蒂娜·格兰齐耶拉、厄兹居尔·亚尔迪兹利、菲利普·C·卡廷
arXiv 2023年。[论文]
2023年3月14日

合成逼真的图像恢复训练样本对：一种扩散方法
杨涛、任培然、谢宣松、张磊
arXiv 2023年。[论文]
2023年3月13日

DR2：基于扩散的鲁棒退化去除器，用于盲态人脸修复
王志新、张晓云、张子颖、郑黄杰、周明远、张雅、王延峰
CVPR 2023。[论文]
2023年3月13日

DDS2M：用于高光谱图像恢复的自监督去噪扩散时空谱模型
缪宇春、张雷飞、张良培、陶大成
arXiv 2023年。[论文]
2023年3月12日

基于几何分解的反问题快速扩散采样器
郑炯镇、李秀贤、叶宗哲
arXiv 2023年。[论文]
2023年3月10日

利用Swin Transformer进行广义扩散MRI去噪与超分辨率
阿米尔·萨迪科夫、杰米·温伦-贾维斯、潘欣蕾、蔡兰娅·T、普拉蒂克·穆克吉
arXiv 2023年。[论文]
2023年3月10日

DiffusionDepth：用于单目深度估计的扩散去噪方法
段一群、朱政、郭显达
arXiv 2023年。[论文] [GitHub]
2023年3月9日

从退化中学习增强：用于眼底图像增强的扩散模型
程沛瑾、林丽、黄一进、何华清、罗文翰、唐小英
arXiv 2023年。[论文] [GitHub]
2023年3月8日

无尺寸限制的扩散修复
王银怀、于继文、于润义、张健
arXiv 2023年。[论文]
2023年3月1日

利用扩散修复进行无监督的分布外检测
刘珍珍、周金鹏、王宇凡、基利安·Q·温伯格
arXiv 2023年。[论文]
2023年2月20日

基于修复的生成模型
崔在模、朴艺森、姜明珠
arXiv 2023年。[论文]
2023年2月20日

基于高斯混合模型图像先验的显式扩散
马丁·扎赫、托马斯·波克、埃里希·科布勒、安东尼·尚博勒
arXiv 2023年。[论文]
2023年2月16日

用于野外场景下鲁棒图像超分辨率的去噪扩散概率模型
哈什马特·萨哈克、丹尼尔·沃森、奇特万·萨哈里亚、大卫·弗利特
arXiv 2023年。[论文]
2023年2月15日

CDPMSR：用于单幅图像超分辨率的条件扩散概率模型
牛阿喜、张康、范中X、孙金秋、朱宇、权仁昭、张燕宁
arXiv 2023年。[论文]
2023年2月14日

如何信任你的扩散模型：一种基于凸优化的保形风险控制方法
雅各波·特内吉、马特·蒂夫南、J·韦伯斯特·斯泰曼、杰雷米亚斯·苏拉姆
arXiv 2023年。[论文]
2023年2月7日

DDM2：使用生成扩散模型的自监督扩散MRI去噪
向天歌、马赫穆特·尤尔特、阿里·B·赛义德、卡温·塞特索姆波、阿克沙伊·乔杜里
ICLR 2023。[论文] [GitHub]
2023年2月6日

用于生成式图像去噪的扩散模型
谢宇通、袁敏讷、董斌、李全正
arXiv 2023年。[论文]
2023年2月5日

基于去噪扩散概率模型的图像修复理论依据
利图·劳特、阿德瓦伊特·帕鲁莱卡、康斯坦丁·卡拉马尼斯、桑杰·沙科泰
arXiv 2023年。[论文]
2023年2月2日

GibbsDDRM：一种部分坍缩的吉布斯采样器，用于通过去噪扩散修复解决盲态反问题
村田直树、斋藤浩一、赖启信、泷田裕太、上坂俊光、三藤由纪、斯特凡诺·埃尔蒙
arXiv 2023年。[论文]
2023年1月30日

基于分裂数值方法加速引导扩散采样
苏提萨克·维扎冬萨、苏帕索恩·苏瓦查诺克
ICLR 2023. [论文]
2023年1月27日

用于低剂量CT的扩散去噪模型
李润一
arXiv 2023. [论文]
2023年1月27日

基于可见性位掩码的屏幕空间间接光照
奥利维尔·泰里安、扬尼克·勒韦斯克、纪尧姆·吉莱
Visual Computer 2023. [论文]
2023年1月26日

用于鱼眼图像校正的双扩散架构：从合成到真实场景的泛化
杨尚荣、林春宇、廖康、赵瑶
arXiv 2023. [论文]
2023年1月26日

RainDiffusion：无监督学习与扩散模型结合用于真实世界图像去雨
魏明强、沈益阳、王永振、谢浩然、王福礼
arXiv 2023. [论文]
2023年1月23日

Dif-Fusion：利用扩散模型实现红外与可见光图像融合中的高色彩保真度
魏明强、沈益阳、王永振、谢浩然、王福礼
arXiv 2023. [论文]
2023年1月23日

利用扩散模型去除结构化噪声
特里斯坦·S.W. 史蒂文斯、让-吕克·罗伯特、法伊克·C·梅拉尔、杰森·余、申俊燮、鲁德·J.G. 范斯隆
arXiv 2023. [论文]
2023年1月20日

基于均值回复随机微分方程的图像修复
罗子威、弗雷德里克·K·古斯塔夫松、赵铮、延斯·舍伦德、托马斯·B·舍恩
arXiv 2023. [论文] [GitHub]
2023年1月20日

DiffusionCT：用于CT图像标准化的潜在扩散模型
穆罕默德·塞利姆、张洁、迈克尔·A·布鲁克斯、王革、陈进
arXiv 2023. [论文]
2023年1月20日

通过采样预训练扩散模型进行目标图像重建
郑家庚
arXiv 2023. [论文]
2023年1月18日

用于减少MR运动伪影的退火分数驱动扩散模型
吴奎泽、李贞恩、叶宗哲
arXiv 2023. [论文]
2023年1月8日

探索视觉Transformer作为扩散学习器
曹鹤、王佳楠、任天赫、齐献标、陈义豪、姚远、张磊
arXiv 2022. [论文]
2022年12月28日

迈向盲水印技术：结合可逆与不可逆机制
马睿、郭孟溪、侯毅、杨帆、李源、贾慧珠、谢晓东
arXiv 2022. [论文] [GitHub]
2022年12月24日

双噪声扩散：面向具有生成式修复先验的条件扩散模型
梅康富、尼廷·戈帕拉克里希南·奈尔、维沙尔·M·帕特尔
arXiv 2022. [论文] [项目]
2022年12月14日

SPIRiT-Diffusion：SPIRiT驱动的分数基生成建模用于血管壁成像
曹晨涛、崔卓旭、程静、贾森、郑海荣、梁栋、朱彦杰
arXiv 2022. [论文]
2022年12月14日

用于动态MR成像的双域通用生成建模
于传明、关宇、柯子文、梁栋、刘启根
arXiv 2022. [论文]
2022年12月15日

DifFace：基于扩散误差收缩的盲人脸修复
岳宗生、陈昌洛伊
arXiv 2022. [论文] [GitHub]
2022年12月13日

ShadowDiffusion：当退化先验与扩散模型结合用于阴影去除
郭兰青、王冲、杨文翰、黄思宇、王宇飞、汉斯彼得·普菲斯特、温碧涵
arXiv 2022. [论文]
2022年12月9日

用于低剂量CT成像的投影域单样本扩散模型
黄斌、张刘、陆世宇、林博宇、吴伟文、刘启根
arXiv 2022. [论文]
2022年12月7日

SDM：用于大孔洞图像修复的空间扩散模型
李文博、于欣、周坤、宋义兵、林哲、贾嘉亚
arXiv 2022. [论文]
2022年12月6日

ADIR：用于图像重建的自适应扩散
沙迪·阿布-侯赛因、汤姆·蒂雷尔、拉贾·吉里耶斯
arXiv 2022. [论文] [项目]
2022年12月6日

使用领域泛化扩散模型进行图像去模糊
任梦伟、毛里西奥·德尔布拉西奥、侯赛因·塔莱比、圭多·格里格、佩曼·米兰法尔
arXiv 2022. [论文]
2022年12月4日

使用去噪扩散零空间模型进行零样本图像修复
王银怀、于继文、张健
arXiv 2022. [论文] [GitHub]
2022年12月1日

FREDSR：用于单幅图像超分辨率的傅里叶残差高效扩散GAN
禹京完、阿丘塔·拉贾拉姆
arXiv 2022. [论文]
2022年11月30日

CHIMLE：用于多模态条件图像合成的条件层次IMLE
彭世冲、阿里雷扎·莫阿泽尼、李科
arXiv 2022. [论文]
2022年11月25日

DOLCE：一种基于模型的概率扩散框架，用于有限角度CT重建
刘嘉铭、鲁希尔·阿尼鲁德、贾亚拉曼·J·蒂亚加拉詹、斯图尔特·何、K·阿迪蒂亚·莫汉、乌卢格贝克·S·卡米洛夫、金孝珍
arXiv 2022. [论文]
2022年11月22日

基于扩散模型的后验采样用于含噪线性反问题
孟祥明、加岛义之
arXiv 2022. [论文] [GitHub]
2022年11月20日

用于盲反问题的算子与图像并行扩散模型
郑炯镇、金正率、金世辉、叶宗哲
arXiv 2022. [论文]
2022年11月19日

使用预训练的2D扩散模型求解3D反问题
郑炯镇、柳道勋、迈克尔·T·麦肯、马克·L·克拉斯基、叶宗哲
arXiv 2022. [论文]
2022年11月19日

用于稀疏视角CT重建的基于块的去噪扩散概率模型
夏文军、丛文祥、王革
arXiv 2022. [论文]
2022年11月18日

一种结构引导的扩散模型用于大孔洞多样本图像补全
堀田大地、杨交龙、陈东、小山由纪、相泽清治
BMVC 2023. [论文]
2022年11月18日

Conffusion：扩散模型的置信区间
埃利亚胡·霍维茨、耶迪德·霍申
arXiv 2022年。[论文]
2022年11月17日

基于潜在特征的单张图像超分辨率重建
王欣、严景科、蔡静晔、邓建华、秦琴、王秦、肖恒、程瑶、叶鹏飞
arXiv 2022年。[论文]
2022年11月16日

学习点燃星光
袁宇、吴佳琪、王林东、景中梁、亨利·梁、朱书远、潘汉
arXiv 2022年。[论文]
2022年11月16日

ShadowDiffusion：基于分类器驱动注意力与结构保持的扩散模型去阴影方法
金烨颖、杨文翰、叶伟、袁媛、罗比·T·谭
arXiv 2022年。[论文]
2022年11月15日

DriftRec：将扩散模型适配于盲图像恢复任务
西蒙·韦尔克、亨利·N·查普曼、蒂莫·格尔克曼
arXiv 2022年。[论文]
2022年11月12日

从去噪扩散模型到去噪马尔可夫模型
乔·本顿、史宇阳、瓦伦丁·德·博托利、乔治·德利吉安尼迪斯、阿诺·杜塞
arXiv 2022年。[论文] [GitHub]
2022年11月7日

基于分数导向生成模型的量化压缩感知
孟祥明、加岛义之
arXiv 2022年。[论文] [GitHub]
2022年11月2日

智能画家：利用重采样扩散模型进行画面构图
顾永丰、萧婉芝、程曦、H·安东尼·陈
arXiv 2022年。[论文]
2022年10月31日

基于扩散模型的多任务脑肿瘤修复：方法学报告
普里亚·鲁兹罗赫、巴尔迪亚·霍斯拉维、沙赫里亚尔·法加尼、玛娜·莫阿塞菲、萨纳兹·瓦赫达蒂、布拉德利·J·埃里克森
arXiv 2022年。[论文] [GitHub]
2022年10月21日

DiffGAR：利用图像到图像扩散模型对生成性伪影进行模型无关的修复
尹悦琴、黄良华、刘宇、黄凯奇
arXiv 2022年。[论文]
2022年10月16日

基于去噪扩散概率模型的低剂量CT，实现20倍加速
夏文俊、吕青、王革
arXiv 2022年。[论文]
2022年9月29日

用于一般噪声反问题的扩散后验采样
郑炯镇、金正率、迈克尔·T·麦肯恩、马克·L·克拉斯基、芮宗哲
arXiv 2022年。[论文] [GitHub]
2022年9月29日

利用随机微分方程进行人脸超分辨率
马塞洛·多斯桑托斯、雷森·拉罗卡、拉斐尔·O·里贝罗、若昂·内维斯、雨果·普罗恩萨、大卫·梅诺蒂
arXiv 2022年。[论文] [GitHub]
2022年9月24日

基于去噪扩散修复模型的JPEG伪影校正
巴哈杰特·卡瓦尔、宋嘉铭、斯特凡诺·埃尔蒙、迈克尔·埃拉德
arXiv 2022年。[论文]
2022年9月23日

T2V-DDPM：基于去噪扩散概率模型的热成像到可见光人脸转换
尼廷·戈帕拉克里希南·奈尔、维沙尔·M·帕特尔
arXiv 2022年。[论文]
2022年9月19日

全局深入纹理与结构以进行图像修复
刘海鹏、王洋、王萌、阮勇
ACM 2022年。[论文] [GitHub]
2022年9月17日

基于去噪扩散概率模型的PET图像去噪
龚矿、基思·A·约翰逊、乔治·埃尔法赫里、李全正、潘天树
arXiv 2022年。[论文]
2022年9月13日

Self-Score：基于分数模型的自监督学习用于MRI重建
崔卓旭、曹晨涛、刘绍楠、朱庆勇、程静、王海峰、朱彦杰、梁栋
IEEE TMI 2022年。[论文]
2022年9月2日

AT-DDPM：利用去噪扩散概率模型修复受大气湍流退化的面部图像
尼廷·戈帕拉克里希南·奈尔、梅康富、维沙尔·M·帕特尔
arXiv 2022年。[论文]
2022年8月24日

冷扩散：无噪声地逆向任意图像变换
阿尔皮特·班萨尔、伊坦·博格尼亚、朱宏民、李继胜、哈米德·卡泽米、黄福荣、米迦·戈德布卢姆、乔纳斯·盖平、汤姆·戈德斯坦
arXiv 2022年。[论文] [GitHub]
2022年8月19日

高频空间扩散模型用于加速MRI
曹晨涛、崔卓旭、刘绍楠、梁栋、朱彦杰
arXiv 2022年。[论文]
2022年8月10日

基于补丁的去噪扩散模型在恶劣天气条件下恢复视觉
奥赞·厄兹代尼兹吉、罗伯特·莱根施泰因
arXiv 2022年。[论文] [GitHub]
2022年7月29日

非均匀扩散模型
乔治奥斯·巴佐利斯、扬·斯坦丘克、卡罗拉-比比安妮·舍恩利布、克里斯蒂安·埃特曼
arXiv 2022年。[论文]
2022年7月20日

基于对抗性扩散模型的无监督医学图像翻译
穆扎费尔·厄兹贝伊、萨尔曼·UH·达尔、哈桑·A·贝德尔、奥纳特·达尔马兹、沙班·厄兹图尔克、阿尔珀·京格尔、托尔加·丘库尔
arXiv 2022年。[论文]
2022年7月17日

用于加速MRI重建的自适应扩散先验
萨尔曼·UH·达尔、沙班·厄兹图尔克、尤尔马兹·科尔克马兹、戈克贝尔克·埃尔马斯、穆扎费尔·厄兹贝伊、阿尔珀·京格尔、托尔加·丘库尔
arXiv 2022年。[论文]
2022年7月12日

一种新颖的统一条件式分数导向生成框架，用于多模态医学图像补全
孟祥熙、顾宇宁、潘永生、王尼专、薛鹏、陆孟康、何旭明、詹毅强、沈定刚
arXiv 2022年。[论文]
2022年7月7日

基于去噪扩散概率模型的SAR去斑处理
马尔莎·V·佩雷拉、尼廷·戈帕拉克里希南·奈尔、韦勒·格达拉·查敏达·班达拉、维沙尔·M·帕特尔
arXiv 2022年。[论文]
2022年6月9日

利用流形约束改进扩散模型用于反问题
郑炯镇、沈炳洙、柳度勋、芮宗哲
arXiv 2022年。[论文]
2022年6月2日

图像到图像翻译的瑞士军刀：多任务扩散模型
茱莉娅·沃勒布、罗宾·桑德库勒、弗洛伦廷·比德尔、菲利普·C·卡汀
arXiv 2022年。[论文]
2022年4月6日

基于正则化逆扩散的MR图像去噪与超分辨率
Hyungjin Chung、Eun Sun Lee、Jong Chul Ye
arXiv 2022年。[论文]
2022年3月23日

通过扩散模型采样实现高效可靠的欠采样MR重建
Cheng Peng、Pengfei Guo、S. Kevin Zhou、Vishal Patel、Rama Chellappa
arXiv 2022年。[论文] [GitHub]
2022年3月8日

面向欠采样医学图像重建的测量条件约束去噪扩散概率模型
Yutong Xie、Quanzheng Li
MICCAI 2022。[论文] [GitHub]
2022年3月5日

基于数据驱动马尔可夫链的MRI重建及其联合不确定性估计
Guanxiong Luo、Martin Heide、Martin Uecker
arXiv 2022年。[论文] [GitHub]
2022年2月3日

利用扩散概率模型对视网膜OCT进行无监督去噪
Dewei Hu、Yuankai K. Tao、Ipek Oguz
arXiv 2022年。[论文] [GitHub]
2022年1月27日

去噪扩散恢复模型
Bahjat Kawar、Michael Elad、Stefano Ermon、Jiaming Song
ICLR 2022研讨会（口头报告）。[论文]
2022年1月27日

RePaint：基于去噪扩散概率模型的图像修复
Andreas Lugmayr、Martin Danelljan、Andres Romero、Fisher Yu、Radu Timofte、Luc Van Gool
CVPR 2022。[论文] [GitHub]
2022年1月24日

DiffuseVAE：从低维潜在空间高效、可控且高保真地生成图像
Kushagra Pandey、Avideep Mukherjee、Piyush Rai、Abhishek Kumar
arXiv 2022年。[论文] [GitHub]
2022年1月2日

基于潜在扩散模型的高分辨率图像合成
Robin Rombach、Andreas Blattmann、Dominik Lorenz、Patrick Esser、Björn Ommer
CVPR 2022。[论文] [GitHub]
2021年12月20日

更近一步，更快扩散：通过随机收缩加速用于逆问题的条件扩散模型
Hyungjin Chung、Byeongsu Sim、Jong Chul Ye
CVPR 2022。[论文]
2021年12月9日

基于随机细化的去模糊
Jay Whang、Mauricio Delbracio、Hossein Talebi、Chitwan Saharia、Alexandros G. Dimakis、Peyman Milanfar
CVPR 2022。[论文]
2021年12月5日

基于分数函数的扩散模型进行条件图像生成
Georgios Batzolis、Jan Stanczuk、Carola-Bibiane Schönlieb、Christian Etmann
arXiv 2021年。[论文]
2021年11月26日

利用基于分数函数的生成模型解决医学影像中的逆问题
Yang Song、Liyue Shen、Lei Xing、Stefano Ermon
NeurIPS 2021研讨会。[论文] [GitHub]
2021年11月15日

S3RP：自监督超分辨率及对流—扩散过程的预测
Chulin Wang、Kyongmin Yeo、Xiao Jin、Andres Codas、Levente J. Klein、Bruce Elmegreen
NeurIPS 2022。[论文]
2021年11月8日

基于分数函数的扩散模型用于加速MRI
Hyungjin Chung、Jong chul Ye
MIA 2021。[论文] [GitHub]
2021年10月8日

自回归扩散模型
Emiel Hoogeboom、Alexey A. Gritsenko、Jasmijn Bastings、Ben Poole、Rianne van den Berg、Tim Salimans
ICLR 2022。[论文]
2021年10月5日

ILVR：用于去噪扩散概率模型的条件化方法
Jooyoung Choi、Sungwon Kim、Yonghyun Jeong、Youngjune Gwon、Sungroh Yoon
ICCV 2021（口头报告）。[论文] [GitHub]
2021年8月6日

级联扩散模型用于高保真图像生成
Jonathan Ho、Chitwan Saharia、William Chan、David J. Fleet、Mohammad Norouzi、Tim Salimans
arXiv 2021年。[论文] [项目]
2021年5月30日

SRDiff：基于扩散概率模型的单幅图像超分辨率
Haoying Li、Yifan Yang、Meng Chang、Huajun Feng、Zhihai Xu、Qi Li、Yueting Chen
ACM 2022。[论文]
2021年4月30日

基于迭代细化的图像超分辨率
Chitwan Saharia、Jonathan Ho、William Chan、Tim Salimans、David J. Fleet、Mohammad Norouzi
arXiv 2021年。[论文] [项目] [GitHub]
2021年4月15日

医学影像

基于扩散的数据增强用于细胞核图像分割
Xinyi Yu、Guanbin Li、Wei Lou、Siqi Liu、Xiang Wan、Yan Chen、Haofeng Li
arXiv 2023年。[论文]
2023年10月22日

EMIT-Diff：通过文本引导的扩散模型提升医学图像分割性能
Zheyuan Zhang、Lanhong Yao、Bin Wang、Debesh Jha、Elif Keles、Alpay Medetalibeyoglu、Ulas Bagci
arXiv 2023年。[论文]
2023年10月19日

迈向通用的半监督体积分割框架
Haonan Wang、Xiaomeng Li
NeurIPS 2023。[论文] [GitHub]
2023年10月17日

基于辐射扩散生成模型的自监督胎儿MRI三维重建
Junpeng Tan、Xin Zhang、Yao Lv、Xiangmin Xu、Gang Li
arXiv 2023年。[论文]
2023年10月16日

JSMoCo：基于自校准分数函数扩散模型的并行MRI线圈灵敏度与运动校正
Lixuan Chen、Xuanyu Tian、Jiangjie Wu、Ruimin Feng、Guoyan Lao、Yuyao Zhang、Hongjiang Wei
arXiv 2023年。[论文]
2023年10月14日

基于直方图和扩散的医学领域外数据检测
Evi M. C. Huijben、Sina Amirrajab、Josien P. W. Pluim
arXiv 2023年。[论文]
2023年10月12日

基于扩散模型从舒张末期语义图合成超声心动图视频
Phi Nguyen Van、Duc Tran Minh、Hieu Pham Huy、Long Tran Quoc
arXiv 2023年。[论文]
2023年10月11日

基于扩散先验正则化的低剂量CT迭代重建
Wenjun Xia、Yongyi Shi、Chuang Niu、Wenxiang Cong、Ge Wang
arXiv 2023年。[论文]
2023年10月10日

基于潜在扩散模型的乳腺X线摄影图像压缩与解压缩框架
黄仁灿、禹敏宰
arXiv 2023年。[论文]
2023年10月8日

用于医学图像标准化与增强的潜在扩散模型
塞利姆、张杰、法拉内·法蒂、迈克尔·A·布鲁克斯、王戈、于国强、陈进
arXiv 2023年。[论文]
2023年10月8日

利用条件扩散概率模型表征有丝分裂像特征
卡格拉·德尼兹·巴哈迪尔、本杰明·利奇蒂、大卫·J·皮萨皮亚、梅特·R·萨布恩库
MICCAI研讨会2023年。[论文]
2023年10月5日

MedSyn：文本引导的解剖结构感知高保真3D CT图像合成
许延武、孙丽、彭伟、夏姆·维斯韦斯瓦兰、凯汉·巴特曼格利奇
arXiv 2023年。[论文]
2023年10月5日

基于DDPM内容特征和Transformer架构的盲态CT图像质量评估
史永毅、夏文俊、王戈、牟宣钦
arXiv 2023年。[论文]
2023年10月4日

SMRD：基于SURE的鲁棒MRI重建与扩散模型
巴图·厄兹图尔克勒、刘超、本杰明·埃卡特、莫特扎·马尔达尼、宋佳明、扬·考茨
MICCAI 2023年。[论文] [GitHub]
2023年10月3日

DiffGAN-F2S：对称且高效的去噪扩散GAN，用于从脑fMRI预测结构连接性
左乾坤、李瑞恒、狄毅、田浩、景昌宏、陈旭航、王树强
arXiv 2023年。[论文]
2023年9月28日

利用扩散增强图像提升膝骨关节炎严重程度分级
帕莱蒂·尼基尔·乔达里、戈兰特拉·V N S L 维什努·瓦尔丹、门塔·赛·阿克沙伊、门塔·赛·阿希什、瓦德拉普迪·赛·阿拉文德、加拉帕蒂·文卡塔·克里希纳·拉亚卢、阿斯瓦蒂·P
arXiv 2023年。[论文]
2023年9月17日

在扩散模型中引入形状先验模块用于医学图像分割
张志清、范国嘉、刘天勇、李楠、刘宇阳、刘子宇、董灿伟、周守军
arXiv 2023年。[论文]
2023年9月12日

面向治疗的扩散概率模型用于纵向MRI生成及弥漫性胶质瘤生长预测
刘庆辉、埃利斯·富斯特-加西亚、伊瓦尔·托克莱·霍夫登、多纳塔斯·塞德雷维丘斯、卡罗琳·斯科根、布拉德利·J·麦金托什、埃德瓦尔·格罗德姆、蒂尔·谢尔霍恩、彼得·布兰达尔、阿特勒·比约内鲁德、克耶雷·E·埃姆布莱姆
arXiv 2023年。[论文]
2023年9月11日

基于代理分数函数先验的高效贝叶斯计算成像
伯西·T·冯、凯瑟琳·L·鲍曼
arXiv 2023年。[论文]
2023年9月5日

利用曲线骨架从CT图像中分割三维孔隙空间：应用于微生物分解的数值模拟
奥利维尔·蒙加、扎卡里亚·贝尔加利、穆阿德·克拉伊、吕西·德鲁东、多米尼克·米歇卢奇、瓦莱丽·波特
arXiv 2023年。[论文]
2023年9月4日

GenSelfDiff-HIS：基于扩散的生成式自监督方法用于组织病理学图像分割
维什努瓦尔丹·普尔马、苏哈斯·斯里纳特、塞尚·斯里兰加拉詹、安查尔·卡卡尔、普拉托什·A·P
arXiv 2023年。[论文] [GitHub]
2023年9月4日

针对高度欠采样MRI重建的相关性和多频扩散建模
关宇、余传明、陆世宇、崔卓旭、梁东、刘启根
arXiv 2023年。[论文] [GitHub]
2023年9月2日

基于域条件先验指导的扩散建模用于加速MRI和qMRI重建
卞万宇、阿尔伯特·张、刘芳
arXiv 2023年。[论文]
2023年9月2日

PathLDM：文本条件化的潜在扩散模型用于组织病理学
斯里卡尔·耶拉普拉加达、亚历山德罗斯·格赖科斯、普拉提克·普拉桑纳、塔赫辛·库尔茨、乔尔·索尔茨、迪米特里斯·萨马拉斯
arXiv 2023年。[论文]
2023年9月1日

通过在双域中嵌入扩散先验实现无监督的CT金属伪影去除
刘轩、谢耀琴、刁松慧、谭珊、梁晓坤
arXiv 2023年。[论文]
2023年8月31日

基于扩散去噪模型的医学图像分割循环训练策略
傅云冠、李艺文、沙希尔·U·赛义德、马修·J·克拉克森、胡一鹏
arXiv 2023年。[论文] [GitHub]
2023年8月30日

物理信息驱动的DeepMRI：从热扩散到k空间插值的桥梁
崔卓旭、刘聪聪、范晓红、曹晨涛、程静、朱庆勇、刘媛媛、贾森、周易航、王海峰、朱彦杰、张建平、刘启根、梁东
arXiv 2023年。[论文]
2023年8月30日

分阶段小波优化精炼扩散模型用于稀疏视角CT重建
徐凯、陆世宇、黄斌、吴伟文、刘启根
arXiv 2023年。[论文]
2023年8月30日

基于掩码条件扩散的模态循环用于MRI中的无监督异常分割
梁子云、哈里·安东尼、费利克斯·瓦格纳、康斯坦蒂诺斯·卡姆尼察斯
arXiv 2023年。[论文]
2023年8月30日

数据迭代优化分数模型用于稳定超稀疏视角CT重建
吴伟文、王燕洋
arXiv 2023年。[论文]
2023年8月28日

利用高效扩散去噪概率模型从低剂量PET合成全剂量PET
潘绍燕、埃尔哈姆·阿布艾、彭俊博、钱若曦、雅各布·F·温恩、王通河、张志伟、贾斯汀·罗珀、乔纳森·A·奈、毛辉、杨晓峰
arXiv 2023年。[论文]
2023年8月24日

利用潜在扩散模型生成的合成数据增强医学图像分类器
卢克·W·塞格斯、詹姆斯·A·刁、卢克·梅拉斯-基里亚齐、马修·格罗、普拉纳夫·拉吉普卡尔、阿德沃尔·S·亚当森、维罗妮卡·罗滕贝格、罗克萨娜·达内什乔、阿琼·K·曼赖
arXiv 2023年。[论文]
2023年8月23日

InverseSR：基于潜在扩散模型的3D脑部MRI超分辨率
王珏琪、雅各布·莱夫曼、沃尔特·雨果·洛佩斯·皮纳亚、彼特鲁-丹尼尔·图多修、M·豪尔赫·卡多佐、拉兹万·马林斯库
MICCAI 2023年。[论文] [GitHub]
2023年8月23日

基于点-UV扩散的三维网格纹理生成
辛宇、戴鹏、李文博、马兰、刘正哲、齐晓娟
ICCV 2023。[论文]
2023年8月21日

具有辅助引导的对比扩散模型用于从粗到细的PET重建
韩泽宇、王宇涵、周鲁平、王鹏、闫彬宇、周继柳、王燕、沈定刚
MICCAI 2023。[论文] [GitHub]
2023年8月20日

基于去噪扩散的MR到CT图像转换可在无需人工标注的情况下实现全脊柱椎体的二维和三维分割
罗伯特·格拉夫、约阿希姆·施密特、莎拉·施莱格尔、亨德里克·克里斯蒂安·莫勒、瓦西利基·西德里-兰普雷察、安贾尼·塞库博伊纳、桑德罗·曼努埃尔·克里格、本尼迪克特·维斯特勒、比约恩·门策、丹尼尔·吕克特、扬·史蒂芬·基尔什克
arXiv 2023。[论文]
2023年8月18日

DMCVR：用于三维心脏容积重建的形态学引导扩散模型
何潇潇、谭超伟、韩立功、刘博、莱昂·阿克塞尔、李康、迪米特里斯·N·梅塔克萨斯
MICCAI 2023。[论文] [GitHub]
2023年8月18日

用于视网膜图像生成与分割的去噪扩散概率模型
阿尔努尔·阿利马诺夫、穆罕默德·巴哈鲁尔·伊斯兰
ICCP 2023。[论文]
2023年8月16日

形状引导的条件潜在扩散模型用于合成脑血管结构
雅什·迪奥、窦浩然、尼尚特·拉维库马尔、亚历杭德罗·F·弗兰吉、托尼·拉西拉
arXiv 2023。[论文]
2023年8月13日

掩码扩散作为自监督表征学习器
潘子轩、陈建旭、史一宇
arXiv 2023。[论文]
2023年8月10日

基于大规模无条件预训练的合成增强
叶嘉荣、倪浩淼、金鹏、黄莎伦·X、薛远
MICCAI 2023。[论文] [GitHub]
2023年8月8日

用于CBCT到CT合成的能量引导扩散模型
付林杰、李霞、蔡秀丁、苗东、姚宇、申亚丽
arXiv 2023。[论文]
2023年8月7日

DermoSegDiff：一种边界感知的皮肤病变勾画分割扩散模型
阿夫辛·博佐尔普尔、优素福·萨德盖赫、阿米尔侯赛因·卡泽鲁尼、雷扎·阿扎德、多丽特·梅尔霍夫
MICCAI研讨会2023。[论文] [GitHub]
2023年8月5日

利用引导扩散模型合成罕见白内障手术样本
扬尼克·弗里施、莫里茨·福克斯、安托万·桑纳、费利克斯·安东·乌卡尔、马里乌斯·弗伦策尔、乔安娜·瓦谢利卡-波斯列德尼克、阿德里安·格里克、费利克斯·马蒂亚斯·瓦格纳、托马斯·德拉奇、阿尼尔班·穆科帕迪亚伊
arXiv 2023。[论文]
2023年8月3日

用于脑部图像反事实生成与异常检测的扩散模型
亚历山德罗·丰塔内拉、格兰特·梅尔、乔安娜·沃德劳、埃马努埃莱·特鲁科、阿莫斯·斯托基
arXiv 2023。[论文]
2023年8月3日

使用扩散模型进行无参考各向同性三维电子显微镜重建
李京润、郑元基
arXiv 2023。[论文]
2023年8月3日

基于视觉Transformer的框架，用于将多模态淋巴瘤亚型分类模型的知识迁移到单模态模型
比莱尔·古塔尼、费里亚尔·温达尔、哈利姆·本哈比勒斯、玛丽安娜·佩蒂、罗曼·杜布瓦、埃马纽埃尔·莱特尔特尔、多米尼克·科拉尔
arXiv 2023。[论文]
2023年8月2日

用于MRI重建的傅里叶约束扩散桥梁学习
穆罕默德·U·米尔扎、奥纳特·达尔马兹、哈桑·A·贝德尔、戈克贝尔克·埃尔马斯、耶尔马兹·科尔克马兹、阿尔珀·贡戈尔、萨尔曼·UH·达尔、托尔加·丘库尔
arXiv 2023。[论文]
2023年8月2日

C-DARL：用于无标签血管分割的对比扩散对抗式表征学习
金宝河、吴有珍、布拉德福德·J·伍德、罗纳德·M·萨默斯、叶宗哲
arXiv 2023。[论文]
2023年7月31日

基于去噪扩散恢复模型的超声图像重建
张宇欣、克莱芒·于诺、热罗姆·伊迪耶、黛安娜·马特厄斯
MICCAI研讨会2023。[论文] [GitHub]
2023年7月29日

基于扩散模型的牙科X线分割预训练
杰雷米·鲁索、克里斯蒂安·阿拉卡、艾玛·科维利、伊波利特·马亚尔、劳拉·米斯拉奇、威利·奥
arXiv 2023。[论文]
2023年7月26日

基于潜在扩散模型的迭代重建用于稀疏数据重建
林超、严洪宇、罗梦婷、罗坤明、王旺、杜文超、陈虎、杨洪宇、张毅
arXiv 2023。[论文]
2023年7月22日

FSDiffReg：面向心脏图像的特征与分数引导的无监督可变形图像配准扩散模型
秦怡、李晓萌
MICCAI 2023。[论文] [GitHub]
2023年7月22日

FEDD——公平、高效且多样化的基于扩散的病变分割与恶性程度分类
埃克托·卡里翁、纳尔盖斯·诺鲁齐
MICCAI 2023。[论文] [GitHub]
2023年7月21日

PartDiff：基于部分扩散模型的图像超分辨率
赵凯、凌宇宏、庞凯峰、郑浩鑫、成庆贤
arXiv 2023。[论文]
2023年7月21日

Make-A-Volume：利用潜在扩散模型进行跨模态三维脑部MRI合成
朱玲婷、薛泽悦、金振超、刘宪、何静珍、刘子威、余乐泉
MICCAI 2023。[论文]
2023年7月19日

DiffDP：通过扩散模型预测放疗剂量
冯正浩、温璐、王鹏、闫彬宇、吴曦、周继柳、王燕
arXiv 2023。[论文]
2023年7月19日

DreaMR：基于扩散的fMRI反事实解释
哈桑·阿塔坎·贝德尔、托尔加·丘库尔
arXiv 2023。[论文]
2023年7月18日

TractCloud：采用新颖的局部-全局纤维束点云表示法进行无配准的白质束图谱划分
薛腾飞、陈雨谦、张朝义、亚历山德拉·J·戈尔比、尼科斯·马克里斯、约格什·拉提、蔡卫东、张凡、劳伦·J·奥唐奈尔
arXiv 2023。[论文] [项目] [GitHub]
2023年7月18日

基于硬数据一致性利用潜在扩散模型求解反问题
宋博文、权秀敏、张哲成、胡鑫宇、屈青、沈丽悦
arXiv 2023年。[论文]
2023年7月16日

文本到图像分类与生成中基于布拉德利-特里偏好模型的快速适应
维克托·加列戈
EYSM 2023年。[论文]
2023年7月15日

利用潜在扩散模型提升非酒精性脂肪性肝病分类性能
罗曼·哈迪、科内莉亚·伊林、乔·克莱皮奇、瑞安·米切尔、史蒂夫·霍尔、杰里科·维拉雷亚尔
arXiv 2023年。[论文]
2023年7月13日

DDGM：通过基于梯度的最小化过程中的扩散去噪求解反问题
凯尔·路瑟、H·塞巴斯蒂安·圣
arXiv 2023年。[论文]
2023年7月11日

LLCaps：利用弯曲小波注意力和逆向扩散学习增强低光照胶囊内窥镜图像
白龙、陈通、吴雅楠、王安、莫巴拉科尔·伊斯兰、任洪亮
arXiv 2023年。[论文] [GitHub]
2023年7月5日

同步图像-标签扩散概率模型及其在非对比CT脑卒中病灶分割中的应用
张建海、万通华、伊森·麦克唐纳、比乔伊·梅农、阿拉文德·加内什、吴秋
arXiv 2023年。[论文]
2023年7月4日

医学图像合成中3D潜在扩散模型的数据记忆现象研究
萨尔曼·乌尔·哈桑·达尔、阿尔曼·加纳特、扬尼克·卡曼、伊莎贝尔·艾克斯、西阿诺·帕帕瓦西利乌、斯特凡·O·舍恩贝格、桑迪·恩格尔哈特
arXiv 2023年。[论文]
2023年7月3日

无监督AS-OCT图像去斑点的内容保持型扩散模型
李三迁、东下里沙、傅华珠、李恒、牛静轩、刘江
arXiv 2023年。[论文]
2023年6月30日

基于展开式扩散模型的自监督MRI重建
尤尔马兹·科尔克马兹、托尔加·丘库尔、维沙尔·帕特尔
arXiv 2023年。[论文]
2023年6月29日

DoseDiff：用于放射治疗剂量预测的距离感知扩散模型
张艺文、李传普、钟立明、陈泽利、杨伟、王学涛
arXiv 2023年。[论文]
2023年6月28日

DiffMix：基于扩散模型的数据合成方法，用于病理图像数据集中不平衡情况下的细胞核分割与分类
吴贤植、郑元基
arXiv 2023年。[论文]
2023年6月25日

DiffInfinite：通过组织病理学中的并行随机补丁扩散实现大规模掩膜图像合成
马可·阿韦尔萨、加布里埃尔·诺比斯、米里亚姆·黑格勒、凯·斯坦德沃斯、米哈埃拉·奇里卡、罗德里克·默里-史密斯、艾哈迈德·阿拉、卢卡斯·鲁夫、丹妮拉·伊万诺娃、沃伊切赫·萨梅克、弗雷德里克·克劳申、布鲁诺·桑吉内蒂、路易斯·奥阿拉
arXiv 2023年。[论文]
2023年6月23日

DiffuseIR：用于3D显微图像各向同性重建的扩散模型
潘明杰、甘雨露、周方旭、刘嘉铭、王爱民、张尚航、李大伟
arXiv 2023年。[论文]
2023年6月21日

TauPETGen：基于潜在扩散模型的文本条件化Tau PET图像合成
张世仁、克里斯蒂娜·洛伊斯、艾玛·蒂博、J·亚历克斯·贝克尔、董亚飞、马克·D·诺尔曼丁、朱莉·C·普赖斯、基思·A·约翰逊、乔治·埃尔法赫里、龚匡
arXiv 2023年。[论文]
2023年6月21日

SANO：基于分数函数的扩散模型用于皮肤病学中的异常定位
阿尔瓦罗·冈萨雷斯-希门尼斯、西蒙·利奥内蒂、马克·普利、亚历山大·A·纳瓦里尼
CVPR研讨会2023年。[论文]
2023年6月18日

利用人类反馈将合成医学图像与临床知识对齐
孙胜欢、格里高利·M·戈德戈夫、阿图尔·巴特、艾哈迈德·M·阿拉
arXiv 2023年。[论文]
2023年6月16日

基于扩散模型的医学图像分割注释者共识预测
托梅尔·阿米特、舒穆埃尔·希赫鲁尔、塔尔·沙哈拉巴尼、利奥尔·沃尔夫
arXiv 2023年。[论文]
2023年6月15日

用于弱监督医学图像分割的条件扩散模型
胡欣荣、陈宇珍、何宗义、施一宇
arXiv 2023年。[论文]
2023年6月6日

通过对比扩散自编码器实现可解释的阿尔茨海默病分类
阿约德吉·伊吉沙金、艾哈迈德·阿卜杜拉尔、阿达莫斯·哈吉瓦西利乌、索菲·马丁、詹姆斯·科尔
arXiv 2023年。[论文]
2023年6月5日

利用扩散生成模型优化压缩感知MRI的采样模式
斯里拉姆·拉武拉、布雷特·莱瓦克、阿吉尔·贾拉尔、乔纳森·I·塔米尔、亚历山德罗斯·G·迪马基斯
arXiv 2023年。[论文]
2023年6月5日

使用合成MRI图像进行脑肿瘤分割——GAN与扩散模型的比较
穆罕默德·乌斯曼·阿克巴尔、芒斯·拉尔松、安德斯·埃克伦德
arXiv 2023年。[论文]
2023年6月5日

利用掩码扩散模型进行医学图像无监督异常检测
哈桑·伊克巴尔、乌马尔·哈立德、京华、陈晨
arXiv 2023年。[论文]
2023年5月31日

掩码、拼接与重采样：通过自动扩散模型提升异常检测的鲁棒性和泛化能力
科斯敏·I·贝尔恰、迈克尔·诺伊迈尔、丹尼尔·吕克特、朱莉娅·A·施纳贝尔
arXiv 2023年。[论文]
2023年5月31日

基于3D Transformer的去噪扩散模型从MRI生成合成CT图像
潘绍燕、埃尔哈姆·阿布埃伊、雅各布·温恩、王通河、理查德·L·J·邱、李宇恒、张志伟、彭俊波、贾斯汀·罗珀、普雷特什·帕特尔、大卫·S·余、毛辉、杨晓峰
arXiv 2023年。[论文]
2023年5月31日

用于语义3D医学图像合成的条件扩散模型
卓尔纳马尔·多日森贝、包兴国、索达提兰·奥东奇梅德、肖富仁
arXiv 2023年。[论文]
2023年5月29日

GenerateCT：文本引导的胸部CT三维生成
易卜拉欣·埃森·哈马姆奇、塞兹金·埃尔、埃尼斯·辛姆萨尔、阿尔佩伦·泰兹詹、艾雪·古尔尼汉·辛姆谢克、富尔坎·阿尔马斯、塞瓦尔·尼尔·埃西尔贡、阿德里安·雷诺、萨尔塔克·帕蒂、克里斯蒂安·布吕特根、比约恩·门策
arXiv 2023年。[论文] [GitHub]
2023年5月25日

用于低剂量CT图像去噪的扩散概率先验模型
刘轩、谢耀钦、刁松辉、谭山、梁晓坤
arXiv 2023年。[论文]
2023年5月25日

基于扩散模型的半监督超声图像分割多级全局上下文交叉一致性模型
唐峰鹤、丁建锐、王凌涛、咸敏、宁春平
arXiv 2023年。[论文] [GitHub]
2023年5月16日

警惕用于合成医学图像的扩散模型——与GANs在记忆脑肿瘤图像方面的比较
穆罕默德·乌斯曼·阿克巴尔、王武浩、安德斯·埃克伦德
arXiv 2023年。[论文]
2023年5月12日

利用扩散模型生成结构逼真的视网膜眼底图像
高素贞、池英勋、朴尚俊、李秀灿
arXiv 2023年。[论文]
2023年5月11日

从噪声中回响：利用扩散模型生成合成超声图像以用于真实图像分割
大卫·斯托亚诺夫斯基、乌希奥·埃尔米达、巴勃罗·拉马塔、阿里安·贝奇里、阿尔贝托·戈麦斯
arXiv 2023年。[论文]
2023年5月9日

使用联合扩散注意力模型从高场和超高场MRI图像合成PET图像
谢涛峰、曹晨涛、崔卓旭、郭宇、吴彩英、王雪梅、李庆能、胡占利、孙涛、桑子儒、周一航、朱燕杰、梁东、金启宇、陈国清、王海峰
arXiv 2023年。[论文]
2023年5月6日

利用从噪声数据中学习到的基于分数的生成先验解决逆问题
阿萨德·阿阿里、马里乌斯·阿尔文特、西达尔特·库马尔、乔纳森·I·塔米尔
arXiv 2023年。[论文]
2023年5月2日

基于自相似性的光声血管造影超分辨率重建——由手绘涂鸦生成
马元正、周旺廷、马睿、杨思华、唐言松、关迅
arXiv 2023年。[论文]
2023年5月2日

利用语义扩散模型从肺结节病灶图生成高保真图像
赵璇、本杰明·侯
MIDL 2023。[论文]
2023年5月2日

利用生成式扩散特征无监督发现三维层次结构
努里斯兰·图尔辛别克、马克·尼特哈默
arXiv 2023年。[论文]
2023年4月28日

循环指导的去噪扩散概率模型用于三维跨模态MRI合成
潘绍彦、张志伟、彭俊波、张佳涵、邱理杰、王通和、贾斯汀·罗珀、刘天、毛辉、杨晓峰
arXiv 2023年。[论文]
2023年4月28日

DiffuseExpand：利用扩散模型扩展用于二维医学图像分割的数据集
邵世彤、袁晓涵、黄振、邱子明、王帅、周凯文
arXiv 2023年。[论文] [GitHub]
2023年4月26日

用于组织病理学中鲁棒图像分割的真实数据增强
莎拉·切赫尼卡、詹姆斯·鲍尔、卡勒姆·阿瑟斯、坎迪斯·鲁福斯、伯恩哈德·凯因茨
arXiv 2023年。[论文]
2023年4月19日

去噪扩散医学模型
范玉辉、陈明权
IEEE ISBI 2023。[论文]
2023年4月19日

基于合成相关扩散成像数据的多机构开源基准数据集，用于乳腺癌临床决策支持
戴琪恩·艾米、亨德森·冈拉吉、亚历山大·王
arXiv 2023年。[论文]
2023年4月12日

Cancer-Net BCa-S：利用来自合成相关扩散成像的体积深度放射组学特征预测乳腺癌分级
戴琪恩·艾米、亨德森·冈拉吉、亚历山大·王
arXiv 2023年。[论文]
2023年4月12日

SPIRiT-Diffusion：自一致性驱动的加速MRI扩散模型
崔卓旭、曹晨涛、程静、贾森、郑海荣、梁东、朱燕杰
arXiv 2023年。[论文]
2023年4月11日

基于掩码条件的潜在扩散模型生成胃肠道息肉图像
罗马·马查切克、莱拉·莫扎法里、扎赫拉·塞帕斯达尔、斯拉万蒂·帕拉萨、帕尔·哈尔沃森、迈克尔·A·里格勒、瓦吉拉·坦巴维塔
arXiv 2023年。[论文]
2023年4月11日

BerDiff：用于医学图像分割的条件伯努利扩散模型
陈涛、王晨晖、单洪明
arXiv 2023年。[论文]
2023年4月10日

利用扩散模型进行模糊医学图像分割
艾蒙·拉赫曼、杰娅·玛丽亚·若泽·瓦拉纳拉苏、伊尔克尔·哈奇哈利洛卢、维沙尔·M·帕特尔
CVPR 2023。[论文] [GitHub]
2023年4月10日

MedGen3D：用于成对三维图像和掩码生成的深度生成框架
韩坤、熊益峰、游辰宇、波亚·霍斯拉维、孙善林、严向毅、詹姆斯·邓肯、谢晓辉
arXiv 2023年。[论文] [项目]
2023年4月8日

迈向逼真的胎儿大脑超声成像合成
米歇尔·伊斯坎达尔、哈维·曼内林、孙展翔、雅克琳·马修、哈米德·克尔德加里、劳拉·佩拉尔塔、米格尔·肖奇卡尔
arXiv 2023年。[论文] [GitHub]
2023年4月8日

无条件生成式扩散先验用于零样本CT视野补全
徐凯文、阿拉文德·R·克里希南、李天择、霍元凯、金L·桑德勒、法比安·马尔多纳多、本内特·A·兰德曼
arXiv 2023年。[论文]
2023年4月7日

通过频率引导的扩散模型实现零样本医学图像转换
李云翔、邵华杰、梁小、陈丽媛、李瑞琪、江斯蒂夫、王晶、张友
arXiv 2023年。[论文]
2023年4月5日

CoreDiff：用于低剂量CT去噪与泛化的上下文误差调制广义扩散模型
高齐、李子龙、张俊平、张毅、单洪明
arXiv 2023年。[论文]
2023年4月4日

ViT-DAE：基于 Transformer 的扩散自编码器用于组织病理学图像分析
徐轩、萨尔塔克·卡普塞、拉贾尔西·古普塔、普拉蒂克·普拉桑纳
MICCAI 2023。[论文]
2023年4月3日

请注意：微调扩散模型中的准确率与可解释性权衡
米沙·多姆布罗夫斯基、阿德里安·雷诺、约翰娜·P·穆勒、马修·鲍、伯恩哈德·凯因茨
arXiv 2023。[论文]
2023年3月31日

DDMM-Synth：一种去噪扩散模型，用于稀疏视角测量嵌入的跨模态医学图像合成
李晓月、商凯、王高昂、马克·D·布塔拉
arXiv 2023。[论文]
2023年3月28日

用于 3D 医学图像高效内存处理的扩散模型
弗洛伦丁·比德尔、朱莉娅·沃莱布、艾丽西亚·杜雷尔、罗宾·桑德库勒、菲利普·C·卡廷
MIDL 2023。[论文]
2023年3月27日

针对弥漫性胶质瘤分类的组织学与分子标志物多任务学习
王晓飞、斯蒂芬·普赖斯、李超
arXiv 2023。[论文]
2023年3月26日

CoLa-Diff：用于多模态 MRI 合成的条件潜扩散模型
江兰、毛叶、陈曦、王向峰、李超
arXiv 2023。[论文]
2023年3月24日

DisC-Diff：用于多对比度 MRI 超分辨率的解耦条件扩散模型
毛叶、江兰、陈曦、李超
arXiv 2023。[论文]
2023年3月23日

预算有限的医学扩散：用于医学图像生成的文本反演
布拉姆·德·维尔德、阿宁多·萨哈、理查德·P.G. 十布洛克、亨克扬·海斯曼
arXiv 2023。[论文]
2023年3月23日

基于子体积的去噪扩散概率模型，用于从不完全数据重建锥束 CT
夏文俊、牛创、丛文祥、王革
arXiv 2023。[论文]
2023年3月22日

基于特征条件的级联视频扩散模型，用于精确的心脏超声图像合成
阿德里安·雷诺、乔梦云、米沙·多姆布罗夫斯基、托马斯·戴、雷扎·拉扎维、阿尔贝托·戈麦斯、保罗·利森、伯恩哈德·凯因茨
arXiv 2023。[论文]
2023年3月22日

分布对齐扩散与原型引导网络用于无监督领域自适应分割
周海鹏、朱磊、周宇音
arXiv 2023。[论文]
2023年3月22日

扩散自编码器的语义潜在空间回归用于椎体骨折分级
马蒂亚斯·凯彻、马坦·阿塔德、大卫·辛茨、亚历山德拉·S·格辛、莎拉·C·福尔曼、索菲娅·S·戈勒、尤尔根·魏辛格、琼·里舍夫斯基、安娜-索菲娅·迪特里希、本尼迪克特·维斯特勒、扬·S·基尔施克、纳西尔·纳瓦布
arXiv 2023。[论文]
2023年3月21日

NASDM：利用扩散模型进行细胞核感知的语义组织病理学图像生成
阿曼·什里瓦斯塔瓦、P·托马斯·弗莱彻
arXiv 2023。[论文]
2023年3月20日

用于高分辨率胸部 X 光片合成的级联潜扩散模型
托比亚斯·韦伯、迈克尔·英格里施、伯恩德·比施尔、大卫·吕加默
arXiv 2023。[论文]
2023年3月20日

DiffMIC：用于医学图像分类的双指导扩散网络
杨一军、傅华柱、安杰莉卡·阿维莱斯-里韦罗、卡罗拉-比比安·舍恩利布、朱磊
arXiv 2023。[论文]
2023年3月19日

Diff-UNet：一种嵌入扩散的网络用于体积分割
邢兆虎、万亮、傅华柱、杨光、朱磊
arXiv 2023。[论文] [GitHub]
2023年3月18日

逆转异常：用于异常检测的伪健康生成网络
科斯敏·I·贝尔恰、本尼迪克特·维斯特勒、丹尼尔·鲁克特、朱莉娅·A·施纳贝尔
arXiv 2023。[论文]
2023年3月15日

利用预训练的垂直 2D 扩散模型提升 3D 成像质量
李秀贤、郑炯镇、朴敏英、朴宗赫、柳威顺、叶钟哲
arXiv 2023。[论文]
2023年3月15日

类别引导的图像到图像扩散：基于明场图像和类别标签的细胞绘图
扬·奥斯卡·克罗斯-扎米尔斯基、普拉文·阿南德、盖伊·威廉姆斯、伊丽莎白·穆谢、王银海、卡罗拉-比比安·舍恩利布
arXiv 2023。[论文] [GitHub]
2023年3月15日

使用条件分类扩散模型进行随机分割
卢卡斯·茨宾登、拉尔斯·多伦博斯、西奥多罗斯·皮萨斯、拉斐尔·斯兹尼特曼、巴勃罗·马尔克斯-内伊拉
ICCV 2023。[论文] [GitHub]
2023年3月15日

用于磁共振图像对比度协调的扩散模型
艾丽西亚·杜雷尔、朱莉娅·沃莱布、弗洛伦丁·比德尔、蒂姆·辛内克、马蒂亚斯·魏格尔、罗宾·桑德库勒、克里斯蒂娜·格兰齐耶拉、厄兹居尔·亚尔迪兹利、菲利普·C·卡廷
arXiv 2023。[论文]
2023年3月14日

高效训练视觉 Transformer 以分析结构化 MRI 扫描，用于阿尔茨海默病检测
尼基尔·J·迪纳加尔、索菲娅·I·托莫普洛斯、艾米丽·拉尔图、保罗·M·汤普森
arXiv 2023。[论文]
2023年3月14日

基于扩散的分层多标签目标检测，用于全景牙科 X 光片分析
易卜拉欣·埃特姆·哈马姆奇、塞兹金·埃尔、埃尼斯·辛姆萨尔、安贾尼·塞库博伊纳、穆斯塔法·贡多加尔、伯恩德·施塔德林格、阿尔伯特·梅尔、比约恩·门策
arXiv 2023。[论文]
2023年3月11日

AugDiff：基于扩散的特征增强，用于全切片图像中的多实例学习
邵祝臣、戴刘熙、王一峰、王浩谦、张永兵
arXiv 2023。[论文]
2023年3月11日

Brain Diffuser：端到端的脑影像到脑网络流程
陈旭航、雷白颖、潘志满、王书强
arXiv 2023。[论文]
2023年3月11日

基于几何分解的快速扩散采样器，用于逆问题求解
郑炯镇、李秀贤、叶钟哲
arXiv 2023。[论文]
2023年3月10日

利用 Swin Transformer 进行广义扩散磁共振成像去噪与超分辨率
阿米尔·萨迪科夫、杰米·温伦-贾维斯、潘新蕾、蔡兰雅·T、普拉蒂克·穆克吉
arXiv 2023。[论文]
2023年3月10日

在三维多类别分割中，使训练策略与评估相一致对于扩散模型的重要性
傅云冠、李艺文、沙希尔·U·赛义德、马修·J·克拉克森、胡一鹏
arXiv 2023年。[论文] [GitHub]
2023年3月10日

用于脑部MRI无监督异常检测的补丁式扩散模型
芬恩·贝伦特、迪巴扬·巴塔查里亚、茱莉娅·克吕格、罗兰·奥普费尔、亚历山大·施莱弗
MIDL 2023。[论文]
2023年3月7日

基于病理和序列条件的稳定扩散模型的双参数前列腺MR图像合成
沙希尔·U·赛义德、汤姆·赛尔、温燕、杨千叶、马克·恩伯顿、肖尼特·潘瓦尼、马修·J·克拉克森、迪恩·C·巴拉特、胡一鹏
arXiv 2023年。[论文]
2023年3月3日

溶解即增强：迈向细粒度异常检测
石健、张鹏翼、张妮、哈基姆·加扎伊、耶希亚·马苏德
arXiv 2023年。[论文]
2023年2月28日

DDM2：利用生成式扩散模型进行自监督扩散MRI去噪
项天戈、马赫穆特·尤尔特、阿里·B·赛义德、卡温·塞特索姆波普、阿克谢·乔杜里
ICLR 2023。[论文] [GitHub]
2023年2月6日

零样本学习跨模态数据转换：通过互信息引导的随机扩散实现
王子浩、杨英宇、马克西姆·塞尔梅桑、埃尔韦·德林热特、欧娜·吴
arXiv 2023年。[论文]
2023年1月31日

低剂量CT模型的扩散去噪
李润毅
arXiv 2023年。[论文]
2023年1月27日

DiffusionCT：用于CT图像标准化的潜在扩散模型
Md塞利姆、张杰、迈克尔·A·布鲁克斯、王革、陈进
arXiv 2023年。[论文]
2023年1月20日

MedSegDiff-V2：基于扩散的医学图像分割与Transformer结合
吴俊德、傅饶、方慧慧、张宇、徐延武
arXiv 2023年。[论文]
2023年1月19日

噪声在医学图像异常检测去噪模型中的作用
安塔纳斯·卡斯切纳斯、佩德罗·桑切斯、帕特里克·施雷姆夫、王朝阳、威廉·克拉克特、莎迪娅·S·米凯尔、杰里米·P·沃西、基思·戈特曼、亚历山大·韦尔、尼古拉斯·普若、索蒂里奥斯·A·察法塔里斯、艾莉森·Q·奥尼尔
arXiv 2023年。[论文] [GitHub]
2023年1月19日

基于扩散的数据增强用于皮肤病分类：从原始医学数据集到完全合成图像的影响
穆罕默德·阿克鲁特、巴林特·杰佩西、彼得·霍洛、阿德里恩·波尔、布拉加·金乔、斯蒂芬·索利斯、卡特琳娜·西罗内、杰里米·川原、德克尔·斯莱德、拉提夫·阿比德、马特·科瓦奇、伊什特万·法泽卡斯
arXiv 2023年。[论文]
2023年1月12日

退火评分驱动的扩散模型用于减少MR运动伪影
吴奎泽、李贞恩、叶宗哲
arXiv 2023年。[论文]
2023年1月8日

用于生成逼真且完全标注的显微镜图像数据集的去噪扩散概率模型
丹尼斯·埃施韦勒、约翰内斯·施泰格迈尔
arXiv 2023年。[论文]
2023年1月2日

基于扩散模型的半监督学习在脑出血图像上的应用：高效量化中线移位
龚世展、陈诚、龚宇琪、陈雅妍、马文傲、麦浩权、吉尔·阿布里戈、窦琦
arXiv 2023年。[论文]
2023年1月1日

SADM：面向纵向医学图像生成的序列感知扩散模型
尹济锡、张成浩、苏兴日、郭佳、李晓晓
arXiv 2022年。[论文]
2022年12月16日

双域通用生成建模用于动态MR成像
于传明、关宇、柯子文、梁东、刘启根
arXiv 2022年。[论文]
2022年12月15日

使用条件扩散概率模型生成逼真的3D脑部MRI
魏鹏、埃桑·阿德利、赵庆宇、基利安·M·波尔
arXiv 2022年。[论文] [GitHub]
2022年12月15日

SPIRiT-扩散：基于SPIRiT驱动评分的生成建模用于血管壁成像
曹晨涛、崔卓旭、程静、贾森、郑海荣、梁东、朱彦杰
arXiv 2022年。[论文]
2022年12月14日

扩散概率模型在医学图像上超越GAN
古斯塔夫·穆勒-弗兰茨、扬·莫里茨·尼豪斯、菲拉斯·哈德尔、索鲁什·塔耶比·阿拉斯特、克里斯托夫·哈尔堡、克里斯蒂安·库尔、王天赐、韩天宇、斯文·内贝尔翁、雅各布·尼古拉斯·卡瑟、丹尼尔·特鲁恩
arXiv 2022年。[论文]
2022年12月14日

用于低剂量CT成像的投影域单样本扩散模型
黄斌、张刘、陆诗雨、林博宇、吴伟文、刘启根
arXiv 2022年。[论文]
2022年12月7日

通过光流扩散进行神经细胞视频合成
曼努埃尔·塞纳-阿吉莱拉、阮科华、纳撒尼尔·哈里斯、邹敏
arXiv 2022年。[论文]
2022年12月6日

利用大型扩散模型生成的图像改进跨人群皮肤科分类器
卢克·W·塞格斯、詹姆斯·A·迪奥、马修·格罗、普拉纳夫·拉杰普卡尔、阿德韦勒·S·亚当森、阿琼·K·曼赖
NeurIPS研讨会2022年。[论文]
2022年11月23日

RoentGen：用于胸部X光生成的视觉-语言基础模型
皮埃尔·尚邦、克里斯蒂安·布吕特根、让-贝努瓦·德尔布鲁克、罗吉尔·范德斯吕伊斯、马尔戈扎塔·波拉钦、胡安·曼努埃尔·萨姆布拉诺·查韦斯、塔尼什克·马修·亚伯拉罕、希万舒·普罗希特、柯蒂斯·P·朗格洛茨、阿克谢·乔杜里
arXiv 2022年。[论文]
2022年11月23日

DOLCE：基于模型的概率扩散框架用于有限角度CT重建
刘嘉铭、鲁希尔·阿尼鲁德、贾亚拉曼·J·蒂亚加拉詹、斯图尔特·何、K·阿迪蒂亚·莫汉、乌卢格贝克·S·卡米洛夫、金孝珍
arXiv 2022年。[论文]
2022年11月22日

利用预训练的2D扩散模型解决3D逆问题
郑炯镇、柳度勋、迈克尔·T·麦肯、马克·L·克拉斯基、叶宗哲
arXiv 2022年。[论文]
2022年11月19日

用于稀疏视角CT重建的基于补丁的去噪扩散概率模型
夏文军、丛文祥、王革
arXiv 2022年。[论文]
2022年11月18日

基于超高场扩散模型联合概率分布的MRI脑PET合成
谢涛峰、曹晨涛、崔卓旭、李凡石、魏子东、朱彦杰、李晔、梁栋、金启宇、陈国庆、王海峰
arXiv 2022年。[论文]
2022年11月16日

利用深度生成网络进行亚型平衡的HER2肿瘤分割改进
马蒂亚斯·厄特尔、雅娜·莫尼乌斯、马蒂亚斯·吕布纳、卡罗尔·I·盖珀特、邱静娜、弗劳克·维尔姆、阿恩特·哈特曼、马蒂亚斯·W·贝克曼、彼得·A·法辛、安德烈亚斯·迈尔、拉莫娜·埃尔伯、卡塔琳娜·布赖宁格
arXiv 2022年。[论文]
2022年11月11日

一种用于医学图像标注的非侵入式质量监督方法
松雅·昆茨曼、马蒂亚斯·厄特尔、普拉特梅什·马杜、费利克斯·登青格尔、安德烈亚斯·迈尔
arXiv 2022年。[论文]
2022年11月11日

医学扩散——用于3D医学图像生成的去噪扩散概率模型
菲拉斯·哈德尔、古斯塔夫·穆勒-弗兰泽斯、索鲁什·泰耶比·阿拉斯特、韩天宇、克里斯托夫·哈尔布尔格、马克西米利安·舒尔策-哈根、菲利普·沙德、桑迪·恩格尔哈特、贝蒂娜·贝斯勒、塞巴斯蒂安·福尔施、约翰内斯·施泰格迈尔、克里斯蒂安·库尔、斯文·内贝伦、雅各布·尼古拉斯·卡瑟、丹尼尔·特鲁恩
arXiv 2022年。[论文]
2022年11月7日

使用潜在扩散模型生成匿名胸部X线片以训练胸腔异常分类系统
凯·帕克豪瑟、卢卡斯·福勒、弗洛里安·塔姆、安德烈亚斯·迈尔
arXiv 2022年。[论文]
2022年11月2日

识破假肺：利用神经扩散模型生成合成医学图像
哈兹拉特·阿里、沙法克·穆拉德、祖拜尔·沙赫
arXiv 2022年。[论文] [项目]
2022年11月2日

MedSegDiff：基于扩散概率模型的医学图像分割
吴俊德、方慧慧、张宇、杨叶辉、徐延武
arXiv 2022年。[论文]
2022年11月1日

通过预分割扩散采样加速医学图像分割的扩散模型
郭旭涛、杨延武、叶晨飞、陆尚、向阳、马婷
arXiv 2022年。[论文]
2022年10月27日

基于扩散模型的多任务脑肿瘤修复：方法学报告
普里亚·鲁兹罗赫、巴尔迪亚·霍斯拉维、沙赫里亚尔·法加尼、玛娜·莫阿塞菲、萨娜兹·瓦赫达蒂、布拉德利·J·埃里克森
arXiv 2022年。[论文] [GitHub]
2022年10月21日

将预训练视觉-语言基础模型适配到医学影像领域
皮埃尔·尚邦、克里斯蒂安·布吕特根、柯蒂斯·P·朗格洛茨、阿克谢·乔达里
arXiv 2022年。[论文]
2022年10月9日

解剖学约束下的CT图像转换用于异质性血管分割
贾马尔科·拉·巴贝拉、海赛姆·布赛德、弗朗切斯科·马索、萨宾·萨尔纳基、劳伦斯·鲁埃、皮耶特罗·戈里、伊莎贝尔·布洛赫
BMVC 2022年。[论文]
2022年10月4日

基于去噪扩散概率模型的低剂量CT实现20倍加速
夏文军、吕庆、王革
arXiv 2022年。[论文]
2022年9月29日

基于扩散对抗性表征学习的自监督血管分割
博阿·金、吴有珍、叶宗哲
arXiv 2022年。[论文]
2022年9月29日

利用扩散和分数匹配模型在CT与MRI图像之间进行转换
吕庆、王革
arXiv 2022年。[论文]
2022年9月24日

基于潜在扩散模型的脑部影像生成
沃尔特·H·L·皮纳亚、佩特鲁-丹尼尔·图多修、杰西卡·达夫隆、佩德罗·F·达·科斯塔、维吉尼亚·费尔南德斯、帕拉什凯夫·纳切夫、塞巴斯蒂安·乌尔塞林、M·豪尔赫·卡多索
arXiv 2022年。[论文]
2022年9月15日

基于去噪扩散概率模型的PET图像去噪
龚矿、基思·A·约翰逊、乔治斯·埃尔·法赫里、李全正、潘廷苏
arXiv 2022年。[论文]
2022年9月13日

高频空间扩散模型用于加速MRI
曹晨涛、崔卓旭、刘绍楠、梁栋、朱彦杰
arXiv 2022年。[论文]
2022年8月10日

什么是健康？用于病灶定位的生成式反事实扩散
佩德罗·桑切斯、安塔纳斯·卡斯切纳斯、刘晓、艾莉森·Q·奥尼尔、索提里奥斯·A·察夫塔里斯
MICCAI 2022年。[论文] [GitHub]
2022年7月25日

基于对抗性扩散模型的无监督医学图像转换
穆扎费尔·厄兹贝伊、萨尔曼·UH·达尔、哈桑·A·贝德尔、奥纳特·达尔马兹、沙班·厄兹图尔克、阿尔珀·京格尔、托尔加·丘库尔
arXiv 2022年。[论文]
2022年7月17日

用于加速MRI重建的自适应扩散先验
萨尔曼·UH·达尔、沙班·厄兹图尔克、尤尔马兹·科尔克马兹、戈克贝尔·埃尔马斯、穆扎费尔·厄兹贝伊、阿尔珀·京格尔、托尔加·丘库尔
arXiv 2022年。[论文]
2022年7月12日

一种新颖的统一条件分数生成框架用于多模态医学图像补全
孟祥熙、顾宇宁、潘永生、王尼专、薛鹏、陆孟康、何旭明、詹义强、沈定刚
arXiv 2022年。[论文]
2022年7月7日

跨模态Transformer GAN：用于阿尔茨海默病的脑结构-功能深度融合框架
潘俊仁、王书强
arXiv 2022年。[论文]
2022年6月20日

用于4D时间医学图像生成的扩散可变形模型
博阿·金、叶宗哲
MICCAI 2022年。[论文] [GitHub]
2022年6月27日

利用扩散模型快速进行无监督脑部异常检测与分割
沃尔特·H·L·皮纳亚、马克·S·格雷厄姆、罗伯特·格雷、佩德罗·F·达·科斯塔、佩特鲁-丹尼尔·图多修、保罗·赖特、易·H·马赫、安德鲁·D·麦金农、詹姆斯·T·特奥、罗尔夫·雅格尔、戴维·韦林、杰莱因特·里斯、帕拉什凯夫·纳切夫、塞巴斯蒂安·乌尔塞林、M·豪尔赫·卡多索
MICCAI 2022年。[论文]
2022年6月7日

利用流形约束改进用于逆问题的扩散模型
郑炯镇、沈炳洙、柳度勋、叶宗哲
arXiv 2022年。[论文]
2022年6月2日

AnoDDPM：基于单纯形噪声的去噪扩散概率模型异常检测
朱利安·怀亚特、亚当·利奇、塞巴斯蒂安·M·施蒙、克里斯·G·威尔科克斯
CVPR 2022研讨会。[论文] [GitHub]
2022年6月1日

图像到图像转换的瑞士军刀：多任务扩散模型
茱莉娅·沃勒布、罗宾·桑德库勒、弗洛伦丁·比德尔、菲利普·C·卡廷
arXiv 2022。[论文]
2022年4月6日

利用正则化反向扩散进行磁共振图像去噪与超分辨率
郑炯镇、李恩善、芮钟哲
arXiv 2022。[论文]
2022年3月23日

用于医学异常检测的扩散模型
茱莉娅·沃勒布、弗洛伦丁·比德尔、罗宾·桑德库勒、菲利普·C·卡廷
MICCAI 2022。[论文] [GitHub]
2022年3月8日

通过扩散模型采样实现高效可靠的欠采样磁共振重建
彭程、郭鹏飞、S·凯文·周、维沙尔·帕特尔、拉马·切拉帕
arXiv 2022。[论文] [GitHub]
2022年3月8日

面向欠采样医学图像重建的测量条件去噪扩散概率模型
谢宇彤、李全政
MICCAI 2022。[论文] [GitHub]
2022年3月5日

基于数据驱动马尔可夫链的MRI重建及联合不确定性估计
罗冠雄、马丁·海德、马丁·乌克尔
arXiv 2022。[论文] [GitHub]
2022年2月3日

使用扩散概率模型对视网膜OCT进行无监督去噪
胡德伟、陶元凯、伊佩克·奥古兹
arXiv 2022。[论文] [GitHub]
2022年1月27日

越近越扩散越快：通过随机收缩加速逆问题的条件扩散模型
郑炯镇、沈炳洙、芮钟哲
CVPR 2021。[论文]
2021年12月9日

基于分数函数生成模型解决医学影像中的逆问题
杨松、沈丽悦、邢磊、斯特凡诺·埃尔蒙
NeurIPS 2021研讨会。[论文] [GitHub]
2021年11月15日

基于分数函数的扩散模型用于加速MRI
郑炯镇、芮钟哲
MIA 2021。[论文] [GitHub]
2021年10月8日

多模态学习

IterInv：面向像素级T2I模型的迭代反演
唐传明、王凯、约斯特·范德韦耶
arXiv 2023。[论文]
2023年10月30日

VideoCrafter1：用于高质量视频生成的开放扩散模型
陈浩鑫、夏梦涵、何英青、张勇、孙晓东、杨绍书、邢金波、刘耀芳、陈启峰、王新涛、翁超、单颖
arXiv 2023。[论文]
2023年10月30日

IMPRESS：评估基于扩散的生成式AI中不可察觉扰动对未经授权数据使用的鲁棒性
曹博川、李长江、王婷、贾金源、李博、陈静辉
NeurIPS 2023。[论文]
2023年10月30日

CustomNet：文本到图像扩散模型中的零样本多视角对象定制
袁子阳、曹明登、王新涛、齐仲刚、袁春、单颖
arXiv 2023。[论文]
2023年10月30日

透过对话看世界：基于扩散模型的音视频语音分离
李秀妍、郑彩英、张英俊、金在勋、郑俊宣
arXiv 2023。[论文]
2023年10月30日

基于分类器分数蒸馏的文本到3D生成
辛宇、郭元辰、李阳光、梁鼎、张松海、戚小娟
arXiv 2023。[论文]
2023年10月30日

通过文本到图像扩散模型定制360度全景图
王海、向晓宇、范宇晨、薛景浩
arXiv 2023。[论文]
2023年10月28日

SD4Match：学习为稳定扩散模型提供语义匹配提示
李兴辉、陆静怡、韩凯、维克托·普里萨卡留
arXiv 2023。[论文]
2023年10月26日

CADS：通过条件退火采样释放扩散模型的多样性
赛耶德莫尔特扎·萨达特、雅各布·布赫曼、德里克·布拉德利、奥特马尔·希利格斯、罗马恩·M·韦伯
arXiv 2023。[论文]
2023年10月26日

利用扩散模型进行视频定位的迭代细化探索
梁晓、石涛、梁耀远、陶特、黄绍伦
arXiv 2023。[论文]
2023年10月26日

一图胜千言：基于原则的重新标题提升图像生成质量
埃亚尔·塞加利斯、丹尼·瓦列夫斯基、丹尼·卢门、约西·马蒂亚斯、亚尼夫·莱维阿坦
arXiv 2023。[论文]
2023年10月25日

CommonCanvas：一个使用知识共享许可图片训练的开放扩散模型
亚伦·戈卡斯兰、A·费德·库珀、贾斯敏·柯林斯、兰丹·塞金、奥斯汀·雅各布森、米希尔·帕特尔、乔纳森·弗兰克尔、科里·斯蒂芬森、沃洛迪米尔·库列绍夫
arXiv 2023。[论文]
2023年10月25日

关于如何使用良性提示从文本到图像模型中主动生成不安全图像
吴毅欣、于宁、迈克尔·巴克斯、沈云、张洋
arXiv 2023。[论文]
2023年10月25日

融合你的潜在空间：基于多源潜在扩散模型的视频编辑
陆天翼、张星、顾佳熙、徐航、裴仁静、许松岑、吴祖轩
arXiv 2023。[论文]
2023年10月25日

适应任何事物：利用文本到图像扩散模型跨领域和类别定制任意图像分类器
陈伟杰、王浩宇、杨世才、张雷、魏伟、张燕宁、林洛君、谢迪、庄玉婷
arXiv 2023。[论文]
2023年10月25日

文本引导视频编辑竞赛
吴章杰、李秀宇、高迪飞、董振、白金彬、辛哈尼·辛格、向晓宇、李友增、黄祖威、孙元熙、何锐、胡峰、胡俊华、黄海、朱汉宇、程旭、唐杰、郑守迈克、库尔特·凯策尔、福雷斯特·伊安多拉
arXiv 2023。[论文]
2023年10月24日

基于多条件扩散模型的语言驱动场景合成
An Vuong, Minh Nhat Vu, Toan Tien Nguyen, Baoru Huang, Dzung Nguyen, Thieu Vo, Anh Nguyen
arXiv 2023. [论文]
2023年10月24日

FreeNoise：通过噪声重调度实现无需调优的长视频扩散生成
Haonan Qiu, Menghan Xia, Yong Zhang, Yingqing He, Xintao Wang, Ying Shan, Ziwei Liu
arXiv 2023. [论文] [项目]
2023年10月23日

SyncFusion：多模态同步触发的视频转音频拟音合成
Marco Comunità, Riccardo F. Gramaccioni, Emilian Postolache, Emanuele Rodolà, Danilo Comminiello, Joshua D. Reiss
arXiv 2023. [论文]
2023年10月23日

套娃扩散模型
Jiatao Gu, Shuangfei Zhai, Yizhe Zhang, Josh Susskind, Navdeep Jaitly
arXiv 2023. [论文]
2023年10月23日

大型语言模型也能分享图像！
Young-Jun Lee, Jonghwan Hyeon, Ho-Jin Choi
arXiv 2023. [论文]
2023年10月23日

针对文本到图像生成模型的提示词特定中毒攻击
Shawn Shan, Wenxin Ding, Josephine Passananti, Haitao Zheng, Ben Y. Zhao
arXiv 2023. [论文]
2023年10月20日

TexFusion：利用文本引导的图像扩散模型合成3D纹理
Tianshi Cao, Karsten Kreis, Sanja Fidler, Nicholas Sharp, Kangxue Yin
arXiv 2023. [论文]
2023年10月20日

DPM-Solver-v3：结合经验模型统计的改进型扩散ODE求解器
Kaiwen Zheng, Cheng Lu, Jianfei Chen, Jun Zhu
NeurIPS 2023. [论文] [项目]
2023年10月20日

文本到图像生成模型中的知识定位与编辑
Samyadeep Basu, Nanxuan Zhao, Vlad Morariu, Soheil Feizi, Varun Manjunatha
arXiv 2023. [论文]
2023年10月20日

TapMo：无骨骼角色的形状感知运动生成
Jiaxu Zhang, Shaoli Huang, Zhigang Tu, Xin Chen, Xiaohang Zhan, Gang Yu, Ying Shan
arXiv 2023. [论文]
2023年10月19日

CycleNet：重新思考文本引导扩散在图像编辑中的循环一致性
Sihan Xu, Ziqiao Ma, Yidong Huang, Honglak Lee, Joyce Chai
arXiv 2023. [论文]
2023年10月19日

DreamSpace：利用文本驱动的全景纹理传播打造你的房间空间
Bangbang Yang, Wenqi Dong, Lin Ma, Wenbo Hu, Xiao Liu, Zhaopeng Cui, Yuewen Ma
arXiv 2023. [论文]
2023年10月19日

EMIT-Diff：通过文本引导的扩散模型提升医学图像分割效果
Zheyuan Zhang, Lanhong Yao, Bin Wang, Debesh Jha, Elif Keles, Alpay Medetalibeyoglu, Ulas Bagci
arXiv 2023. [论文]
2023年10月19日

多样扩散：提升文本到图像生成中的图像多样性
Mariia Zameshina, Olivier Teytaud, Laurent Najman
arXiv 2023. [论文]
2023年10月19日

DynamiCrafter：借助视频扩散先验动画化开放域图像
Jinbo Xing, Menghan Xia, Yong Zhang, Haoxin Chen, Xintao Wang, Tien-Tsin Wong, Ying Shan
arXiv 2023. [论文]
2023年10月18日

Progressive3D：面向复杂语义提示的文本到3D内容创作中的渐进式局部编辑
Xinhua Cheng, Tianyu Yang, Jianan Wang, Yu Li, Lei Zhang, Jian Zhang, Li Yuan
arXiv 2023. [论文]
2023年10月18日

用于大规模检测文本到图像模型中隐性刻板印象的语言代理
Qichao Wang, Tian Bian, Yian Yin, Tingyang Xu, Hong Cheng, Helen M. Meng, Zibin Zheng, Liang Chen, Bingzhe Wu
arXiv 2023. [论文]
2023年10月18日

解析分类器引导扩散生成的设计空间
Jiajun Ma, Tianyang Hu, Wenjia Wang, Jiacheng Sun
arXiv 2023. [论文] [GitHub]
2023年10月17日

BayesDiff：基于贝叶斯推断估计扩散过程中的像素级不确定性
Siqi Kou, Lei Gan, Dequan Wang, Chongxuan Li, Zhijie Deng
arXiv 2023. [论文]
2023年10月17日

GenEval：一种以对象为中心的文本到图像对齐评估框架
Dhruba Ghosh, Hanna Hajishirzi, Ludwig Schmidt
arXiv 2023. [论文]
2023年10月17日

迈向无需训练的开放世界分割：基于图像提示的基础模型方法
Lv Tang, Peng-Tao Jiang, Hao-Ke Xiao, Bo Li
arXiv 2023. [论文]
2023年10月17日

LAMP：学习少量样本的运动模式以进行视频生成
Ruiqi Wu, Liangyu Chen, Tong Yang, Chunle Guo, Chongyi Li, Xiangyu Zhang
arXiv 2023. [论文] [项目] [GitHub]
2023年10月16日

潜在扩散中的场景图条件约束
Frank Fundel
arXiv 2023. [论文] [GitHub]
2023年10月16日

敲响警钟！扩散模型的概念移除方法究竟有多可靠？
Yu-Lin Tsai, Chia-Yi Hsu, Chulin Xie, Chih-Hsun Lin, Jia-You Chen, Bo Li, Pin-Yu Chen, Chia-Mu Yu, Chun-Ying Huang
arXiv 2023. [论文]
2023年10月16日

利用预训练的图像编辑扩散模型实现零样本机器人操作
Kevin Black, Mitsuhiko Nakamoto, Pranav Atreya, Homer Walke, Chelsea Finn, Aviral Kumar, Sergey Levine
arXiv 2023. [论文]
2023年10月16日

ViPE：几乎可以可视化任何东西
Hassan Shahmohammadi, Adhiraj Ghosh, Hendrik P. A. Lensch
arXiv 2023. [论文]
2023年10月16日

TOSS：高质量单张图像文本引导新视角合成
Yukai Shi, Jianan Wang, He Cao, Boshi Tang, Xianbiao Qi, Tianyu Yang, Yukun Huang, Shilong Liu, Lei Zhang, Heung-Yeung Shum
arXiv 2023. [论文]
2023年10月16日

LLM蓝图：支持复杂详尽提示的文本到图像生成
Hanan Gani, Shariq Farooq Bhat, Muzammal Naseer, Salman Khan, Peter Wonka
arXiv 2023. [论文]
2023年10月16日

LOVECon：基于ControlNet的文本驱动无训练长视频编辑
Zhenyi Liao, Zhijie Deng
arXiv 2023. [论文]
2023年10月15日

PaintHuman：通过去噪得分蒸馏实现高保真文本到3D人体纹理生成
于建辉、朱浩、蒋利明、罗晨超、蔡伟东、吴伟伦
arXiv 2023年。[论文]
2023年10月14日

组合能力以乘法方式涌现：在合成任务上探索扩散模型
冈川真夜、埃克迪普·辛格·卢巴纳、罗伯特·P·迪克、田中秀典
ICML研讨会2023年。[论文]
2023年10月13日

基于WordNet层次结构的文本到图像模型上位词理解评估
安东·巴里什尼科夫、马克西姆·里亚比宁
arXiv 2023年。[论文]
2023年10月13日

让多模态生成更简单：当扩散模型遇见大语言模型
赵翔宇、刘博、刘琪琼、史广源、吴晓明
arXiv 2023年。[论文]
2023年10月13日

R&B：区域与边界感知的零样本接地文本到图像生成
肖佳宇、李亮、吕恒磊、王淑慧、黄庆明
arXiv 2023年。[论文]
2023年10月13日

DeltaSpace：用于灵活文本引导图像编辑的语义对齐特征空间
吕岳明、赵康、彭博、江悦、张颖雅、董静
arXiv 2023年。[论文]
2023年10月12日

OmniControl：为人体运动生成提供随时控制任意关节的能力
谢一鸣、瓦伦·詹帕尼、钟磊、孙德清、姜怀祖
arXiv 2023年。[论文] [项目]
2023年10月12日

HyperHuman：基于潜在结构扩散的超写实人像生成
刘贤、任健、阿列克桑德尔·西亚罗欣、伊万·斯科罗霍多夫、李燕宇、林达华、刘熙晖、刘子威、谢尔盖·图利亚科夫
arXiv 2023年。[论文] [项目] [GitHub]
2023年10月12日

GaussianDreamer：利用点云先验从文本快速生成3D高斯溅射场景
易涛然、方继民、吴冠军、谢凌溪、张小鹏、刘文宇、田琦、王兴刚
arXiv 2023年。[论文]
2023年10月12日

MotionDirector：文本到视频扩散模型的运动自定义工具
赵睿、顾宇超、吴章杰、张俊豪、刘嘉伟、吴伟佳、尤西·凯波、郑守迈
arXiv 2023年。[论文]
2023年10月12日

通过信息分解实现可解释的扩散模型
孔祥昊、刘奥利、李涵、约加塔玛·丹妮、格雷格·韦斯特格
arXiv 2023年。[论文]
2023年10月12日

DrivingDiffusion：基于布局引导的多视角驾驶场景视频生成，采用潜在扩散模型
李晓凡、张一夫、叶晓青
arXiv 2023年。[论文] [项目] [GitHub]
2023年10月11日

ScaleCrafter：无需调优的高分辨率视觉生成，基于扩散模型
何英青、杨绍书、陈浩鑫、寸晓东、夏梦寒、张勇、王新涛、何冉、陈启峰、山莺
arXiv 2023年。[论文] [项目] [GitHub]
2023年10月11日

ConditionVideo：无需训练的条件引导文本到视频生成
彭博、陈鑫源、王耀辉、陆超超、乔宇
arXiv 2023年。[论文]
2023年10月11日

Mini-DALLE3：通过提示大型语言模型实现交互式文本到图像生成
赖泽强、朱锡洲、戴继峰、乔宇、王文海
arXiv 2023年。[论文]
2023年10月11日

Multi-Concept T2I-Zero：仅调整文本嵌入，别无其他
哈扎拉佩特·图纳尼扬、徐德佳、尚特·纳瓦萨尔迪扬、王张阳、施汉弗里
arXiv 2023年。[论文]
2023年10月11日

Uni-paint：基于预训练扩散模型的统一多模态图像修复框架
杨世远、陈晓东、廖晶
arXiv 2023年。[论文]
2023年10月11日

ObjectComposer：无需微调即可一致生成多个物体
亚历克·赫尔布林、埃文·蒙托亚、周登鸿
arXiv 2023年。[论文]
2023年10月10日

JointNet：扩展文本到图像扩散模型以进行密集分布建模
张景阳、李世伟、陆元勋、方天、大卫·麦金农、秦洋海、权龙、姚瑶
arXiv 2023年。[论文]
2023年10月10日

利用大型视觉—语言模型提升组合性文本到图像生成
宋文、方桂安、张仁瑞、高鹏、董浩、迪米特里斯·梅塔克萨斯
arXiv 2023年。[论文]
2023年10月10日

Geom-Erasing：基于几何的扩散模型中隐式概念移除
刘志立、陈凯、张一帆、韩建华、洪兰青、许航、李振国、叶迪特-颜、郭詹姆斯
arXiv 2023年。[论文]
2023年10月9日

FLATTEN：基于光流引导的注意力机制，用于一致性文本到视频编辑
丛宇仁、徐萌萌、克里斯蒂安·西蒙、陈寿发、任嘉伟、谢艳萍、胡安-曼努埃尔·佩雷斯-鲁阿、博多·罗森汉、向涛、何森
arXiv 2023年。[论文]
2023年10月9日

语言模型胜过扩散模型——分词器是视觉生成的关键
于立军、何塞·莱萨马、尼特什·B·贡达瓦拉普、卢卡·维尔萨里、苏基赫·孙、大卫·明嫩、程勇、阿格里姆·古普塔、顾雪野、亚历山大·G·豪普特曼、龚博清、杨明轩、伊尔凡·埃萨、大卫·A·罗斯、江璐
arXiv 2023年。[论文] [GitHub]
2023年10月9日

IPDreamer：基于图像提示的外观可控3D对象生成
曾博文、李尚林、冯玉堂、李宏、高思成、刘嘉铭、李华夏、唐旭、刘建庄、张宝昌
arXiv 2023年。[论文]
2023年10月9日

扩散模型作为掩码音频—视频学习器
埃尔维斯·努涅斯、金燕子、穆罕默德·拉斯泰加里、萨钦·梅塔、麦克斯韦尔·霍顿
arXiv 2023年。[论文]
2023年10月5日

通过奖励反向传播对齐文本到图像扩散模型
米希尔·普拉布杜赛、阿尼鲁德·戈亚尔、迪帕克·帕塔克、卡特琳娜·弗拉吉达基
arXiv 2023年。[论文]
2023年10月5日

Ctrl-Room：在布局约束下可控的文本到3D房间网格生成
方川、胡晓涛、罗昆明、谭平
arXiv 2023年。[论文]
2023年10月5日

MedSyn：文本引导的解剖学感知高保真 3D CT 图像合成
徐延武、孙莉、彭伟、夏姆·维斯韦斯瓦兰、凯汉·巴特曼格利奇
arXiv 2023。[论文]
2023年10月5日

Kandinsky：结合图像先验与潜在扩散模型的改进型文生图合成
安东·拉日盖耶夫、阿尔谢尼·沙赫马托夫、安娜斯塔西娅·马尔采娃、弗拉基米尔·阿爾希普金、伊戈爾·帕夫洛夫、伊利亚·里亞波夫、安吉丽娜·库茨、亚历山大·潘琴科、安德烈·库兹涅佐夫、丹尼斯·季米特罗夫
arXiv 2023。[论文]
2023年10月5日

基于语音条件的潜在扩散模型与人脸先验的逼真语音到人脸生成
王金亭、刘莉、王军、程海维克多
arXiv 2023。[论文]
2023年10月5日

T$^3$Bench：文本到3D生成领域当前进展的基准测试
何宇泽、白宇诗、林哲宇、赵旺、胡宇斌、盛珍妮、易然、李娟子、刘永进
arXiv 2023。[论文] [项目] [GitHub]
2023年10月4日

利用视觉和文本提示的扩散模型提升皮肤镜病变分割效果
杜世义、王晓松、陆永毅、周雨音、张绍婷、艾伦·尤伊尔、李康、周宗伟
arXiv 2023。[论文]
2023年10月4日

Magicremover：无需调优的文本引导图像修复——基于扩散模型
杨思远、张璐、马立倩、刘宇、傅晶晶、何友
arXiv 2023。[论文]
2023年10月4日

ED-NeRF：利用潜在空间 NeRF 对 3D 场景进行高效的文本引导编辑
朴章浩、权基贤、芮钟哲
arXiv 2023。[论文]
2023年10月4日

SweetDreamer：在 2D 扩散中对齐几何先验以实现一致的文生3D
李伟宇、陈睿、陈雪琳、谭平
arXiv 2023。[论文] [项目]
2023年10月4日

EditVal：基于扩散的文本引导图像编辑方法基准测试
萨米迪普·巴苏、梅赫达德·萨贝里、什韦塔·巴尔德瓦杰、阿图萨·马莱米尔·切吉尼、丹妮拉·马西切蒂、马齐亚尔·桑贾比、许淑华、索海尔·费伊齐
arXiv 2023。[论文] [项目] [GitHub]
2023年10月3日

FT-Shield：一种用于文生图扩散模型的防未经授权微调水印
崔英倩、任杰、林玉萍、徐涵、何鹏飞、邢悦、范文琪、刘辉、唐继良
arXiv 2023。[论文]
2023年10月3日

惊人的组合创作：适用于文生图生成的可接受交换采样
李俊、张泽东、杨健
arXiv 2023。[论文] [项目]
2023年10月3日

通过文生图扩散跨越领域：一种无源域适应方法
希万·乔普拉、苏拉杰·科塔瓦德、侯达·艾纳乌、阿曼·查达
arXiv 2023。[论文]
2023年10月2日

条件扩散蒸馏
梅康富、毛里西奥·德尔布拉西奥、侯赛因·塔莱比、涂正中、维沙尔·M·帕特尔、佩曼·米兰法尔
arXiv 2023。[论文]
2023年10月2日

直接反演：仅需三行代码即可提升基于扩散的编辑能力
鞠轩、曾爱玲、卞宇轩、刘绍腾、徐强
arXiv 2023。[论文]
2023年10月2日

针对逆问题的提示调优潜在扩散模型
郑炯镇、芮钟哲、佩曼·米兰法尔、毛里西奥·德尔布拉西奥
arXiv 2023。[论文]
2023年10月2日

DataInf：高效估算 LoRA 微调后的 LLM 和扩散模型中的数据影响力
权勇灿、吴埃里克、吴凯文、周詹姆斯
arXiv 2023。[论文]
2023年10月2日

Ground-A-Video：使用文生图扩散模型进行零样本接地视频编辑
郑贤浩、芮钟哲
arXiv 2023。[论文] [GitHub]
2023年10月2日

音乐与歌词驱动的舞蹈合成
尹文杰、姚庆元、于一、尹航、达妮卡·克拉吉奇、马尔滕·比约克曼
arXiv 2023。[论文]
2023年9月30日

DiffPoseTalk：基于扩散模型的语音驱动风格化 3D 面部动画及头部姿态生成
孙志耀、吕天、叶晟、林马修·加埃坦、盛珍妮、温宇辉、余敏静、刘永进
arXiv 2023。[论文] [项目]
2023年9月30日

PixArt-$\alpha$：用于照片级真实感文生图合成的快速训练扩散 Transformer
陈俊松、俞锦程、葛崇建、姚雷威、谢恩泽、吴岳、王忠道、郭嘉诚、罗平、卢虎川、李振国
arXiv 2023。[论文] [项目] [GitHub]
2023年9月30日

InstructCV：指令微调的文生图扩散模型作为视觉通用模型
甘玉露、朴成佑、亚历山大·舒伯特、安东尼·菲利帕基斯、艾哈迈德·M·阿拉
arXiv 2023。[论文]
2023年9月30日

Steered Diffusion：一种用于即插即用式条件图像合成的通用框架
尼廷·戈帕克里希南·奈尔、阿努普·切里安、苏哈斯·洛希特、王晔、小池明昭、维沙尔·M·帕特尔、蒂姆·K·马克斯
ICCV 2023。[论文]
2023年9月30日

直接基于可微奖励对扩散模型进行微调
凯文·克拉克、保罗·维科尔、凯文·斯韦斯基、大卫·J·弗利特
arXiv 2023。[论文]
2023年9月29日

基于扩散的感知中的文本-图像对齐
尼哈尔·孔达帕内尼、马库斯·马克斯、曼努埃尔·诺特、罗热里奥·吉马良斯、皮耶特罗·佩罗纳
arXiv 2023。[论文]
2023年9月29日

LLM 接地的视频扩散模型
连龙、史百峰、亚当·亚拉、特雷弗·达雷尔、李博益
arXiv 2023。[论文] [项目] [GitHub]
2023年9月29日

KV 反演：用于文本条件下的真实图像动作编辑的 KV 嵌入学习
黄建诚、刘一凡、秦晋、陈世峰
arXiv 2023。[论文]
2023年9月28日

CCEdit：基于扩散模型的创意可控视频编辑
冯若宇、翁文明、王艳慧、袁雨晖、鲍建民、罗冲、陈志博、郭百宁
arXiv 2023。[论文]
2023年9月28日

展示-1：将像素模型与潜在扩散模型结合用于文本到视频生成
David Junhao Zhang、Jay Zhangjie Wu、Jia-Wei Liu、Rui Zhao、Lingmin Ran、Yuchao Gu、Difei Gao、Mike Zheng Shou
arXiv 2023。[论文]
2023年9月27日

动态提示学习：解决基于文本的图像编辑中的交叉注意力泄漏问题
Kai Wang、Fei Yang、Shiqi Yang、Muhammad Atif Butt、Joost van de Weijer
arXiv 2023。[论文]
2023年9月27日

DreamCom：针对图像合成微调文本引导的修复模型
Lingxiao Lu、Bo Zhang、Li Niu
arXiv 2023。[论文]
2023年9月27日

利用文本到图像扩散模型生成的优势信息进行学习
Rafael-Edy Menadil、Mariana-Iuliana Georgescu、Radu Tudor Ionescu
arXiv 2023。[论文]
2023年9月26日

LAVIE：基于级联潜在扩散模型的高质量视频生成
Yaohui Wang、Xinyuan Chen、Xin Ma、Shangchen Zhou、Ziqi Huang、Yi Wang、Ceyuan Yang、Yinan He、Jiashuo Yu、Peiqing Yang、Yuwei Guo、Tianxing Wu、Chenyang Si、Yuming Jiang、Cunjian Chen、Chen Change Loy、Bo Dai、Dahua Lin、Yu Qiao、Ziwei Liu
arXiv 2023。[论文] [项目]
2023年9月26日

利用文本到图像扩散模型生成的优势信息进行学习
Rafael-Edy Menadil、Mariana-Iuliana Georgescu、Radu Tudor Ionescu
arXiv 2023。[论文]
2023年9月26日

FEC：三种无需微调的方法以提升真实图像编辑的一致性
Songyan Chen、Jiancheng Huang
arXiv 2023。[论文]
2023年9月26日

文本到图像定制指南：从LyCORIS微调到模型评估
Shin-Ying Yeh、Yu-Guan Hsieh、Zhidong Gao、Bernard B W Yang、Giyeong Oh、Yanmin Gong
arXiv 2023。[论文]
2023年9月26日

文本-图像引导的扩散模型用于生成名人深度伪造互动
Yunzhuo Chen、Nur Al Hasan Haldar、Naveed Akhtar、Ajmal Mian
arXiv 2023。[论文]
2023年9月26日

Free-Bloom：具有LLM导演和LDM动画师的零样本文本到视频生成器
Hanzhuo Huang、Yufan Feng、Cheng Shi、Lan Xu、Jingyi Yu、Sibei Yang
arXiv 2023。[论文]
2023年9月25日

COCO-反事实：为图像-文本对自动生成反事实示例
Tiep Le、Vasudev Lal、Phillip Howard
arXiv 2023。[论文]
2023年9月23日

基于语言-视觉模型的零样本目标计数
Jingyi Xu、Hieu Le、Dimitris Samaras
CVPR 2023。[论文] [GitHub]
2023年9月22日

MosaicFusion：将扩散模型作为数据增强工具用于大词汇量实例分割
Jiahao Xie、Wei Li、Xiangtai Li、Ziwei Liu、Yew Soon Ong、Chen Change Loy
arXiv 2023。[论文] [GitHub]
2023年9月22日

DurIAN-E：用于富有表现力的文本到语音合成的时长感知注意力网络
Yu Gu、Yianrao Bian、Guangzhi Lei、Chao Weng、Dan Su
arXiv 2023。[论文]
2023年9月22日

FreeU：扩散U型网络中的免费午餐
Chenyang Si、Ziqi Huang、Yuming Jiang、Ziwei Liu
arXiv 2023。[论文]
2023年9月20日

探究文本到音乐生成中的个性化方法
Manos Plitsis、Theodoros Kouzelis、Georgios Paraskevopoulos、Vassilis Katsouros、Yannis Panagakis
arXiv 2023。[论文] [项目]
2023年9月20日

通过一致性蒸馏加速基于扩散的文本到音频生成
Yatong Bai、Trung Dang、Dung Tran、Kazuhito Koishida、Somayeh Sojoudi
arXiv 2023。[论文]
2023年9月19日

Forgedit：通过学习与遗忘实现文本引导的图像编辑
Shiwen Zhang、Shuai Xiao、Weilin Huang
arXiv 2023。[论文] [GitHub]
2023年9月19日

什么是公平的扩散模型？设计融入多种世界观的生成式文本到图像模型
Zoe De Simone、Angie Boggust、Arvind Satyanarayan、Ashia Wilson
arXiv 2023。[论文]
2023年9月18日

Causal-Story：利用参数高效微调的局部因果注意力进行视觉故事合成
Tianyi Song、Jiuxin Cao、Kun Wang、Bo Liu、Xiaofeng Zhang
arXiv 2023。[论文]
2023年9月18日

带有软潜在方向的渐进式文本到图像扩散
YuTeng Ye、Jiale Cai、Hang Zhou、Guanwen Li、Youjia Zhang、Zikai Song、Chenxing Gao、Junqing Yu、Wei Yang
arXiv 2023。[论文]
2023年9月18日

LivelySpeaker：迈向语义感知的伴随言语手势生成
Yihao Zhi、Xiaodong Cun、Xuelin Chen、Xi Shen、Wen Guo、Shaoli Huang、Shenghua Gao
arXiv 2023。[论文]
2023年9月17日

PromptTTS++：使用自然语言描述在基于提示的文本到语音中控制说话者身份
Reo Shimizu、Ryuichi Yamamoto、Masaya Kawamura、Yuma Shirahata、Hironori Doi、Tatsuya Komatsu、Kentaro Tachibana
arXiv 2023。[论文]
2023年9月15日

AV2Wav：基于扩散的连续自监督特征重合成用于视听语音增强
Ju-Chieh Chou、Chung-Ming Chien、Karen Livescu
arXiv 2023。[论文]
2023年9月14日

视点文本反转：利用预训练的2D扩散模型释放新颖的视图合成能力
James Burgess、Kuan-Chieh Wang、Serena Yeung
arXiv 2023。[论文] [GitHub]
2023年9月14日

用于反事实解释的文本到图像模型：一种黑盒方法
Guillaume Jeanneret、Loïc Simon、Frédéric Jurie
arXiv 2023。[论文]
2023年9月14日

带有Transformer的大词汇量3D扩散模型
Ziang Cao、Fangzhou Hong、Tong Wu、Liang Pan、Ziwei Liu
arXiv 2023。[论文] [项目][GitHub]
2023年9月14日

DiffTalker：通过中间地标协同驱动的音像扩散用于会说话的人脸
Zipeng Qi、Xulong Zhang、Ning Cheng、Jing Xiao、Jianzong Wang
arXiv 2023。[论文]
2023年9月14日

用于音频语义通信的扩散模型
埃莱奥诺拉·格拉斯奇、克里斯蒂安·马里诺尼、安德烈亚·罗德里格斯、达尼洛·科明涅洛
arXiv 2023年。[论文]
2023年9月13日

DreamStyler：基于文本到图像扩散模型的风格反演绘画
安南赫、李俊秀、李忠基、金坤熙、金大植、南承勋、洪基范
arXiv 2023年。[论文]
2023年9月13日

DCTTS：用于文本到语音生成的对比学习离散扩散模型
吴志超、李秋琳、刘思行、杨群
arXiv 2023年。[论文]
2023年9月13日

InstaFlow：高质量基于扩散的文本到图像生成只需一步即可完成
刘兴超、张希文、马建竹、彭健、刘强
arXiv 2023年。[论文] [GitHub]
2023年9月12日

Fg-T2M：通过扩散模型实现细粒度文本驱动的人体运动生成
王寅、冷志英、李弗雷德里克·W·B、吴顺成、梁晓辉
ICCV 2023。[论文]
2023年9月12日

Prompting4Debugging：通过寻找问题提示对文本到图像扩散模型进行红队测试
秦志毅、蒋介明、黄清纯、陈品宇、邱伟辰
arXiv 2023年。[论文]
2023年9月12日

PhotoVerse：无需微调的文本到图像扩散模型图像定制
陈莉、赵梦怡、刘一恒、丁明旭、宋阳阳、王世尊、王旭、杨浩、刘静、杜康、郑敏
arXiv 2023年。[论文] [项目]
2023年9月11日

PAI-Diffusion：在云端构建并服务用于文本到图像合成的开源中文扩散模型家族
王成宇、段中杰、刘炳炎、邹欣怡、陈岑、贾奎、黄军
arXiv 2023年。[论文]
2023年9月11日

基于扩散的联合文本和音频表示的伴随语音手势生成
安娜·戴希勒、希瓦姆·梅塔、西蒙·亚历山德森、乔纳斯·贝斯科夫
ICMI 2023。[论文]
2023年9月11日

利用加速迭代扩散反演进行有效的真实图像编辑
潘志宏、里卡多·盖拉尔迪、谢秀峰、史蒂芬·黄
ICCV 2023。[论文]
2023年9月10日

前缀扩散：一种用于多样化图像字幕生成的轻量级扩散模型
刘贵生、李毅、费正聪、傅海燕、罗向阳、郭艳青
arXiv 2023年。[论文]
2023年9月10日

无需重新训练的文本驱动3D场景编辑
方双康、王宇峰、杨毅、蔡宜轩、丁文睿、周书畅、杨明轩
arXiv 2023年。[论文]
2023年9月10日

声音的力量（TPoS）：使用稳定扩散生成音频响应型视频
郑有珍、柳元贞、李承贤、徐多彬、卞元民、金尚弼、金镇九
arXiv 2023年。[论文]
2023年9月8日

创造你的世界：终身文本到图像扩散
孙甘、梁文琪、董家华、李军、丁正明、丛阳
arXiv 2023年。[论文]
2023年9月8日

MaskDiffusion：利用条件掩码提升文本到图像一致性
周宇鹏、周大权、朱左良、王雅星、侯启斌、冯嘉仕
arXiv 2023年。[论文]
2023年9月8日

MoEController：基于指令的任意图像操作，采用专家混合控制器
李思佳、陈晨、陆浩楠
arXiv 2023年。[论文] [项目]
2023年9月8日

从文本到掩码：利用文本到图像扩散模型的注意力定位实体
肖昌明、杨奇、周峰、张长水
arXiv 2023年。[论文]
2023年9月8日

InstructDiffusion：面向视觉任务的通用建模接口
耿子刚、杨彬鑫、杭天凯、李晨、顾书洋、张婷、鲍建民、张政、胡汉、陈东、郭百宁
arXiv 2023年。[论文] [项目] [GitHub]
2023年9月7日

用于视听少样本学习的文本到特征扩散
奥特尼尔-博格丹·梅尔恰、托马斯·胡梅尔、A·索菲娅·科普克、泽内普·阿卡塔
arXiv 2023年。[论文]
2023年9月7日

Text2Control3D：利用几何引导的文本到图像扩散模型，在神经辐射场中生成可控的3D虚拟形象
黄成源、洪俊河、秋在吉
arXiv 2023年。[论文] [项目]
2023年9月7日

复用与扩散：用于文本到视频生成的迭代去噪
顾家熙、王世聪、赵浩宇、卢天义、张星、吴祖轩、徐松岑、张伟、蒋宇刚、许航
arXiv 2023年。[论文]
2023年9月7日

SyncDreamer：从单视角图像生成多视角一致的图像
刘渊、林诚、曾子娇、龙晓晓、刘凌杰、小村拓、王文平
arXiv 2023年。[论文] [项目] [GitHub]
2023年9月7日

MCM：面向多场景的多条件运动合成框架
凌泽宇、韩博、王永康、康坎哈利、耿卫东
arXiv 2023年。[论文]
2023年9月6日

扩散模型实际上是无需训练的开放词汇语义分割器
王景隆、李夏伟、张静、徐庆远、周秦、于谦、盛路、徐东
arXiv 2023年。[论文]
2023年9月6日

从野外采集的声音生成逼真的图像
李泰京、姜正勋、金惠柔、金泰焕
ICCV 2023。[论文]
2023年9月5日

基于生成的多模态跟踪融合机制
唐章勇、徐天阳、朱雪峰、吴晓军、约瑟夫·基特勒
arXiv 2023年。[论文]
2023年9月4日

VGDiffZero：文本到图像扩散模型可以作为零样本视觉接地器
刘旭阳、黄思腾、康雅臣、陈洪刚、王东林
arXiv 2023年。[论文]
2023年9月3日

桥梁扩散模型：将非英语母语的文本到图像扩散模型与英语社区连接起来
刘善源、冷大伟、尹玉慧
arXiv 2023年。[论文]
2023年9月2日

MagicProp：基于扩散模型的运动感知外观传播视频编辑
严汉书、刘俊豪、麦龙、林善川、冯嘉实
arXiv 2023年。[论文]
2023年9月2日

基于扩散模型的迭代式多粒度图像编辑
K J Joseph、普拉特克莎·乌达亚南、特里普蒂·舒克拉、艾什瓦里娅·阿加瓦尔、斯里克里希纳·卡兰南、考斯塔瓦·戈斯瓦米、巴拉吉·瓦桑·斯里尼瓦桑
arXiv 2023年。[论文]
2023年9月1日

DiffuGen：利用稳定扩散模型生成标注图像数据集的可适应方法
迈克尔·谢诺达、爱德华·金
arXiv 2023年。[论文]
2023年9月1日

PathLDM：用于组织病理学的文本条件化潜在扩散模型
斯里卡尔·耶拉普拉加达、亚历山德罗斯·格莱科斯、普拉提克·普拉桑纳、塔赫辛·库尔茨、乔尔·萨尔茨、迪米特里斯·萨马拉斯
arXiv 2023年。[论文]
2023年9月1日

VideoGen：一种参考引导的潜在扩散方法，用于高清文生视频生成
李欣、楚文清、吴烨、袁伟航、刘方龙、张琪、李福、冯浩成、丁尔瑞、王井东
arXiv 2023年。[论文]
2023年9月1日

检测新闻中语境不符的图文配对：一种反直觉的方法
埃文德·莫霍尔特、索海尔·艾哈迈德·汗、杜克-田恩·当-阮
CBMI 2023年。[论文]
2023年8月31日

Any-Size-Diffusion：面向任意尺寸高清图像的高效文本驱动合成
郑庆平、郭元凡、邓建康、韩建华、李英、徐松岑、许航
arXiv 2023年。[论文]
2023年8月31日

MVDream：用于3D生成的多视角扩散模型
史一春、王鹏、叶江龙、麦龙、李克杰、杨晓
arXiv 2023年。[论文]
2023年8月31日

扩散模型的有趣特性：用于评估文生图生成模型自然攻击能力的大规模数据集
佐藤隆美、贾斯汀·岳、陈楠泽、王宁飞、陈启阿尔弗雷德
arXiv 2023年。[论文]
2023年8月30日

DiffusionVMR：用于视频时刻检索的扩散模型
赵恒昊、林庆宏、颜锐、李泽超
ACM MM 2023年。[论文]
2023年8月29日

C2G2：基于潜在扩散模型的可控伴随语音手势生成
季龙斌、魏鹏飞、任毅、刘景林、张晨、尹翔
arXiv 2023年。[论文]
2023年8月29日

从少量未配准的NFoV图像生成360度全景图
王炯浩、陈子宇、凌军、谢荣、宋力
ACM MM 2023年。[论文] [GitHub]
2023年8月28日

离散潜在空间中的优先级导向人体运动生成
孔汉阳、龚克洪、连东泽、毕米·迈克尔、王新超
arXiv 2023年。[论文]
2023年8月28日

SketchDreamer：交互式文本增强创意草图构思
曲志宇、向涛、宋义哲
BMVC 2023年。[论文] [GitHub]
2023年8月27日

用大语言模型赋能动态感知的文生视频扩散模型
郝飞、吴圣琼、季伟、张翰旺、蔡特生
arXiv 2023年。[论文] [项目]
2023年8月26日

ORES：开放词汇负责任的视觉合成
倪明恒、吴晨菲、王晓东、尹盛明、王丽娟、刘子诚、段楠
arXiv 2023年。[论文]
2023年8月26日

DiffuseStyleGesture+ 参与 GENEA 挑战赛 2023 的作品
杨思成、薛海威、张振松、李明磊、吴志勇、吴晓飞、徐松岑、戴宗宏
ICMI 2023年。[论文] [GitHub]
2023年8月26日

EfficientDreamer：通过正交视图扩散先验实现高保真且鲁棒的3D创作
赵敏达、赵朝义、梁心悦、李林成、赵增、胡志鹏、范昌杰、辛宇
arXiv 2023年。[论文]
2023年8月25日

扩散模型中的统一概念编辑
罗希特·甘迪科塔、哈达斯·奥尔加德、约纳坦·贝林科夫、乔安娜·马泰尔津斯卡、大卫·鲍
arXiv 2023年。[论文] [项目] [GitHub]
2023年8月25日

带有注意力调制的密集型文生图生成
金云智、李智英、金镇和、河钟佑、朱俊彦
ICCV 2023年。[论文] [GitHub]
2023年8月24日

APLA：通过对抗训练对潜在噪声进行额外扰动以实现一致性
姚玉璞、邓尚奇、曹子涵、张哈利、邓良健
arXiv 2023年。[论文]
2023年8月24日

操纵稳定扩散提示的嵌入
尼克拉斯·德克斯、朱莉娅·彼得斯、马丁·波塔斯特
arXiv 2023年。[论文]
2023年8月23日

DF-3DFace：基于扩散的一对多语音同步3D人脸动画
朴世珍、洪乔安娜、金民洙、卢永满
arXiv 2023年。[论文]
2023年8月23日

IT3D：通过显式视图合成改进文生3D生成
陈艺文、张驰、杨晓峰、蔡中刚、于刚、杨磊、林国胜
arXiv 2023年。[论文] [GitHub]
2023年8月22日

DiffCloth：基于扩散的服装合成与操控，通过结构化的跨模态语义对齐实现
张旭杰、杨彬彬、迈克尔·C·坎普夫迈耶、张文清、张诗悦、陆冠松、林亮、许航、梁晓丹
arXiv 2023年。[论文]
2023年8月22日

MusicJam：通过生成的叙事插图可视化音乐洞察
陈楚儿、曹楠、侯佳妮、郭怡、张雨蕾、石洋
arXiv 2023年。[论文]
2023年8月22日

TADA！文本转可动画数字化身
廖婷婷、易洪伟、修玉良、唐家兴、黄扬毅、尤斯图斯·蒂斯、迈克尔·J·布莱克
arXiv 2023年。[论文]
2023年8月21日

EVE：基于深度图引导和时间一致性约束的高效零样本文本驱动视频编辑
陈宇涛、董星宁、甘天、周春鸾、杨明、郭青培
arXiv 2023年。[论文]
2023年8月21日

用于概念审查的文本反转后门技术
吴宇彤、张杰、弗洛里安·克施鲍姆、张天伟
arXiv 2023年。[论文] [项目] [GitHub]
2023年8月21日

AltDiffusion：多语言文本到图像扩散模型
叶福龙、刘广、吴欣雅、吴乐迪尔
AAAI 2024。[论文] [GitHub]
2023年8月19日

DiffDis：赋予生成式扩散模型跨模态判别能力
黄润辉、韩建华、陆冠松、梁晓丹、曾一涵、张伟、徐航
ICCV 2023。[论文]
2023年8月18日

MATLABER：基于潜伏BRDF自编码器的材质感知文本到3D生成
许旭东、吕兆阳、潘星刚、戴博
arXiv 2023年。[论文] [项目]
2023年8月18日

Diff2Lip：音频条件下的唇形同步扩散模型
苏米克·穆克霍帕迪亚伊、萨克沙姆·苏里、拉维·特贾·加德、阿比纳夫·施里瓦斯塔瓦
arXiv 2023年。[论文] [项目]] [GitHub]
2023年8月18日

Guide3D：通过文本和图像引导创建3D虚拟形象
曹宇康、曹燕佩、韩凯、山英、王关义
arXiv 2023年。[论文]
2023年8月18日

面向视觉定位的语言引导扩散模型
陈思嘉、李宝春
arXiv 2023年。[论文]
2023年8月18日

SimDA：用于高效视频生成的简单扩散适配器
邢震、戴琪、胡汉、吴祖轩、蒋宇刚
arXiv 2023年。[论文] [项目]
2023年8月18日

StableVideo：文本驱动的一致性感知扩散视频编辑
柴文浩、郭迅、王高昂、卢岩
ICCV 2023。[论文] [GitHub]
2023年8月18日

利用图像扩散模型编辑时序一致的视频
王元志、李勇、刘鑫、戴安波、安东尼·陈、崔振
arXiv 2023年。[论文]
2023年8月17日

留意你的脚步：通过文本指令进行局部图像与场景编辑
阿什坎·米尔扎伊、特里斯坦·奥门塔多-阿姆斯特朗、马库斯·A·布鲁贝克、乔纳森·凯利、亚历克斯·列文施泰因、康斯坦蒂诺斯·G·德尔帕尼斯、伊戈尔·吉利琴斯基
arXiv 2023年。[论文] [项目]
2023年8月17日

学习生成语义布局以提高文本到图像合成中的文本-图像对应关系
朴敏浩、尹柱烈、崔承焕、秋在国
ICCV 2023。[论文] [项目] [GitHub]
2023年8月16日

DragNUWA：通过整合文本、图像和轨迹实现在视频生成中的细粒度控制
殷盛明、吴晨飞、梁健、石洁、李厚强、龚明、段楠
arXiv 2023年。[论文] [项目]
2023年8月16日

双流扩散网络用于文本到视频生成
刘斌辉、刘鑫、戴安波、曾志勇、崔振、杨健
arXiv 2023年。[论文]
2023年8月16日

DiffV2S：基于扩散的视频转语音合成，结合视觉引导的说话人嵌入
崔正洙、洪智恩、罗永满
arXiv 2023年。[论文]
2023年8月15日

SGDiff：一种风格引导的时尚合成扩散模型
孙正万泰、周扬宏、何红红、莫佩怡
ACM MM 2023。[论文]
2023年8月15日

舞蹈化身：利用图像扩散模型实现姿态与文本引导的人体动作视频合成
秦博生、叶文涛、于奇凡、唐思亮、庄玉婷
arXiv 2023年。[论文]
2023年8月15日

基于扩散的增强技术用于文化遗产领域的字幕生成与检索
达里奥·乔尼、洛伦佐·贝尔林乔尼、费德里科·贝卡蒂尼、阿尔贝托·德尔·宾博
ICCV研讨会2023。[论文]
2023年8月14日

侏罗纪世界重制版：通过零样本长距离图像到图像翻译让古代化石重现生机
亚历山大·马丁、郑海天、安杰、罗杰波
ACM MM 2023。[论文]
2023年8月14日

UniBrain：将图像重建与字幕生成统一于一个基于人类脑活动的扩散模型中
麦伟健、张志军
arXiv 2023年。[论文]
2023年8月14日

Free-ATM：利用自由注意力掩码探索扩散生成图像上的无监督学习
张俊豪、徐牧田、薛楚辉、张文庆、韩晓光、白松、郑守迈
arXiv 2023年。[论文]
2023年8月13日

IP适配器：用于文本到图像扩散模型的文本兼容图像提示适配器
叶虎、张军、刘思博、韩晓、杨伟
arXiv 2023年。[论文] [项目] [GitHub]
2023年8月13日

LAW-Diffusion：利用布局进行扩散的复杂场景生成
杨彬彬、罗毅、陈子良、王广润、梁晓丹、林亮
arXiv 2023年。[论文]
2023年8月13日

ModelScope文本到视频技术报告
王九牛、袁航杰、陈大有、张颖雅、王翔、张世伟
arXiv 2023年。[论文]
2023年8月12日

DatasetDM：利用扩散模型合成带有感知标注的数据集
吴伟佳、赵宇中、陈浩、顾宇超、赵锐、何业飞、周虹、郑守迈、沈春华
arXiv 2023年。[论文] [项目] [GitHub]
2023年8月11日

利用扩散进行多样化的数据增强，以实现有效的测试时提示调优
冯春梅、于凯、刘勇、萨尔曼·汗、左望盟
ICCV 2023。[论文] [GitHub]
2023年8月11日

带掩码注意力的扩散引导，用于空间控制文本到图像生成
远藤由纪
arXiv 2023年。[论文]
2023年8月11日

音频一体化：基于WavLM预训练模型的语音驱动手势合成
张帆、季娜耶、高福兴、赵思远、王兆涵、李顺满
arXiv 2023年。[论文]
2023年8月11日

零样本文本驱动的物理可解释人脸编辑
孟亚鹏、杨松儒、胡旭、赵睿、李林成、史振伟、邹正霞
arXiv 2023年。[论文]
2023年8月11日

PromptPaint：通过类似绘画媒介的交互引导文生图生成
John Joon Young Chung、Eytan Adar
UIST 2023。[论文]
2023年8月9日

LayoutLLM-T2I：从大语言模型中提取布局指导用于文生图生成
Qu Leigang、吴圣琼、Fei Hao、Nie Liqiang、Chua Tat-Seng
arXiv 2023年。[论文] [项目]
2023年8月9日

Cloth2Tex：用于3D虚拟试衣的定制化布料纹理生成流水线
Gao Daiheng、Chen Xu、Zhang Xindi、Wang Qi、Sun Ke、Zhang Bang、Bo Liefeng、Huang Qixing
arXiv 2023年。[论文]
2023年8月8日

MindDiffuser：基于语义与结构扩散模型，从人类脑活动中可控地重建图像
Lu Yizhuo、Du Changde、Zhou Qiongyi、Wang Dianpeng、He Huiguang
arXiv 2023年。[论文]
2023年8月8日

FLIRT：反馈循环式上下文红队攻击
Mehrabi Ninareh、Goyal Palash、Dupuy Christophe、Hu Qian、Ghosh Shalini、Zemel Richard、Chang Kai-Wei、Galstyan Aram、Gupta Rahul
arXiv 2023年。[论文]
2023年8月8日

DiffSynth：用于逼真视频合成的潜在空间迭代去 flicker 技术
Duan Zhongjie、You Lizhou、Wang Chengyu、Chen Cen、Wu Ziheng、Qian Weining、Huang Jun
arXiv 2023年。[论文] [项目] [GitHub]
2023年8月7日

AvatarVerse：基于文本和姿态的高质量且稳定的3D虚拟形象生成
Zhang Huichao、Chen Bowen、Yang Hao、Qu Liao、Wang Xu、Chen Li、Long Chao、Zhu Feida、Du Kang、Zheng Min
arXiv 2023年。[论文] [项目]
2023年8月7日

迈向场景文本到场景文本的翻译
Susladkar Onkar、Gatti Prajwal、Mishra Anand
arXiv 2023年。[论文]
2023年8月6日

草图与文本引导的扩散模型用于彩色点云生成
Wu Zijie、Wang Yaonan、Feng Mingtao、Xie He、Mian Ajmal
arXiv 2023年。[论文]
2023年8月5日

ConceptLab：利用扩散先验约束进行创意生成
Richardson Elad、Goldberg Kfir、Alaluf Yuval、Cohen-Or Daniel
arXiv 2023年。[论文] [项目]] [GitHub]
2023年8月3日

DiffColor：基于扩散模型的高保真文本引导图像上色
Lin Jianxin、Xiao Peng、Wang Yijun、Zhang Rongju、Zeng Xiangxiang
arXiv 2023年。[论文]
2023年8月3日

通过连贯采样利用扩散模型合成长期人体运动
Yang Zhao、Su Bing、Wen Ji-Rong
ACM MM 2023。[论文] [GitHub]
2023年8月3日

逆向稳定扩散：这张图是用什么提示词生成的？
Croitoru Florinel-Alin、Hondru Vlad、Ionescu Radu Tudor、Shah Mubarak
arXiv 2023年。[论文]
2023年8月2日

退化调优：利用打乱网格屏蔽稳定扩散中的不良概念
Ni Zixuan、Wei Longhui、Li Jiacheng、Tang Siliang、Zhuang Yueting、Tian Qi
arXiv 2023年。[论文]
2023年8月2日

ImageBrush：学习基于示例的图像操作的视觉上下文指令
Sun Yasheng、Yang Yifan、Peng Houwen、Shen Yifei、Yang Yuqing、Hu Han、Qiu Lili、Koike Hideki
arXiv 2023年。[论文]
2023年8月2日

文生图生成中的偏差放大悖论
Seshadri Preethi、Singh Sameer、Elazar Yanai
arXiv 2023年。[论文]
2023年8月1日

BAGM：一种针对文生图生成模型的后门攻击方法
Vice Jordan、Akhtar Naveed、Hartley Richard、Mian Ajmal
arXiv 2023年。[论文] [GitHub] [数据集]
2023年7月31日

MobileVidFactory：基于扩散模型的移动端自动文生社交短视频生成
Zhu Junchen、Yang Huan、Wang Wenjing、He Huiguo、Tuo Zixi、Yu Yongsheng、Cheng Wen-Huang、Gao Lianli、Song Jingkuan、Fu Jianlong、Luo Jiebo
arXiv 2023年。[论文]
2023年7月31日

DAVIS：利用生成式扩散模型实现高质量音视频分离
Huang Chao、Liang Susan、Tian Yapeng、Kumar Anurag、Xu Chenliang
arXiv 2023年。[论文]
2023年7月31日

对比条件潜在扩散用于音视频分割
Mao Yuxin、Zhang Jing、Xiang Mochu、Lv Yunqiu、Zhong Yiran、Dai Yuchao
arXiv 2023年。[论文]
2023年7月31日

HD-Fusion：利用多噪声估计实现细节丰富的文生3D生成
Wu Jinbo、Gao Xiaobo、Liu Xing、Shen Zhengyang、Zhao Chen、Feng Haocheng、Liu Jingtuo、Ding Errui
arXiv 2023年。[论文]
2023年7月30日

透过大脑看世界：从人类脑信号中重建视觉感知图像
Lan Yu-Ting、Ren Kan、Wang Yansen、Zheng Wei-Long、Li Dongsheng、Lu Bao-Liang、Qiu Lili
arXiv 2023年。[论文]
2023年7月27日

VideoControlNet：基于ControlNet的扩散模型驱动的运动引导视频到视频转换框架
Hu Zhihao、Xu Dong
arXiv 2023年。[论文] [项目]
2023年7月26日

Points-to-3D：弥合稀疏点云与形状可控的文生3D生成之间的差距
Yu Chaohui、Zhou Qiang、Li Jingliang、Zhang Zhe、Wang Zhibin、Wang Fan
arXiv 2023年。[论文]
2023年7月26日

视觉指令反演：通过视觉提示进行图像编辑
Nguyen Thao、Li Yuheng、Ojha Utkarsh、Lee Yong Jae
arXiv 2023年。[论文] [项目] [GitHub]
2023年7月26日

复合扩散 | 整体 >= \Sigma 部分
维克拉姆·贾姆瓦尔，拉马内斯瓦兰·S
arXiv 2023. [论文]
2023年7月25日

时尚矩阵：仅通过对话编辑照片
郑冲，张旭杰，赵福伟，谢振宇，梁晓丹
arXiv 2023. [论文] [项目] [GitHub]
2023年7月25日

从黎曼几何视角理解扩散模型的潜在空间
朴勇贤，权明基，崔在雄，曹正孝，禹英中
arXiv 2023. [论文]
2023年7月24日

InFusion：注入与注意力融合用于多概念零样本文本驱动视频编辑
阿南特·坎德尔瓦尔
ICCV研讨会2023. [论文]
2023年7月22日

主体扩散：无需测试时微调的开放域个性化文生图生成
马健，梁俊豪，陈晨，陆浩楠
arXiv 2023. [论文] [项目] [GitHub]
2023年7月21日

分割并绑定你的注意力以提升生成式语义护理
李雨萌，玛格丽特·科伊珀，张丹，安娜·霍列娃
arXiv 2023. [论文] [项目]
2023年7月20日

AdjointDPM：用于扩散概率模型梯度反向传播的伴随灵敏度方法
潘嘉淳，刘俊豪，谭永辉，冯家世，严汉书
arXiv 2023. [论文]
2023年7月20日

BoxDiff：无训练约束框扩散的文生图合成
谢金恒，李越翔，黄雅文，刘浩哲，张文天，郑业峰，Mike Zheng Shou
arXiv 2023. [论文] [GitHub]
2023年7月20日

Text2Layer：基于潜在扩散模型的分层图像生成
张新阳，赵文天，卢欣，Jeff Chien
arXiv 2023. [论文]
2023年7月19日

FABRIC：利用迭代反馈个性化扩散模型
迪米特里·冯·吕特，伊丽莎白·费德莱，乔纳森·托姆，卢卡斯·沃尔夫
arXiv 2023. [论文]
2023年7月19日

TokenFlow：用于一致视频编辑的一致性扩散特征
米哈尔·盖耶，奥默·巴尔-塔尔，沙伊·巴贡，塔莉·德克尔
arXiv 2023. [论文] [项目] [GitHub]
2023年7月19日

多模态扩散分割模型用于基于操作指令的对象分割
井冈由衣，吉田优，和田唯贺，波中周平，杉浦公明
arXiv 2023. [论文]
2023年7月17日

并非所有步骤都同等重要：用于图像操作的选择性扩散蒸馏
王洛舟，杨帅，刘舒，陈英聪
ICCV 2023. [论文] [GitHub]
2023年7月17日

基于骨骼的视频异常检测的多模态运动条件扩散模型
亚历山德罗·弗拉博雷亚，卢卡·科洛罗内，圭多·达梅利，斯特凡诺·达里戈，巴尔德·普伦卡伊，法比奥·加拉索
arXiv 2023. [论文]
2023年7月14日

HyperDreamBooth：用于快速个性化文生图模型的超网络
纳塔尼尔·鲁伊斯，李元珍，瓦伦·詹帕尼，魏巍，侯廷博，雅埃尔·普里奇，尼尔·瓦德瓦，迈克尔·鲁宾斯坦，克菲尔·阿伯曼
arXiv 2023. [论文] [项目] [GitHub]
2023年7月13日

通过双向积分近似实现精确的扩散逆向过程
张国强，J. P. 路易斯，W. 巴斯蒂安·克莱因
arXiv 2023. [论文]
2023年7月10日

AnimateDiff：无需特定微调即可动画化你的个性化文生图扩散模型
郭宇威，杨策源，饶安怡，王耀辉，乔宇，林大华，戴博
arXiv 2023. [论文] [项目] [GitHub]
2023年7月10日

划分、评估与精炼：利用迭代VQA反馈评估和改进文生图对齐
贾斯基拉特·辛格，郑亮
arXiv 2023. [论文] [项目] [GitHub]
2023年7月10日

SemEval-2023任务1中的增强器：通过提示增强和文生图扩散提升CLIP在处理组合性和歧义方面的零样本视觉WSD能力
李杰思，萧友庭，施永祥，乔纳斯·盖平
arXiv 2023. [论文]
2023年7月9日

衡量扩散模型模仿人类艺术家的成功程度
斯蒂芬·卡斯珀，郭子凡，莫古洛图·施瑞娅，扎卡里·马里诺夫，钦迈·德什潘德，余睿杰，戴征，迪伦·哈德菲尔德-梅内尔
ICML研讨会2023. [论文]
2023年7月8日

如何检测文生图扩散模型中的未经授权数据使用
王振霆，陈晨，刘宇辰，吕玲娟，迪米特里斯·梅塔克萨斯，马士清
arXiv 2023. [论文]
2023年7月6日

协作评分蒸馏用于一致性视觉合成
金秀彬，李京民，崔俊锡，郑宗宪，孙起赫，申镇宇
arXiv 2023. [论文] [项目] [GitHub]
2023年7月4日

SDXL：改进潜在扩散模型以实现高分辨率图像合成
达斯汀·波德尔，锡安·英格利什，凯尔·莱西，安德烈亚斯·布拉特曼，蒂姆·多克霍恩，约纳斯·穆勒，乔·佩纳，罗宾·罗姆巴赫
arXiv 2023. [论文] [GitHub]
2023年7月4日

MVDiffusion：通过对应感知扩散实现整体多视角图像生成
唐世涛，张富阳，陈嘉诚，王鹏，古川康隆
arXiv 2023. [论文] [项目]
2023年7月3日

计数引导用于高保真文生图合成
姜元俊，凯文·加林，具亨一
arXiv 2023. [论文]
2023年6月30日

米开朗基罗：基于形状-图像-文本对齐潜在表征的条件化3D形状生成
赵子博、刘文、陈欣、曾先芳、王睿、程培、傅斌、陈涛、于刚、高胜华
arXiv 2023年。[论文]
2023年6月29日

在任何场景中任意位置生成任何内容
李宇恒、刘海天、温阳明、李勇 Jae
arXiv 2023年。[论文] [项目]
2023年6月29日

Diff-Foley：基于潜在扩散模型的同步视频到音频合成
罗思勉、闫川浩、胡晨旭、赵航
arXiv 2023年。[论文] [GitHub]
2023年6月29日

PFB-Diff：用于文本驱动图像编辑的渐进式特征融合扩散模型
黄文静、涂世奎、徐磊
arXiv 2023年。[论文]
2023年6月28日

DiffSketcher：通过潜在扩散模型实现的文本引导矢量草图合成
邢锡明、王闯、周海涛、张静、于倩、徐东
arXiv 2023年。[论文]
2023年6月26日

A-STAR：用于文本到图像合成的测试时注意力分离与保留
艾什瓦里娅·阿加瓦尔、斯里克里希纳·卡兰南、K J 约瑟夫、阿普尔夫·萨克塞纳、考斯塔瓦·戈斯瓦米、巴拉吉·瓦桑·斯里尼瓦桑
arXiv 2023年。[论文]
2023年6月26日

分解与重对齐：解决文本到图像扩散模型中的条件错位问题
王洛舟、沈贵宝、李一君、陈英聪
arXiv 2023年。[论文]
2023年6月26日

面向文本到图像扩散模型的零样本空间布局条件化
纪尧姆·库瓦隆、玛琳·卡雷伊、马蒂厄·科尔德、斯特凡·拉图利耶、雅各布·韦伯克
arXiv 2023年。[论文]
2023年6月23日

DreamTime：一种改进的文本到3D内容生成优化策略
黄玉坤、王佳楠、史宇凯、齐宪标、查正军、张磊
arXiv 2023年。[论文]
2023年6月21日

对齐、适配与注入：声音引导的统一图像生成
杨悦、张凯鹏、葛雨莹、邵文琪、薛泽越、乔宇、罗平
arXiv 2023年。[论文]
2023年6月20日

EMoG：利用扩散模型合成富有情感的伴随语音3D手势
尹莲英、王一君、何天宇、刘金明、赵伟、李博文、金鑫、林建新
arXiv 2023年。[论文]
2023年6月20日

RS5M：用于遥感视觉-语言基础模型的大规模视觉-语言数据集
张子伦、赵天成、郭宇龙、尹建伟
arXiv 2023年。[论文]
2023年6月20日

Instruct-NeuralTalker：使用指令编辑音频驱动的说话辐射场
孙宇奇、何瑞安、谭伟民、严波
arXiv 2023年。[论文]
2023年6月19日

基于扩散模型的条件化文本图像生成
朱元志、李兆海、王天伟、何孟超、姚聪
arXiv 2023年。[论文]
2023年6月19日

利用预训练文本到图像扩散模型进行点云补全
科斯滕·约尼、拉哈米姆·欧哈德、切奇克·加尔
arXiv 2023年。[论文]
2023年6月18日

用于文本到图像扩散模型中贝叶斯上下文更新的能量基交叉注意力
朴健荣、金正率、金범洙、李相完、叶宗哲
arXiv 2023年。[论文]
2023年6月16日

评估文本到图像扩散模型对现实攻击的鲁棒性
高洪成、张浩、董银鹏、邓志杰
arXiv 2023年。[论文]
2023年6月16日

CLIPSonic：利用未标注视频和预训练语言-视觉模型进行文本到音频合成
董浩文、刘晓宇、庞斯·若尔迪、巴塔查里亚·高塔姆、帕斯夸尔·圣地亚哥、塞拉·琼安、伯格-柯克帕特里克·泰勒、麦考利·朱利安
arXiv 2023年。[论文]
2023年6月16日

驯服扩散模型以生成音乐驱动的指挥动作
赵卓然、白金彬、陈德龙、王德邦、潘宇博
arXiv 2023年。[论文]
2023年6月15日

Diff-TTSG：去噪概率集成的语音与手势合成
梅塔·希瓦姆、王思扬、亚历山大森·西蒙、贝斯科夫·乔纳斯、塞凯利·埃娃、亨特·古斯塔夫·埃耶
arXiv 2023年。[论文]
2023年6月15日

用于零样本开放词汇分割的扩散模型
卡拉齐亚·劳里纳斯、莱娜·伊罗、韦达尔迪·安德烈亚、鲁普雷希特·克里斯蒂安
arXiv 2023年。[论文]
2023年6月15日

扩散模型中的语言绑定：通过注意力图对齐增强属性对应关系
拉辛·罗伊、赫尔施·埃兰、格利克曼·丹尼尔、拉夫福格尔·绍利、戈德堡·约阿夫、切奇克·加尔
arXiv 2023年。[论文]
2023年6月15日

使用生成的图像和字幕训练多媒体事件提取
杜子林、李云欣、郭旭、孙怡丹、李博洋
arXiv 2023年。[论文]
2023年6月15日

VidEdit：零样本且具有空间感知的文本驱动视频编辑
库瓦隆·保罗、朗布尔·克莱芒、奥热尔·让-埃马纽埃尔、托梅·尼古拉斯
arXiv 2023年。[论文]
2023年6月14日

面向文本到图像生成的范数引导潜在空间探索
萨缪尔·德维尔、本-阿里·拉米、达尔尚·尼尔、马龙·哈盖、切奇克·加尔
arXiv 2023年。[论文]
2023年6月14日

用于可变尺寸文本到图像合成的无训练扩散模型适应
金志宇、申旭丽、李斌、薛向阳
arXiv 2023年。[论文]
2023年6月14日

GBSD：基于阶段扩散的散景生成
邓继仁、周欣、田浩、潘志宏、阿吉亚尔·德里克
arXiv 2023年。[论文]
2023年6月14日

扩散中的扩散：用于文本-视觉条件化生成的循环单向扩散
杨永奇、王若宇、钱志豪、朱烨、吴宇
arXiv 2023年。[论文]
2023年6月14日

重新渲染一段视频：零样本文本引导的视频到视频转换
杨帅、周义凡、刘子威、洛伊·陈昌
arXiv 2023年。[论文]
2023年6月13日

去噪式粘贴、修复与调和：基于预训练扩散模型的主题驱动图像编辑
张欣、郭家贤、尤保罗、松尾丰、岩泽佑介
arXiv 2023年。[论文]
2023年6月13日

通过正交微调控制文本到图像的扩散模型
邱泽宇、刘伟阳、冯海文、薛宇轩、冯瑶、刘振、张丹、阿德里安·韦勒、伯恩哈德·肖尔科普夫
arXiv 2023年。[论文]
2023年6月12日

MovieFactory：利用大型语言和图像生成模型从文本自动生成电影
朱俊臣、杨欢、何慧国、王文静、拓子熙、程文煌、高连丽、宋景宽、傅建龙
arXiv 2023年。[论文]
2023年6月12日

InstructP2P：学习使用文本指令编辑三维点云
徐佳乐、王新涛、曹燕佩、程伟浩、单颖、高圣华
arXiv 2023年。[论文]
2023年6月12日

基于场景级扩散的文本引导交通仿真
钟子渊、戴维斯·伦佩、陈宇晓、鲍里斯·伊万诺维奇、曹宇龙、徐丹菲、马可·帕沃内、贝莎基·雷
arXiv 2023年。[论文]
2023年6月10日

BOOT：基于自举的数据无依赖去噪扩散模型蒸馏
顾嘉涛、翟双飞、张一哲、刘凌杰、乔什·萨斯金德
arXiv 2023年。[论文]
2023年6月8日

基于注意力重聚焦的接地型文本到图像合成
阮氏琼、葛松伟、黄家彬
arXiv 2023年。[论文]
2023年6月8日

SyncDiffusion：通过同步联合扩散实现连贯蒙太奇
李有成、金坤浩、金贤珍、成珉赫
arXiv 2023年。[论文] [项目] [GitHub]
2023年6月8日

借助近端指导改进无需调优的真实图像编辑
韩立功、温松、陈琪、张志兴、宋坤鹏、任孟威、高瑞江、陈宇晓、刘迪、张启龙、阿纳斯塔西斯·斯塔索普洛斯、蒋金东、夏兆阳、阿卡什·斯里瓦斯塔瓦、迪米特里斯·梅塔克萨斯
arXiv 2023年。[论文]
2023年6月8日

WOUAF：用于文本到图像扩散模型中用户归属与指纹识别的权重调制
金昌勋、迈克尔·闵、梅特雷亚·帕特尔、程晟、杨业周
arXiv 2023年。[论文]
2023年6月7日

ConceptBed：评估文本到图像扩散模型的概念学习能力
梅特雷亚·帕特尔、泰贾斯·戈克莱、奇塔·巴拉尔、杨业周
arXiv 2023年。[论文]
2023年6月7日

为StableDiffusion设计更好的非对称VQGAN
朱子欣、冯雪露、陈冬冬、鲍建民、王乐、陈银鹏、袁璐、华刚
arXiv 2023年。[论文] [GitHub]
2023年6月7日

多模态潜在扩散
穆斯塔法·布努阿、朱利奥·弗朗泽塞、皮耶特罗·米基阿尔迪
arXiv 2023年。[论文]
2023年6月7日

将几何控制融入文本到图像扩散模型，以文本提示生成高质量检测数据
陈凯、谢恩泽、陈哲、洪兰青、李振国、叶德言
arXiv 2023年。[论文]
2023年6月7日

利用非对称梯度引导改进基于扩散的图像翻译
权基贤、叶宗哲
arXiv 2023年。[论文]
2023年6月7日

Stable Diffusion并不稳定
杜成斌、李艳希、邱仲伟、许畅
arXiv 2023年。[论文]
2023年6月5日

LipVoicer：基于唇读引导从无声视频生成语音
约哈伊·耶米尼、阿维夫·沙姆西安、利奥尔·布拉查、沙龙·加诺特、伊森·费塔亚
arXiv 2023年。[论文] [项目]
2023年6月5日

HeadSculpt：用文本打造三维头部头像
韩晓、曹宇康、韩凯、朱夏天、邓健康、宋义哲、向涛、王冠仪
arXiv 2023年。[论文] [项目]
2023年6月5日

Instruct-Video2Avatar：带指令的视频到头像生成
李绍旭
arXiv 2023年。[论文]
2023年6月5日

迈向统一的基于文本的人物检索：大规模多属性与语言搜索基准测试
杨书宇、周怡楠、王雅雄、吴玉娇、朱莉、郑哲东
arXiv 2023年。[论文]
2023年6月5日

只需少量文本输入即可实现用户友好的图像编辑：利用标题生成与注入技术
金善宇、张宇锡、金贤洙、金俊浩、崔允洁、金承龙、李佳英
arXiv 2023年。[论文]
2023年6月5日

用于多对象文本到图像生成的检测器引导
刘鲁平、张子健、任毅、黄荣杰、尹翔、赵舟
arXiv 2023年。[论文]
2023年6月4日

VideoComposer：具有运动可控性的组合式视频合成
王翔、袁航杰、张世伟、陈大有、王九牛、张英雅、沈宇君、赵德利、周敬仁
NeruIPS 2023年。[论文] [项目] [GitHub]
2023年6月3日

用于分析文本到图像模型偏差的词级解释
亚历山大·林、卢卡斯·蒙特罗·佩斯、斯里·哈尔沙·坦内鲁、苏拉杰·斯里尼瓦斯、希玛宾杜·拉卡拉朱
arXiv 2023年。[论文]
2023年6月3日

基于分布上的分数蒸馏采样的高效文本引导三维人像生成
程义吉、殷飞、黄小科、于欣彤、刘家祥、冯世坤、杨宇久、唐延松
arXiv 2023年。[论文]
2023年6月3日

文本到视频模型的概率适应
杨梦娇、杜一伦、戴博、戴尔·舒尔曼斯、乔舒亚·B·特南鲍姆、皮特·阿贝尔
arXiv 2023年。[论文] [项目]
2023年6月2日

利用预训练的文本到图像扩散模型进行视频着色
刘汉元、谢敏山、邢金波、李成泽、王天赐
arXiv 2023年。[论文]
2023年6月2日

基于分数的生成模型的视听语音增强
尤利乌斯·里希特、西蒙娜·弗林特罗普、蒂莫·格尔克曼
arXiv 2023年。[论文]
2023年6月2日

隐私蒸馏：降低多模态扩散模型的再识别风险
弗吉尼亚·费尔南德斯、佩德罗·桑切斯、沃尔特·雨果·洛佩斯·皮纳亚、格热戈日·雅琴科夫、索提里奥斯·A·察夫塔里斯、若热·卡多佐
arXiv 2023年。[论文]
2023年6月2日

StableRep：文本到图像模型生成的合成图像可构建强大的视觉表征学习器
田永龙、范丽洁、菲利普·伊索拉、常慧文、迪利普·克里希南
arXiv 2023年。[论文]
2023年6月1日

用于可控图像生成的扩散自引导
戴夫·埃普斯坦、艾伦·贾布里、本·普尔、阿列克谢·A·叶夫罗斯、亚历山大·霍林斯基
arXiv 2023年。[论文] [项目]
2023年6月1日

StyleDrop：以任意风格进行文本到图像生成
苏基赫、纳塔尼尔·鲁伊斯、金民李、丹尼尔·卡斯特罗·钦、伊琳娜·布洛克、常慧文、贾雷德·巴伯、陆江、格伦·恩蒂斯、李元振、袁浩、伊尔凡·埃萨、迈克尔·鲁宾斯坦、迪利普·克里希南
arXiv 2023年。[论文] [项目]
2023年6月1日

文本引导的扩散模型的有趣特性
刘启豪、亚当·科蒂莱夫斯基、白宇彤、白松、艾伦·尤伊尔
arXiv 2023年。[论文]
2023年6月1日

智能格林——基于潜在扩散模型的开放式视觉叙事
刘畅、吴浩宁、钟宇杰、张晓云、谢伟迪
arXiv 2023年。[论文] [项目]
2023年6月1日

ViCo：用于个性化文本到图像生成的细节保留型视觉条件
郝绍哲、韩凯、赵世昊、王冠义
arXiv 2023年。[论文] [GitHub]
2023年6月1日

扩散模型的隐藏语言
希拉·切费尔、奥兰·朗、莫尔·格瓦、沃洛季米尔·波洛苏欣、阿萨夫·肖彻、米哈尔·伊拉尼、因巴尔·莫塞里、利奥尔·沃尔夫
arXiv 2023年。[论文] [项目]
2023年6月1日

鸡尾酒：用于文本条件图像生成的多模态控制混合
胡明辉、郑建斌、刘大清、郑传霞、王超跃、陶大成、詹达珍
arXiv 2023年。[论文] [项目] [GitHub]
2023年6月1日

制作你的视频：利用文本和结构指导进行定制化视频生成
邢金波、夏梦涵、刘宇鑫、张悦晨、张勇、何英青、刘汉源、陈浩鑫、孙晓东、王新涛、单颖、王天赐
arXiv 2023年。[论文] [项目]
2023年6月1日

通过名人基底将任何人插入扩散模型
袁戈、孙晓东、张勇、李茂茂、齐晨阳、王新涛、单颖、郑惠成
arXiv 2023年。[论文] [项目]
2023年6月1日

香肠：高效预训练文本到图像模型
巴勃罗·佩尔尼亚斯、多米尼克·兰帕斯、马克·奥布雷维尔
arXiv 2023年。[论文]
2023年6月1日

UniDiff：通过生成式与判别式学习推进视觉—语言模型
董晓、黄润辉、魏小勇、解泽群、于建兴、尹健、梁晓丹
arXiv 2023年。[论文]
2023年6月1日

FigGen：文本到科学图表生成
胡安·A·罗德里格斯、大卫·巴斯克斯、伊萨姆·拉拉吉、马可·佩德罗利、保·罗德里格斯
ICLR 2023年。[论文]
2023年6月1日

扩散画笔：基于潜在扩散模型的AI生成图像编辑工具
佩曼·戈拉米、罗伯特·萧
arXiv 2023年。[论文]
2023年5月31日

理解并缓解扩散模型中的抄袭问题
高塔米·索梅帕利、瓦苏·辛格拉、米卡·戈德布卢姆、乔纳斯·盖平、汤姆·戈德斯坦
CVPR 2023年。[论文] [GitHub]
2023年5月31日

Control4D：从2D扩散编辑器中学习4D GAN实现动态人像编辑
邵睿智、孙景翔、彭程、郑泽荣、周博耀、张洪文、刘业彬
arXiv 2023年。[论文] [项目]
2023年5月31日

通过细粒度语义奖励提升文本到图像扩散模型
方桂安、蒋祖涛、韩建华、陆冠松、徐航、梁晓丹
arXiv 2023年。[论文] [GitHub]
2023年5月31日

扰动辅助样本合成：一种用于不确定性量化的新方法
刘一飞、沈瑞克、沈晓彤
arXiv 2023年。[论文]
2023年5月30日

PanoGen：用于视觉—语言导航的文本条件全景环境生成
李佳璐、莫希特·班萨尔
arXiv 2023年。[论文] [项目] [GitHub]
2023年5月30日

视频ControlNet：利用条件图像扩散模型实现时序一致的合成到真实视频转换
厄尼·楚、林硕延、陈俊诚
arXiv 2023年。[论文]
2023年5月30日

嵌套扩散过程用于随时图像生成
诺姆·埃拉塔、巴哈贾特·卡瓦尔、托默·米哈埃利、迈克尔·埃拉德
arXiv 2023年。[论文]
2023年5月30日

StyleAvatar3D：利用图像—文本扩散模型生成高保真3D头像
张驰、陈艺文、傅亦军、周正林、于刚、王比兹、付斌、陈涛、林国生、沈春华
arXiv 2023年。[论文]
2023年5月30日

HiFA：借助先进扩散引导实现高保真文本到3D生成
朱俊哲、庄培烨
arXiv 2023年。[论文]
2023年5月30日

LayerDiffusion：利用扩散模型进行分层可控图像编辑
李鹏志、黄钦轩、丁益康、李志恒
arXiv 2023年。[论文]
2023年5月30日

使用GPT-4进行可控文本到图像生成
张天俊、张毅、维布哈夫·维尼特、尼尔·乔希、王欣
arXiv 2023年。[论文]
2023年5月29日

受认知启发的跨模态数据生成：利用扩散模型
胡子钊、穆罕默德·罗斯塔米
NeurIPS 2023年。[论文]
2023年5月28日

RAPHAEL：通过大量扩散路径组合进行文本到图像生成
薛泽越、宋广禄、郭秋珊、刘博晓、宗卓凡、刘宇、罗平
arXiv 2023年。[论文]
2023年5月29日

Mix-of-Show：用于扩散模型多概念定制的去中心化低秩适配
顾宇超、王新涛、吴章杰、史宇俊、陈云鹏、范子涵、肖武友、赵睿、常淑宁、吴伟嘉、葛一骁、单颖、寿正中
arXiv 2023年。[论文] [项目]
2023年5月29日

Gen-L-Video：通过时间协同去噪实现多文本到长视频生成
王福云、陈文硕、宋广路、叶韩佳、刘宇、李洪胜
arXiv 2023年。[论文] [GitHub]
2023年5月29日

基于多上下文数据生成的纯文本图像字幕生成
马飞鹏、周义舟、饶凤云、张悦怡、孙晓燕
arXiv 2023年。[论文]
2023年5月29日

InstructEdit：利用用户指令改进基于扩散的图像编辑自动掩码
王倩、张彪、迈克尔·比尔萨克、彼得·翁卡
arXiv 2023年。[论文]
2023年5月29日

文本驱动的图像到图像转换中的条件分数引导
李贤洙、姜珉洙、韩宝亨
arXiv 2023年。[论文]
2023年5月29日

通过移除图像信息进行文本到图像编辑
张仲平、郑健、方志远、布莱恩·A·普拉默
arXiv 2023年。[论文]
2023年5月27日

利用文本到图像扩散模型实现一致的视频编辑
张子程、李博楠、聂学成、韩聪颖、郭天德、刘洛琪
arXiv 2023年。[论文]
2023年5月27日

FISEdit：通过启用缓存的稀疏扩散推理加速文本到图像编辑
于子豪、李浩洋、傅方成、缪旭鹏、崔斌
arXiv 2023年。[论文]
2023年5月27日

ControlVideo：为一次性文本到视频编辑添加条件控制
赵敏、王荣振、鲍凡、李崇轩、朱军
arXiv 2023年。[论文] [项目]
2023年5月26日

基于自适应上下文建模的视觉故事生成优化
冯章银、任宇辰、于欣淼、冯晓成、唐杜宇、施书铭、秦冰
arXiv 2023年。[论文]
2023年5月26日

负提示反演：用于文本引导扩散模型编辑的快速图像反演
宫胁大辉、井原彰宏、斋藤优、田中俊之
arXiv 2023年。[论文]
2023年5月26日

扩散模型是视觉与语言推理者吗？
本诺·克罗耶尔、埃莉诺·普尔-达扬、维克拉姆·沃莱蒂、克里斯托弗·帕尔、西瓦·雷迪
arXiv 2023年。[论文] [GitHub]
2023年5月25日

DPOK：用于微调文本到图像扩散模型的强化学习
范莹、奥利维亚·沃特金斯、杜玉清、刘浩、柳文京、克雷格·布提利耶、皮特·阿贝尔、穆罕默德·加瓦姆扎德、李康昱、李基民
arXiv 2023年。[论文]
2023年5月25日

Uni-ControlNet：面向文本到图像扩散模型的一体化控制
赵世昊、陈东东、陈彦君、包建民、郝绍哲、袁璐、黄冠仪
arXiv 2023年。[论文] [项目] [GitHub]
2023年5月25日

扩散模型的并行采样
安迪·石、苏尼尔·贝尔哈勒、斯特法诺·埃尔蒙、多尔萨·萨迪格、尼玛·阿纳里
arXiv 2023年。[论文] [GitHub]
2023年5月25日

Break-A-Scene：从单张图像中提取多个概念
欧姆里·阿夫拉哈米、克菲尔·阿伯曼、欧哈德·弗里德、丹尼尔·科恩-奥尔、达尼·利希金斯基
SIGGRAPH Asia 2023。[论文] [项目] [GitHub]
2023年5月25日

使用自动扩散增强多样化您的视觉数据集
丽莎·邓拉普、艾丽莎·乌米诺、张翰、杨洁智、约瑟夫·E·冈萨雷斯、特雷弗·达雷尔
arXiv 2023年。[论文] [GitHub]
2023年5月25日

无提示扩散：将“文本”从文本到图像扩散模型中移除
徐兴谦、郭嘉怡、王张阳、黄高、伊尔凡·埃萨、胡佛·石
arXiv 2023年。[论文] [GitHub]
2023年5月25日

ProSpect：扩展条件以实现属性感知图像生成的个性化
张宇鑫、董伟明、汤凡、黄妮莎、黄海彬、马重阳、李通义、奥利弗·多森、许昌盛
arXiv 2023年。[论文]
2023年5月25日

ProlificDreamer：利用变分分数蒸馏实现高保真度和多样性的文本到3D生成
王政毅、陆诚、王亦凯、鲍凡、李崇轩、苏航、朱军
arXiv 2023年。[论文] [项目]
2023年5月25日

关于文本到图像扩散模型的架构压缩
金宝庆、宋炯奎、蒂博·卡斯特尔斯、崔信国
arXiv 2023年。[论文]
2023年5月25日

Custom-Edit：利用定制扩散模型进行文本引导的图像编辑
崔柔英、崔允婕、金允芝、金俊浩、尹成禄
arXiv 2023年。[论文]
2023年5月25日

MultiFusion：融合预训练模型实现多语言、多模态图像生成
马可·贝拉根特、曼努埃尔·布拉克、汉娜·特乌费尔、菲利克斯·弗里德里希、比约恩·戴泽罗斯、康斯坦丁·艾肯贝格、安德鲁·戴、罗伯特·巴尔多克、索拉迪普·南达、科恩·奥斯特迈耶、安德烈斯·费利佩·克鲁斯-萨利纳斯、帕特里克·施拉莫夫斯基、克里斯蒂安·克尔斯廷、塞缪尔·温巴赫
arXiv 2023年。[论文]
2023年5月24日

ChatFace：通过扩散潜在空间操作实现聊天引导的真实人脸编辑
岳东旭、郭琴、宁木楠、崔家熙、朱跃生、袁立
arXiv 2023年。[论文]
2023年5月24日

DiffBlender：可扩展且可组合的多模态文本到图像扩散模型
金成润、李俊秀、洪基范、金大植、安南赫
arXiv 2023年。[论文] [GitHub]
2023年5月24日

我看到一个隐喻：大型语言模型与扩散模型共同创作视觉隐喻
图欣·查克拉巴蒂、阿尔卡迪·萨基扬、奥利维亚·温恩、阿耳忒弥斯·帕纳戈普卢、杨悦、玛丽安娜·阿皮迪亚纳基、斯马兰达·穆雷桑
arXiv 2023。[论文]
2023年5月24日

BLIP-Diffusion：用于可控文本到图像生成与编辑的预训练主体表征
李东旭、李俊楠、史蒂文·C·H·霍伊
arXiv 2023。[论文]
2023年5月24日

对抗性啃噬者：一项以数据为中心的挑战，旨在提升文本到图像模型的安全性
艾丽西亚·帕里什、汉娜·罗斯·柯克、杰西卡·夸耶、查尔维·拉斯托吉、马克·巴托洛、欧娜·伊内尔、胡安·西罗、拉斐尔·莫斯克拉、阿迪森·霍华德、威尔·库基尔斯基、D·斯库利、维杰·贾纳帕·雷迪、洛拉·阿罗约
arXiv 2023。[论文]
2023年5月22日

基于注意力图控制扩散模型的组合式文本到图像合成
王瑞晨、陈泽康、陈晨、马健、陆浩南、林晓东
arXiv 2023。[论文]
2023年5月23日

不安全扩散：关于从文本到图像模型中生成不安全图像和仇恨表情包的研究
瞿一婷、申心悦、何新磊、迈克尔·巴克斯、萨瓦斯·赞内托、张洋
arXiv 2023。[论文]
2023年5月23日

Control-A-Video：基于扩散模型的可控文本到视频生成
陈伟峰、吴杰、谢攀、吴鹤峰、李嘉诗、夏鑫、肖雪峰、林亮
arXiv 2023。[论文]
2023年5月23日

通过扩散模型的关键帧协作理解文本驱动的运动合成
魏东、孙晓宁、孙怀江、李斌、胡盛祥、李卫青、陆建峰
arXiv 2023。[论文]
2023年5月23日

LLM加持的扩散模型：利用大型语言模型增强文本到图像扩散模型的提示理解能力
连龙、李博毅、亚当·亚拉、特雷弗·达雷尔
arXiv 2023。[论文]
2023年5月23日

LaDI-VTON：基于潜在扩散与文本反演技术的虚拟试穿增强
大卫·莫雷利、阿尔贝托·巴尔德拉蒂、朱塞佩·卡特拉、马切拉·科尔尼亚、马可·贝尔蒂尼、丽塔·库奇阿拉
arXiv 2023。[论文]
2023年5月22日

FACTIFY3M：一种多模态事实核查基准，结合5W问答提供可解释性
梅加·查克拉博蒂、库什布·帕瓦、安库·拉妮、阿达尔什·马霍尔、阿迪提亚·帕卡拉、阿尔加亚·萨卡尔、哈尔希特·戴夫、伊山·保罗、詹维塔·雷迪、普里蒂·古鲁穆尔蒂、里特维克·G、萨玛赫里蒂·穆克吉、施雷亚斯·查特吉、金贾尔·森沙尔马、德维普·达拉尔、苏里亚瓦丹·S、施雷亚什·米什拉、帕尔特·帕特瓦、阿曼·查达、阿米特·谢特、阿米塔瓦·达斯
arXiv 2023。[论文]
2023年5月22日

使用强化学习训练扩散模型
凯文·布莱克、迈克尔·詹纳、杜奕伦、伊利亚·科斯特里科夫、谢尔盖·列文
arXiv 2023。[论文]
2023年5月22日

失败了就再试一次：通过选择实现忠实的基于扩散的文本到图像生成
夏姆戈帕尔·卡尔蒂克、卡斯滕·罗斯、马西米利亚诺·曼奇尼、泽内普·阿卡塔
arXiv 2023。[论文] [项目]
2023年5月22日

ControlVideo：无需训练的可控文本到视频生成
张亚博、魏宇翔、姜东升、张晓鹏、左望盟、田琪
arXiv 2023。[论文] [GitHub]
2023年5月22日

AudioToken：面向音频到图像生成的文本条件扩散模型适配
盖伊·亚里夫、伊泰·加特、利奥尔·沃尔夫、约西·阿迪、伊丹·施瓦茨
arXiv 2023。[论文]
2023年5月22日

CLIP模型其实是秘密的图像到提示转换器
丁宇轩、田春娜、丁浩轩、刘凌巧
arXiv 2023。[论文]
2023年5月22日

InstructVid2Vid：通过自然语言指令进行可控视频编辑
秦博生、李俊成、唐思良、蔡特生、庄玉亭
arXiv 2023。[论文]
2023年5月21日

SneakyPrompt：评估文本到图像生成模型安全过滤器的鲁棒性
杨宇辰、胡波、袁浩林、尼尔·龚、曹银志
arXiv 2023。[论文]
2023年5月20日

晚期约束扩散引导用于可控图像合成
刘畅、刘栋
arXiv 2023。[论文] [项目] [GitHub]
2023年5月19日

通过可组合扩散实现任意到任意的生成
唐子能、杨子怡、朱成光、郑迈克尔、班萨尔·莫希特
arXiv 2023。[论文] [项目] [GitHub]
2023年5月19日

Text2NeRF：基于神经辐射场的文本驱动3D场景生成
张景博、李晓宇、万子宇、王灿、廖静
arXiv 2023。[论文]
2023年5月19日

大脑字幕：将人类大脑活动解码为图像和文字
马泰奥·费兰特、富尔坎·厄兹切利克、托马索·博卡托、鲁芬·范鲁伦、尼古拉·托斯基
arXiv 2023。[论文]
2023年5月19日

以图像为枢纽的中文Stable Diffusion高效跨语言迁移
胡锦义、韩旭、易晓源、陈宇彤、李文豪、刘志远、孙茂松
arXiv 2023。[论文]
2023年5月19日

判别式扩散模型作为少样本视觉与语言学习者
何学海、冯伟熙、傅次睿、贾姆帕尼·瓦伦、阿库拉·阿琼、纳拉亚纳·普拉迪尤姆纳、巴萨·苏加托、威廉·杨·王、王欣·埃里克
arXiv 2023。[论文]
2023年5月18日

通过个性化实现针对文本到图像扩散模型的零日后门攻击
黄一浩、郭清、费利克斯·居飞徐
arXiv 2023。[论文]
2023年5月18日

AI写作：图像生成与数字写作之间的关系
斯科特·雷特伯格、塔兰·梅莫特、吉尔·沃克·雷特伯格、杰森·尼尔森、帕特里克·利希蒂
ISEA 2023。[论文]
2023年5月18日

TextDiffuser：扩散模型作为文本画家
陈靖业、黄宇潘、吕腾超、崔磊、陈启峰、魏福儒
arXiv 2023。[论文]
2023年5月18日

VideoFactory：在时空扩散中交换注意力以实现文本到视频生成
王文静、杨欢、拓子熙、何慧国、朱俊臣、付建龙、刘佳颖
arXiv 2023。[论文]
2023年5月18日

LDM3D：用于三维的潜在扩散模型
加布里埃拉·本·梅莱赫·斯坦、黛安娜·沃尔克、斯科蒂·福克斯、亚历克斯·雷登、威尔·萨克斯顿、简·于、埃斯特尔·阿夫拉洛、邵延曾、法比奥·诺纳托、马蒂亚斯·穆勒、瓦塞德夫·拉尔
arXiv 2023年。[论文]
2023年5月18日

X-IQE：基于视觉大型语言模型的文本到图像生成可解释图像质量评估
陈一雄
arXiv 2023年。[论文] [GitHub]
2023年5月18日

检查文本到图像模型生成图像的地理代表性
阿比普萨·巴苏、R·文卡特什·巴布、丹尼什·普鲁提
arXiv 2023年。[论文]
2023年5月18日

保留你自己的相关性：一种用于视频扩散模型的噪声先验
葛松伟、郑承俊、刘桂林、泰勒·潘、安德鲁·陶、布莱恩·卡坦扎罗、戴维·雅各布斯、黄家彬、刘明宇、约格什·巴拉吉
arXiv 2023年。[论文] [项目]
2023年5月17日

AMD：自回归运动扩散
韩博、彭浩、董敏静、徐畅、任毅、沈怡轩、李宇恒
arXiv 2023年。[论文]
2023年5月16日

利用ChatGPT和Stable Diffusion生成具有丰富故事性的连贯漫画
金泽、佐丽娜·宋
arXiv 2023年。[论文]
2023年5月16日

Make-An-Animation：大规模文本条件化三维人体运动生成
萨曼内·阿扎迪、阿克巴尔·沙阿、托马斯·海耶斯、德维·帕里克、索纳尔·古普塔
arXiv 2023年。[论文] [项目]
2023年5月16日

Make-A-Protagonist：基于专家集成的通用视频编辑
赵宇阳、谢恩泽、洪兰青、李振国、李金熙
arXiv 2023年。[论文] [项目] [GitHub]
2023年5月15日

常见的扩散噪声调度和采样步数存在缺陷
林善川、刘炳辰、李嘉世、杨晓
arXiv 2023年。[论文]
2023年5月15日

使用LLM和潜在扩散模型进行交互式时尚内容生成
克里希纳·斯里·伊普西特·曼特里、内瓦西尼·萨西库马尔
arXiv 2023年。[论文]
2023年5月15日

扩散模型中的空文本引导实际上是一位卡通风格的创作者
赵晶、郑鹤良、王超跃、兰龙、黄万荣、杨文静
arXiv 2023年。[论文] [项目] [GitHub]
2023年5月11日

iEdit：弱监督下的局部文本引导图像编辑
鲁梅萨·博杜尔、埃尔汗·贡多格杜、比诺德·巴塔赖、金泰均、迈克尔·多诺瑟、洛里斯·巴扎尼
arXiv 2023年。[论文]
2023年5月10日

SUR适配器：用大型语言模型增强文本到图像预训练扩散模型
钟珊珊、黄中展、温武绍、秦景辉、林亮
arXiv 2023年。[论文] [GitHub]
2023年5月9日

Style-A-Video：用于任意文本驱动视频风格迁移的敏捷扩散
黄妮莎、张宇欣、董伟明
arXiv 2023年。[论文]
2023年5月9日

DiffuseStyleGesture：基于扩散模型的风格化音频驱动共言语手势生成
杨思成、吴志勇、李明磊、张振松、郝雷、鲍伟红、程明、肖龙
IJCAI 2023年。[论文] [GitHub]
2023年5月8日

IIITD-20K：用于文本-图像ReID的密集标注
A V 苏布拉马尼扬、尼兰詹·孙达拉拉詹、维布胡·杜贝、布雷杰什·拉尔
arXiv 2023年。[论文]
2023年5月8日

利用丰富提示进行零样本图像转换的扩散模型再生成学习
林宇培、张森、杨晓军、王小、石雨凯
arXiv 2023年。[论文] [项目]
2023年5月8日

基于提示调优反演的文本驱动扩散模型图像编辑
董文凯、薛松、段晓月、韩淑敏
arXiv 2023年。[论文]
2023年5月8日

文本到图像扩散模型可通过多模态数据投毒轻易被后门攻击
翟盛芳、董银鹏、申庆妮、蒲诗、方跃建、苏航
arXiv 2023年。[论文]
2023年5月7日

AADiff：基于文本到图像扩散的音频对齐视频合成
李承佑、孔彩琳、全东贤、郭诺俊
arXiv 2023年。[论文]
2023年5月6日

利用文本到图像生成模型进行图像描述的数据整理
李文燕、乔纳斯·F·洛茨、邱晨、德斯蒙德·埃利奥特
arXiv 2023年。[论文]
2023年5月5日

DisenBooth：用于主体驱动文本到图像生成的身份保持解耦调优
陈宏、张一鹏、王鑫、段旭光、周宇威、朱文武
arXiv 2023年。[论文] [项目]
2023年5月5日

通过扩散模型中的初始图像编辑进行引导式图像合成
毛家峰、王雪婷、相泽清治
arXiv 2023年。[论文]
2023年5月5日

扩散解释器：用于文本到图像Stable Diffusion的可视化解释
李成珉、本杰明·胡佛、亨德里克·施特罗贝尔、王子杰、彭圣云、奥斯汀·赖特、李凯文、朴海奎、杨浩洋、周敦鸿
arXiv 2023年。[论文] [项目]
2023年5月4日

多模态驱动的说话人脸生成、换脸及扩散模型
许超、朱少婷、朱俊伟、黄天心、张江宁、邰颖、刘勇
arXiv 2023年。[论文]
2023年5月4日

利用扩散模型进行图像描述的多模态数据增强
肖昌荣、辛信徐、张坤鹏
arXiv 2023年。[论文]
2023年5月3日

为扩散模型解锁上下文学习
王振东、蒋逸凡、陆亚东、沈业隆、何鹏程、陈伟竹、王章阳、周明远
arXiv 2023年。[论文] [项目] [GitHub]
2023年5月1日

SceneGenie：基于场景图引导的扩散模型用于图像合成
阿扎德·法尔沙德、优赛夫·耶加内、于驰、沈成志、比约恩·奥默、纳西尔·纳瓦布
arXiv 2023年。[论文]
2023年4月28日

关键在于起点：通过种子选择实现文生图
德维尔·萨缪尔、拉米·本-阿里、西蒙·拉维夫、尼尔·达尔尚、加尔·切奇克
arXiv 2023年。[论文]
2023年4月27日

编辑一切：一种文本引导的图像编辑生成系统
谢德峰、王瑞琛、马健、陈晨、陆浩楠、杨东、史佛波、林晓东
arXiv 2023年。[论文] [GitHub]
2023年4月27日

无需训练的地点感知文生图合成
毛家锋、王雪婷
arXiv 2023年。[论文]
2023年4月26日

TextMesh：从文本提示生成逼真的3D网格模型
克里斯蒂娜·察利科格鲁、法比安·曼哈特、阿莱西奥·托尼奥尼、迈克尔·尼迈耶、费德里科·汤巴里
arXiv 2023年。[论文]
2023年4月24日

利用文生图技术进行建筑设计构思
维勒·帕阿南宁、乔纳斯·奥本兰德、阿库·维苏里
arXiv 2023年。[论文]
2023年4月20日

Anything-3D：迈向单视角下的任意物体野外重建
沈秋红、杨兴义、王新超
arXiv 2023年。[论文] [GitHub]
2023年4月19日

UPGPT：用于人物图像生成、编辑及姿态迁移的通用扩散模型
孙耀昌、阿明·穆斯塔法、安德鲁·吉尔伯特
ICCV 2023研讨会。[论文] [GitHub]
2023年4月18日

TTIDA：基于文本到文本与文本到图像模型的可控生成式数据增强
殷宇伟、让·卡杜尔、张翔、聂一欣、刘振国、孔令鹏、刘琪
arXiv 2023年。[论文]
2023年4月18日

对齐潜在空间：基于潜扩散模型的高分辨率视频合成
安德烈亚斯·布拉特曼、罗宾·伦巴赫、黄凌、蒂姆·多克霍恩、金承旭、桑雅·菲德勒、卡斯滕·克莱斯
CVPR 2023。[论文] [项目]
2023年4月18日

Text2Performer：文本驱动的人体视频生成
蒋宇明、杨帅、梁通、吴威、洛辰昌、刘子威
arXiv 2023年。[论文] [项目]
2023年4月17日

Latent-Shift：结合时间偏移的潜扩散模型，用于高效文生视频生成
安杰、张松阳、杨哈利、索娜尔·古普塔、黄嘉斌、罗杰波、尹希
arXiv 2023年。[论文] [项目]
2023年4月17日

MasaCtrl：无需调优的互斥自注意力控制，用于一致的图像合成与编辑
曹明登、王新涛、齐中刚、应珊、戚晓虎、郑银强
arXiv 2023年。[论文] [GitHub]
2023年4月17日

基于文本条件的上下文化身，实现零样本个性化
萨曼内·阿扎迪、托马斯·海耶斯、阿克巴尔·沙赫、潘冠、黛薇·帕里克、索娜尔·古普塔
arXiv 2023年。[论文]
2023年4月14日

Delta降噪分数
阿米尔·赫兹、克菲尔·阿贝尔曼、丹尼尔·科恩-奥尔
arXiv 2023年。[论文] [项目]
2023年4月14日

使用富文本实现富有表现力的文生图
葛松伟、朴泰成、朱俊彦、黄嘉斌
arXiv 2023年。[论文] [项目] [GitHub]
2023年4月13日

Soundini：基于声音引导的扩散模型用于自然视频编辑
李承贤、金世恩、柳仁范、杨峰、赵东贤、金英书、张慧雯、金镇久、金相弼
arXiv 2023年。[论文] [项目]
2023年4月13日

利用双编码器改进场景文本编辑的扩散模型
季家宝、张冠华、王兆文、侯百儒、张志飞、布莱恩·普赖斯、常诗雨
arXiv 2023年。[论文] [GitHub]
2023年4月12日

一种便于编辑的DDPM噪声空间：反演与操控
因巴尔·胡伯曼-施皮格尔格拉斯、弗拉基米尔·库利科夫、托梅尔·米凯利
arXiv 2023年。[论文]
2023年4月12日

持续扩散：利用C-LoRA对文生图扩散模型进行持续定制
詹姆斯·希尔·史密斯、许延昌、张凌宇、华婷、齐索尔特·基拉、沈怡琳、金洪霞
arXiv 2023年。[论文] [项目]
2023年4月12日

HRS-Bench：面向文生图模型的全面、可靠且可扩展的基准测试平台
埃斯拉姆·穆罕默德·巴克尔、孙鹏展、申晓倩、法伊赞·法鲁克·汗、李尔然·李、穆罕默德·埃尔霍塞尼
arXiv 2023年。[论文] [项目]
2023年4月11日

重新构想负向提示算法：将2D扩散转化为3D，缓解Janus问题并进一步拓展
穆罕默德雷扎·阿曼德普尔、郑煌杰、阿里·萨德吉安、阿米尔·萨德吉安、周明远
arXiv 2023年。[论文]
2023年4月11日

借助无条件扩散模型实现实时文本驱动的图像操控
尼基塔·斯塔罗杜布采夫、德米特里·巴兰丘克、瓦伦丁·赫鲁尔科夫、阿特姆·巴班科
arXiv 2023年。[论文]
2023年4月10日

HumanSD：一种原生骨骼引导的扩散模型，用于人体图像生成
宣菊、曾爱玲、赵晨晨、王佳楠、张磊、徐强
arXiv 2023年。[论文] [GitHub]
2023年4月9日

利用扩散模型的时空注意力实现高保真文生图合成
吴秋成、刘宇健、赵汉东、武仲、林哲、张洋、常诗雨
arXiv 2023年。[论文] [GitHub]
2023年4月7日

基于图像特定提示学习的零样本生成模型适配
郭佳怡、王超飞、吴友、张逸伦、王凯、徐星谦、宋世基、施恒瑞、黄高
CVPR 2023. [论文] [GitHub]
2023年4月6日

无需训练的跨注意力引导版面控制
陈明浩、伊罗·莱纳、安德烈亚·韦达尔迪
arXiv 2023. [论文] [项目] [GitHub]
2023年4月6日

文本引导噪声鲁棒性基准测试
穆罕默德雷扎·莫法耶齐、雅斯敏·梅德加尔奇
arXiv 2023. [论文]
2023年4月6日

DITTO-NeRF：基于扩散的迭代式文本到全向3D模型生成
徐浩基、金夏妍、金光贤、春世英
arXiv 2023. [论文] [项目]
2023年4月6日

利用文本到图像扩散模型实现零微调图像定制的编码器驯化
贾旭辉、赵阳、陈嘉健、李彦东、张翰、龚博清、侯廷波、王慧生、苏宇川
arXiv 2023. [论文]
2023年4月5日

一种基于扩散的多轮组合式图像生成方法
王超、杨晓宇、黄锦淼、凯文·费雷拉
arXiv 2023. [论文]
2023年4月5日

viz2viz：基于扩散模型的提示驱动风格化可视化生成
吴佳琪、郑俊荣、艾坦·阿达尔
arXiv 2023. [论文]
2023年4月4日

多模态服装设计师：以人为本的潜伏扩散模型用于时尚图像编辑
阿尔贝托·巴尔德拉蒂、达维德·莫雷利、朱塞佩·卡特拉、马切拉·科尔尼亚、马可·贝尔蒂尼、丽塔·库奇阿拉
arXiv 2023. [论文]
2023年4月4日

PODIA-3D：利用姿态保留的文本到图像扩散模型，在巨大领域差距下实现3D生成模型的域适应
金光贤、张智河、春世英
arXiv 2023. [论文] [项目]
2023年4月4日

基于掩码生成模型的文本到图像生成文本条件采样框架
李在雄、张相源、曹在亨、尹在洪、金允智、金镇华、河正佑、黄成柱
arXiv 2023. [论文]
2023年4月4日

ReMoDiffuse：检索增强型运动扩散模型
张明远、郭欣颖、潘亮、蔡中刚、洪方舟、李慧蓉、杨磊、刘子威
arXiv 2023. [论文] [项目] [GitHub]
2023年4月3日

DreamAvatar：通过扩散模型实现文本与形状引导的3D人类化身生成
曹宇康、曹燕沛、韩凯、山英、黄冠义
arXiv 2023. [论文]
2023年4月3日

DreamFace：在文本指导下逐步生成可动画化的3D人脸
张龙文、邱启伟、林宏洋、张祺轩、石诚、杨伟、史叶、杨思蓓、许兰、于静怡
arXiv 2023. [论文] [项目]
2023年4月1日

GlyphDraw：在图像合成模型中学习连贯地绘制汉字
马健、赵明俊、陈晨、王睿琛、牛迪、陆浩楠、林晓东
arXiv 2023. [论文] [项目]
2023年3月31日

AvatarCraft：通过参数化形状和姿态控制将文本转化为神经网络人类化身
蒋锐翔、王灿、张景博、柴孟蕾、何明明、陈冬冬、廖晶
arXiv 2023. [论文] [项目] [GitHub]
2023年3月30日

PAIR-Diffusion：基于结构与外观配对扩散模型的对象级图像编辑
维迪特·戈埃尔、埃利亚·佩鲁佐、姜一凡、徐德佳、尼库·塞贝、特雷弗·达雷尔、王章扬、施恒瑞
arXiv 2023. [论文] [GitHub]
2023年3月30日

通过文本到图像生成视角看社会偏见
兰吉塔·奈克、贝斯米拉·努希
arXiv 2023. [论文]
2023年3月30日

勿忘我：在文本到图像扩散模型中学习遗忘
张逸伦、王凯、徐星谦、王章扬、施恒瑞
arXiv 2023. [论文] [GitHub]
2023年3月30日

DiffCollage：利用扩散模型并行生成大量内容
张秦胜、宋家铭、黄勋、陈永鑫、刘明宇
CVPR 2023. [论文] [项目]
2023年3月30日

使用现成图像扩散模型进行零样本视频编辑
王文、谢康阳、刘子德、陈浩、曹悦、王新龙、沈春华
arXiv 2023. [论文]
2023年3月30日

用于文本到图像扩散模型的判别类标记
伊丹·施瓦茨、韦斯特恩·斯奈比亚尔松、萨吉·贝奈姆、希拉·切弗、瑞安·科特雷尔、利奥尔·沃尔夫、塞尔日·贝隆吉
arXiv 2023. [论文]
2023年3月30日

DAE-Talker：基于扩散自编码器的高保真语音驱动说话人脸生成
杜晨鹏、陈琦、何天宇、谭旭、陈曦、于凯、赵盛、卞江
arXiv 2023. [论文]
2023年3月30日

LayoutDiffusion：用于版面到图像生成的可控扩散模型
郑广聪、周宪潘、李学伟、齐中刚、山英、李熙
CVPR 2023. [论文] [GitHub]
2023年3月30日

4D面部表情扩散模型
邹凯峰、西尔万·费桑、于博洋、塞巴斯蒂安·瓦莱特、徐惠媛
arXiv 2023. [论文] [GitHub]
2023年3月29日

MDP：通过操纵扩散路径实现文本引导图像编辑的通用框架
王倩、张彪、迈克尔·比尔萨克、彼得·翁卡
arXiv 2023. [论文] [GitHub]
2023年3月29日

Instruct 3D-to-3D：文本指令引导的3D到3D转换
Hiromichi Kamata、Yuiko Sakuma、Akio Hayakawa、Masato Ishii、Takuya Narihira
arXiv 2023年。[论文] [GitHub]
2023年3月28日

StyleDiffusion：基于提示嵌入反演的文本驱动编辑
Senmao Li、Joost van de Weijer、Taihang Hu、Fahad Shahbaz Khan、Qibin Hou、Yaxing Wang、Jian Yang
arXiv 2023年。[论文]
2023年3月28日

Seer：基于潜在扩散模型的语言指令视频预测
Xianfan Gu、Chuan Wen、Jiaming Song、Yang Gao
CVPR研讨会2023年。[论文]
2023年3月27日

去偏置2D扩散模型的分数与提示以实现稳健的文本到3D生成
Susung Hong、Donghoon Ahn、Seungryong Kim
arXiv 2023年。[论文]
2023年3月27日

Anti-DreamBooth：保护用户免受个性化文本到图像合成侵害
Thanh Van Le、Hao Phung、Thuan Hoang Nguyen、Quan Dao、Ngoc Tran、Anh Tran
SIGGRAPH 2023年。[论文] [GitHub]
2023年3月27日

GestureDiffuCLIP：基于CLIP潜在空间的手势扩散模型
Tenglong Ao、Zeyi Zhang、Libin Liu
arXiv 2023年。[论文]
2023年3月26日

更好地对齐文本到图像模型与人类偏好
Xiaoshi Wu、Keqiang Sun、Feng Zhu、Rui Zhao、Hongsheng Li
arXiv 2023年。[论文] [GitHub]
2023年3月25日

ISS++：以图像为跳板的文本指导3D形状生成
Zhengzhe Liu、Peng Dai、Ruihui Li、Xiaojuan Qi、Chi-Wing Fu
ICLR 2023年。[论文]
2023年3月24日

DiffuScene：用于室内场景生成的场景图去噪扩散概率模型
Jiapeng Tang、Yinyu Nie、Lev Markhasin、Angela Dai、Justus Thies、Matthias Nießner
arXiv 2023年。[论文] [项目]
2023年3月24日

CompoNeRF：可编辑3D场景布局的文本指导多物体组合式NeRF
Yiqi Lin、Haotian Bai、Sijia Li、Haonan Lu、Xiaodong Lin、Hui Xiong、Lin Wang
arXiv 2023年。[论文] [项目]
2023年3月24日

Fantasia3D：解耦几何与外观以实现高质量的文本到3D内容创作
Rui Chen、Yongwei Chen、Ningxin Jiao、Kui Jia
arXiv 2023年。[论文]
2023年3月24日

ReVersion：基于扩散的关系反演方法
Ziqi Huang、Tianxing Wu、Yuming Jiang、Kelvin C.K. Chan、Ziwei Liu
arXiv 2023年。[论文] [项目] [GitHub]
2023年3月23日

在文本到图像扩散模型中消融概念
Nupur Kumari、Bingliang Zhang、Sheng-Yu Wang、Eli Shechtman、Richard Zhang、Jun-Yan Zhu
arXiv 2023年。[论文] [项目] [GitHub]
2023年3月23日

Text2Video-Zero：文本到图像扩散模型即为零样本视频生成器
Levon Khachatryan、Andranik Movsisyan、Vahram Tadevosyan、Roberto Henschel、Zhangyang Wang、Shant Navasardyan、Humphrey Shi
arXiv 2023年。[论文] [GitHub]
2023年3月23日

MagicFusion：通过融合扩散模型提升文本到图像生成性能
Jing Zhao、Heliang Zheng、Chaoyue Wang、Long Lan、Wenjing Yang
arXiv 2023年。[论文] [项目] [GitHub]
2023年3月23日

Pix2Video：利用图像扩散进行视频编辑
Duygu Ceylan、Chun-Hao Paul Huang、Niloy J. Mitra
arXiv 2023年。[论文] [项目]
2023年3月22日

Instruct-NeRF2NeRF：通过指令编辑3D场景
Ayaan Haque、Matthew Tancik、Alexei A. Efros、Aleksander Holynski、Angjoo Kanazawa
arXiv 2023年。[论文] [项目]
2023年3月22日

SALAD：面向3D形状生成与操控的部分级潜在扩散模型
Juil Koo、Seungwoo Yoo、Minh Hieu Nguyen、Minhyuk Sung
arXiv 2023年。[论文] [项目]
2023年3月21日

Vox-E：文本指导的3D对象体素编辑
Etai Sella、Gal Fiebelman、Peter Hedman、Hadar Averbuch-Elor
arXiv 2023年。[论文] [项目]
2023年3月21日

CompoDiff：基于潜在扩散的多功能组合图像检索
Geonmo Gu、Sanghyuk Chun、Wonjae Kim、HeeJae Jun、Yoohoon Kang、Sangdoo Yun
arXiv 2023年。[论文]
2023年3月21日

3D-CLFusion：基于对比潜在扩散的快速文本到3D渲染
Yu-Jhe Li、Kris Kitani
arXiv 2023年。[论文]
2023年3月21日

Text2Tex：基于扩散模型的文本驱动纹理合成
Dave Zhenyu Chen、Yawar Siddiqui、Hsin-Ying Lee、Sergey Tulyakov、Matthias Nießner
arXiv 2023年。[论文] [项目]
2023年3月20日

利用文本到图像扩散模型定位对象级形状变化
Or Patashnik、Daniel Garibi、Idan Azuri、Hadar Averbuch-Elor、Daniel Cohen-Or
arXiv 2023年。[论文] [项目]
2023年3月20日

SVDiff：用于扩散模型微调的紧凑参数空间
Ligong Han、Yinxiao Li、Han Zhang、Peyman Milanfar、Dimitris Metaxas、Feng Yang
arXiv 2023年。[论文]
2023年3月20日

发现扩散模型语义潜在空间中的可解释方向
René Haas、Inbar Huberman-Spiegelglas、Rotem Mulayoff、Tomer Michaeli
arXiv 2023年。[论文]
2023年3月20日

SKED：草图指导的文本驱动3D编辑
Aryan Mikaeili、Or Perel、Daniel Cohen-Or、Ali Mahdavi-Amiri
arXiv 2023年。[论文]
2023年3月19日

DialogPaint：基于对话的图像编辑模型
Jingxuan Wei、Shiyu Wu、Xin Jiang、Yequan Wang
arXiv 2023年。[论文]
2023年3月17日

GlueGen：用于X-to-image生成的即插即用多模态编码器
秦灿、于宁、邢晨、张舒、陈泽远、斯特凡诺·埃尔蒙、傅云、熊才明、徐然
arXiv 2023年。[论文]
2023年3月17日

DiffusionRet：基于扩散模型的生成式文本-视频检索
金鹏、李浩、程泽森、李科涵、季向阳、刘畅、袁立、陈杰
arXiv 2023年。[论文]
2023年3月17日

FreeDoM：无需训练的能量引导条件扩散模型
于继文、王银怀、赵晨、伯纳德·加内姆、张健
arXiv 2023年。[论文] [GitHub]
2023年3月17日

统一的多模态潜在扩散模型：联合主体与文本条件的图像生成
马一洋、杨欢、王文静、傅建龙、刘佳颖
arXiv 2023年。[论文]
2023年3月16日

FateZero：融合注意力机制的零样本文本驱动视频编辑
齐晨阳、寸晓东、张勇、雷晨阳、王新涛、单莹、陈启峰
arXiv 2023年。[论文] [项目] [GitHub]
2023年3月16日

HIVE：利用人类反馈进行指令式视觉编辑
张舒、杨欣怡、冯义豪、秦灿、陈嘉志、于宁、陈泽远、王欢、西尔维奥·萨瓦雷斯、斯特凡诺·埃尔蒙、熊才明、徐然
arXiv 2023年。[论文]
2023年3月16日

P+：文本到图像生成中的扩展文本条件控制
安德烈·沃伊诺夫、楚庆浩、丹尼尔·科恩-奥尔、克菲尔·阿伯曼
arXiv 2023年。[论文] [项目]
2023年3月16日

用于Stable Diffusion图像操控的高度个性化文本嵌入
韩仁和、杨世琳、权泰成、叶宗哲
arXiv 2023年。[论文]
2023年3月15日

Aerial Diffusion：基于扩散模型的单张图像地面视角到航拍视角转换，由文本指导
迪维娅·科坦达拉曼、周天一、林明、迪内什·马诺查
arXiv 2023年。[论文] [GitHub]
2023年3月15日

用于文本引导扩散图像风格迁移的零样本对比损失
杨世琳、黄贤珉、叶宗哲
arXiv 2023年。[论文]
2023年3月15日

Edit-A-Video：具有对象感知一致性的单视频编辑
申彩勋、金熙胜、李哲贤、李相吉、尹成路
arXiv 2023年。[论文] [项目]
2023年3月14日

编辑文本到图像扩散模型中的隐含假设
哈达斯·奥尔加德、巴赫贾特·卡瓦尔、约纳坦·贝林科夫
arXiv 2023年。[论文] [项目] [GitHub]
2023年3月14日

让2D扩散模型了解3D一致性，以实现稳健的文本到3D生成
徐俊英、张宇锡、郭敏燮、高在勋、金贤洙、金俊浩、金镇华、李智英、金承龙
arXiv 2023年。[论文]
2023年3月14日

Visual ChatGPT：与视觉基础模型对话、绘图和编辑
吴晨飞、殷圣明、戚伟珍、王晓东、唐泽成、段楠
arXiv 2023年。[论文] [GitHub]
2023年3月8日

Video-P2P：通过交叉注意力控制进行视频编辑
刘绍腾、张悦辰、李文博、林哲、贾佳亚
arXiv 2023年。[论文] [项目]
2023年3月8日

从扩散模型中擦除概念
罗希特·甘迪科塔、乔安娜·马特任斯卡、贾登·菲奥托-考夫曼、大卫·鲍
arXiv 2023年。[论文] [项目] [GitHub]
2023年3月13日

一个Transformer适用于大规模多模态扩散中的所有分布
鲍帆、聂深、薛凯文、李崇轩、蒲石、王耀乐、岳刚、曹悦、苏航、朱军
arXiv 2023年。[论文] [GitHub]
2023年3月12日

Cones：扩散模型中的概念神经元，用于定制化生成
刘志恒、冯瑞丽、朱凯、张艺飞、郑可成、刘宇、赵德利、周景仁、曹阳
arXiv 2023年。[论文]
2023年3月9日

文本到图像生成系统的提示日志分析
谢宇彤、潘兆英、马金格、罗杰、梅巧竹
arXiv 2023年。[论文]
2023年3月8日

零阶优化结合人类反馈：基于排序预言机的可证明学习
唐志伟、德米特里·雷宾、常宗辉
arXiv 2023年。[论文] [GitHub]
2023年3月7日

释放文本到图像扩散模型在视觉感知中的潜力
赵文亮、饶永明、刘祖彦、刘本林、周杰、陆继文
arXiv 2023年。[论文] [GitHub]
2023年3月3日

Collage Diffusion
维什努·萨鲁凯、林登·李、阿登·马、克里斯托弗·雷、凯文·法塔哈利安
arXiv 2023年。[论文]
2023年3月1日

迈向增强扩散模型的可控性
曹元雄、哈里什·拉维、米敦·哈里库马尔、文赫·库克、克里希纳·库马尔·辛格、卢静婉、戴维·I·井上、阿金基亚·卡莱
arXiv 2023年。[论文]
2023年2月28日

定向扩散：通过注意力引导直接控制物体放置
万朵·库尔特·马、J.P.刘易斯、W.巴斯蒂安·克莱因、托马斯·梁
arXiv 2023年。[论文]
2023年2月25日

调制预训练扩散模型以实现多模态图像合成
库苏·哈姆、詹姆斯·海斯、卢静婉、克里希纳·库马尔·辛格、张志飞、托比亚斯·欣茨
arXiv 2023年。[论文]
2023年2月24日

区域感知扩散：用于零样本文本驱动图像编辑
黄妮莎、唐凡、董伟明、李通义、许昌盛
arXiv 2023年。[论文] [GitHub]
2023年2月23日

基于扩散先验的可控且条件化的文本到图像生成
普拉纳夫·阿加瓦尔、哈里什·拉维、纳文·马里、萨钦·凯尔卡尔、陈峰斌、文·屈克、米敦·哈里库马尔、里蒂兹·坦比、苏达尔尚·雷迪·卡库马努、普尔瓦克·拉普西娅、阿尔文·古阿斯、萨拉·萨贝尔、马拉维卡·拉姆普拉萨德、巴尔多·法耶塔、阿金基亚·卡莱
arXiv 2023年。[论文]
2023年2月23日

减量、再利用、循环：基于能量模型的扩散模型与MCMC的组合式生成
杜一伦、康纳·杜尔坎、罗宾·斯特鲁德尔、乔舒亚·B·特南鲍姆、桑德·迪勒曼、罗布·费格斯、雅莎·索尔-迪克斯坦、阿诺·杜塞、威尔·格拉斯沃思
arXiv 2023年。[论文] [项目]
2023年2月22日

通过单张图像上的自监督扩散学习3D摄影视频
王晓东、吴晨飞、尹圣明、倪明恒、王建峰、李林杰、杨正元、杨帆、王丽娟、刘子成、方跃健、段楠
arXiv 2023年。[论文]
2023年2月21日

通过内在维度视角探索Stable Diffusion的表征流形
亨利·克温格、戴维斯·布朗、查尔斯·戈德弗里
arXiv 2023年。[论文]
2023年2月16日

基于潜在扩散先验的文本驱动视觉合成
廖廷轩、葛松伟、徐艺然、李耀志、巴杜尔·阿尔巴哈尔、黄家彬
arXiv 2023年。[论文] [项目]
2023年2月16日

T2I-Adapter：学习适配器以挖掘文本到图像扩散模型的更多可控能力
牟冲、王新涛、谢良斌、张健、齐中刚、山英、切晓虎
arXiv 2023年。[论文] [GitHub]
2023年2月16日

MultiDiffusion：融合扩散路径实现可控图像生成
奥默·巴尔-塔尔、利奥尔·亚里夫、亚龙·利普曼、塔莉·德克尔
arXiv 2023年。[论文] 项目 [GitHub]
2023年2月16日

基于边界引导的混合轨迹用于扩散模型的语义控制
朱晔、吴宇、邓志伟、奥尔加·鲁萨科夫斯基、严燕
arXiv 2023年。[论文]
2023年2月16日

数据集接口：利用可控反事实生成诊断模型故障
乔舒亚·文德罗、萨奇·贾因、洛根·恩格斯特罗姆、亚历山大·马德里
arXiv 2023年。[论文] [GitHub]
2023年2月15日

PRedItOR：基于扩散先验的文本引导图像编辑
哈里什·拉维、萨钦·凯尔卡尔、米敦·哈里库马尔、阿金基亚·卡莱
arXiv 2023年。[论文]
2023年2月15日

文本引导的场景草图到照片合成
AprilPyone MaungMaung、真木诚、三井健太郎、泽田圭、冈仓文雄
arXiv 2023年。[论文]
2023年2月14日

扩散模型的通用指导机制
阿尔皮特·班萨尔、洪敏楚、阿维·施瓦茨希尔德、索米亚迪普·森古普塔、米卡·戈德布鲁姆、乔纳斯·盖平、汤姆·戈德斯坦
arXiv 2023年。[论文] [GitHub]
2023年2月14日

为文本到图像扩散模型添加条件控制
张吕民、马尼什·阿格拉瓦拉
arXiv 2023年。[论文] [GitHub]
2023年2月10日

通过生成式扩散指导视角分析多模态目标
孔彩琳、郭诺俊
arXiv 2023年。[论文]
2023年2月10日

这种损失有信息量吗？通过确定性目标评估加速文本反转
安东·沃罗诺夫、米哈伊尔·霍罗希赫、阿特姆·巴奔科、马克西姆·里亚比宁
arXiv 2023年。[论文]
2023年2月9日

Q-Diffusion：量化扩散模型
李秀宇、连龙、刘义江、杨焕瑞、董振、丹尼尔·康、张尚航、库尔特·凯策尔
arXiv 2023年。[论文] [GitHub]
2023年2月8日

GLAZE：保护艺术家免受文本到图像模型的风格模仿
肖恩·山、珍娜·克莱恩、艾米丽·温格、郑海涛、拉娜·哈诺卡、本·Y·赵
arXiv 2023年。[论文]
2023年2月8日

使用扩散模型从纯文本故事零样本生成连贯的故事书
郑贤浩、权基贤、叶宗哲
arXiv 2023年。[论文]
2023年2月8日

公平扩散：在文本到图像生成模型中引入公平性指导
菲利克斯·弗里德里希、帕特里克·施拉莫夫斯基、曼努埃尔·布拉克、卢卡斯·斯特鲁佩克、多米尼克·欣特斯多夫、萨莎·卢奇奥尼、克里斯蒂安·克尔斯廷
arXiv 2023年。[论文]
2023年2月7日

让硬提示变得简单：基于梯度的离散优化用于提示调优和发现
温宇鑫、尼尔·贾因、约翰·基兴鲍尔、米卡·戈德布鲁姆、乔纳斯·盖平、汤姆·戈德斯坦
arXiv 2023年。[论文] [GitHub]
2023年2月7日

零样本图像到图像转换
高拉夫·帕尔马尔、克里希纳·库马尔·辛格、理查德·张、李义军、陆静婉、朱俊彦
arXiv 2023年。[论文]
2023年2月6日

基于结构与内容引导的扩散模型视频合成
帕特里克·埃瑟、乔纳森·邱、帕米达·阿提格赫恰恩、乔纳森·格兰斯科格、阿纳斯塔西斯·杰尔马尼迪斯
arXiv 2023年。[论文] [项目]
2023年2月6日

用于场景构图和高分辨率图像生成的扩散模型混合体
阿尔瓦罗·巴尔贝罗·希门尼斯
arXiv 2023年。[论文] [GitHub]
2023年2月5日

ReDi：通过轨迹检索实现高效无训练扩散推理
张可勋、杨宪军、威廉·杨·王、李磊
arXiv 2023年。[论文]
2023年2月5日

通过双循环扩散消除先验偏见，实现语义图像编辑
杨佐鹏、褚天舒、林欣、高尔敦、刘大庆、杨洁、王超悦
arXiv 2023年。[论文]
2023年2月5日

基于预训练模型的语义引导图像增强
李博涵、王星昊、徐晓、侯宇泰、冯云龙、王峰、车万祥
SIGGRAPH 2023年。[论文] [项目]
2023年2月4日

TEXTure：基于文本的三维形状纹理化
埃拉德·里查森、加尔·梅策尔、尤瓦尔·阿拉卢夫、拉贾·吉里耶斯、丹尼尔·科恩-奥尔
arXiv 2023年。[论文] [项目] [GitHub]
2023年2月3日

Dreamix：视频扩散模型是通用的视频编辑工具
埃亚尔·莫拉德、埃利亚胡·霍维茨、达尼·瓦列夫斯基、亚历克斯·拉夫·阿查、约西·马蒂亚斯、雅埃尔·普里奇、亚尼夫·莱维坦、耶迪德·霍申
arXiv 2023年。[论文] [项目]
2023年2月2日

变废为宝：利用文本到图像模型指导实体艺术品的设计
艾米·史密斯、霍普·施罗德、齐夫·埃普斯坦、迈克尔·库克、西蒙·科尔顿、安德鲁·利普曼
AAAI 2023。[论文]
2023年2月1日

Attend-and-Excite：基于注意力的语义引导用于文本到图像扩散模型
希拉·切费尔、尤瓦尔·阿拉卢夫、雅埃尔·温克尔、利奥尔·沃尔夫、丹尼尔·科恩-奥尔
SIGGRAPH 2023。[论文] [项目] [GitHub]
2023年1月31日

Zero3D：语义驱动的多类别三维形状生成
韩博、刘一彤、沈奕轩
arXiv 2023年。[论文]
2023年1月31日

形状感知的文本驱动分层视频编辑
李耀志、张季泽·珍妮薇、陈怡婷、伊丽莎白·邱、黄家彬
arXiv 2023年。[论文] [项目]
2023年1月30日

PromptMix：文本到图像扩散模型提升轻量级网络性能
阿里安·巴赫蒂亚尔尼亚、张琪、亚历山德罗斯·伊奥西菲迪斯
arXiv 2023年。[论文] [GitHub]
2023年1月30日

GALIP：用于文本到图像合成的生成对抗CLIP模型
陶明、鲍炳坤、唐浩、徐昌盛
CVPR 2023。[论文] [GitHub]
2023年1月30日

SEGA：利用语义维度指导扩散模型
曼努埃尔·布拉克、费利克斯·弗里德里希、多米尼克·欣特斯多夫、卢卡斯·斯特鲁佩克、帕特里克·施拉姆沃斯基、克里斯蒂安·克尔斯廷
arXiv 2023年。[论文]
2023年1月28日

通过跨文化理解基准（CCUB）数据集实现文本到图像合成模型中的公平表征
刘志轩、申友恩、贝弗利-克莱尔·奥科古、尹英植、莉娅·科尔曼、彼得·沙尔登布兰德、金智惠、欧珍
arXiv 2023年。[论文]
2023年1月28日

文本到4D动态场景生成
乌里埃尔·辛格、雪莉·谢因、亚当·波利亚克、奥伦·阿舒阿尔、尤里·马卡罗夫、菲利波斯·科基诺斯、纳曼·戈亚尔、安德烈亚·韦达尔迪、戴维·帕里克、贾斯汀·约翰逊、亚尼夫·泰格曼
arXiv 2023年。[论文]
2023年1月26日

引导文本到图像扩散模型实现 grounded generation
李子怡、周琴叶、张晓云、张娅、王燕峰、谢伟迪
arXiv 2023年。[论文] [项目]
2023年1月12日

基于音频条件扩散模型的语音驱动视频编辑
丹·比吉奥伊、舒巴吉特·巴萨克、休·乔丹、瑞秋·麦克唐奈尔、彼得·科科兰
arXiv 2023年。[论文] [项目] [GitHub]
2023年1月10日

基于情感和关键词的视觉故事生成
陈悦天、李若华、石博文、刘培儒、司美
AIIDE INT 2022。[论文]
2023年1月7日

DiffTalk：面向通用说话头合成的扩散模型构建
沈帅、赵文亮、孟子斌、李万华、朱正、周杰、陆继文
arXiv 2023年。[论文]
2023年1月10日

基于音频条件扩散模型的语音驱动视频编辑
丹·比吉奥伊、舒巴吉特·巴萨克、休·乔丹、瑞秋·麦克唐奈尔、彼得·科科兰
arXiv 2023年。[论文]
2023年1月10日

Diffused Heads：扩散模型在说话人脸生成上超越GAN
米哈尔·斯蒂普乌科夫斯基、康斯坦提诺斯·武吉乌卡斯、何森、马切伊·津巴、斯塔夫罗斯·佩特里迪斯、玛雅·潘蒂奇
arXiv 2023年。[论文] [项目]
2023年1月6日

Muse：基于掩码生成式Transformer的文本到图像生成
常慧雯、张涵、贾雷德·巴伯、AJ·马什诺特、何塞·莱萨马、江璐、杨明轩、凯文·墨菲、威廉·T·弗里曼、迈克尔·鲁宾斯坦、李元振、迪利普·克里希南
arXiv 2023年。[论文] [项目]
2023年1月2日

Dream3D：利用三维形状先验和文本到图像扩散模型实现零样本文本到三维合成
许佳乐、王新涛、程伟豪、曹燕沛、单颖、戚晓虎、高圣华
CVPR 2023。[论文] [项目]
2022年12月28日

探索将视觉Transformer作为扩散学习器
曹鹤、王嘉楠、任天贺、齐宪标、陈一浩、姚远、张磊
arXiv 2022年。[论文]
2022年12月28日

Tune-A-Video：针对文本到视频生成对图像扩散模型进行一次调优
吴章杰、葛益骁、王新涛、雷伟贤、顾宇超、许咏恩、单颖、戚晓虎、郑守迈
arXiv 2022年。[论文] [项目]
2022年12月22日

在从网络抓取的多模态数据上预训练的对比语言-视觉AI模型表现出性对象化偏见
罗伯特·沃尔夫、杨毅伟、比尔·豪、艾琳·卡利斯坎
arXiv 2022年。[论文]
2022年12月21日

优化文本到图像生成的提示词
郝亚茹、迟泽文、董立、魏福如
arXiv 2022年。[论文] [项目] [GitHub]
2022年12月19日

揭示文本到图像扩散模型中的解耦能力
吴秋成、刘宇健、赵汉东、阿金基亚·卡莱、武仲、于通、林哲、张阳、常世宇
arXiv 2022年。[论文] [GitHub]
2022年12月16日

TeTIm-Eval：一个用于比较文本到图像模型的新型精选评估数据集
费德里科·A·加拉托洛、马里奥·G·C·A·西米诺、爱德华多·科戈蒂
arXiv 2022年。[论文]
2022年12月15日

无限索引：生成式文本到图像模型中的信息检索
尼克拉斯·德克尔斯、迈克·弗罗贝、约翰内斯·基塞尔、詹卢卡·潘多尔福、克里斯托弗·施罗德、本诺·施泰因、马丁·波塔斯特
CHIIR 2023。[论文]
2022年12月14日

LidarCLIP 或：我如何学会与点云对话
格奥尔格·赫斯、亚当·通德尔斯基、克里斯托弗·彼得森、伦纳特·斯文松、卡勒·奥斯特伦姆
arXiv 2022。[论文] [GitHub]
2022年12月13日

Imagen Editor 和 EditBench：推进并评估文本引导的图像修复
王苏、奇特万·萨哈里亚、塞斯莉·蒙哥马利、乔迪·蓬特图塞特、沙伊·诺伊、斯特凡诺·佩莱格里尼、小野靖正、莎拉·拉斯洛、大卫·J·弗利特、拉杜·索里库特、杰森·鲍德里奇、穆罕默德·诺鲁齐、彼得·安德森、威廉·陈
CVPR 2023。[论文]
2022年12月13日

稳定艺术家：在扩散潜空间中引导语义
曼努埃尔·布拉克、帕特里克·施拉莫夫斯基、费利克斯·弗里德里希、多米尼克·欣特斯多夫、克里斯蒂安·克尔斯廷
arXiv 2022。[论文]
2022年12月12日

SmartBrush：基于扩散模型的文本和形状引导对象修复
谢绍安、张志飞、林哲、托比亚斯·欣茨、张坤
arXiv 2022。[论文]
2022年12月9日

用于组合式文本到图像合成的无训练结构化扩散引导
冯伟西、何学海、傅祖睿、瓦伦·詹帕尼、阿琼·阿库拉、普拉迪尤姆纳·纳拉亚纳、苏加托·巴苏、王鑫埃里克、王威廉杨
ICLR 2023。[论文] [GitHub]
2022年12月9日

MoFusion：基于去噪扩散的运动合成框架
里沙布·达布拉尔、穆罕默德·哈姆扎·穆加尔、弗拉季斯拉夫·戈利亚尼克、克里斯蒂安·特奥巴尔特
arXiv 2022。[论文] [项目]
2022年12月8日

SDFusion：多模态3D形状补全、重建与生成
程彦驰、李欣颖、谢尔盖·图利亚科夫、亚历山大·施温格、桂良燕
arXiv 2022。[论文] [项目]
2022年12月8日

SINE：利用文本到图像扩散模型进行单张图像编辑
张志兴、韩立功、阿尔纳布·戈什、迪米特里斯·梅塔克萨斯、任健
arXiv 2022。[论文] [项目][GitHub]
2022年12月8日

文本到图像扩散的多概念自定义
努普尔·库玛丽、张冰亮、理查德·张、伊莱·谢赫特曼、朱俊彦
arXiv 2022。[论文] [项目]
2022年12月8日

图像生成器的扩散引导域适应
宋坤鹏、韩立功、刘炳辰、迪米特里斯·梅塔克萨斯、艾哈迈德·埃尔加马尔
arXiv 2022。[论文] [项目]
2022年12月8日

通过潜空间中的运动扩散执行你的命令
陈鑫、江彪、刘文、黄子龙、付斌、陈涛、于静怡、于刚
arXiv 2022。[论文] [项目]
2022年12月8日

基于概率性音频到视觉扩散先验的说话人头像生成
余振涛、尹子欣、周德宇、王多民、芬恩·王、王宝元
arXiv 2022。[论文] [项目]
2022年12月7日

Magic：多艺术流派智能编舞数据集及用于3D舞蹈生成的网络
李荣辉、赵俊凡、张亚超、苏明阳、任泽平、张涵、李秀
arXiv 2022。[论文]
2022年12月7日

判断、定位与编辑：确保文本到图像生成的视觉常识道德
朴成范、文秀洪、金镇奎
arXiv 2022。[论文]
2022年12月7日

NeRDi：以语言引导的扩散作为通用图像先验的单视图NeRF合成
邓聪悦、蒋驰宇“Max”、查尔斯·R·齐、严新晨、周寅、列奥尼达斯·吉巴斯、德拉戈米尔·安古洛夫
arXiv 2022。[论文]
2022年12月6日

面向图像字幕的语义条件扩散网络
罗建杰、李业豪、潘英伟、姚婷、冯建林、曹宏洋、梅涛
CVPR 2023。[论文] [GitHub]
2022年12月6日

Diffusion-SDF：通过体素化扩散实现文本到形状
李木恒、段跃奇、周杰、陆继文
CVPR 2023。[论文] [项目][GitHub]
2022年12月6日

ADIR：用于图像重建的自适应扩散
沙迪·阿布-侯赛因、汤姆·提雷尔、拉贾·吉里耶斯
arXiv 2022。[论文] [项目]
2022年12月6日

M-VADER：一种具有多模态上下文的扩散模型
塞缪尔·温巴赫、马可·贝拉根特、康斯坦丁·艾亨贝格、安德鲁·戴、罗伯特·博尔多克、苏拉迪普·南达、比约恩·代泽罗斯、科恩·奥斯特迈耶、汉娜·特乌费尔、安德烈斯·费利佩·克鲁斯-萨利纳斯
arXiv 2022。[论文]
2022年12月6日

扩散视频自编码器：通过解耦视频编码实现时间一致的人脸视频编辑
金京满、沈夏珍、金贤洙、崔允洁、金俊浩、梁恩浩
CVPR 2023。[论文] [项目][GitHub]
2022年12月6日

联合与征服：利用扩散模型进行跨数据集多模态合成
尼廷·戈帕拉克里希南·奈尔、韦勒·格达拉·查敏达·班达拉、维沙尔·M·帕特尔
arXiv 2022。[论文] [项目]
2022年12月1日

基于内外注意力的形状引导扩散
朴东旭、罗格蕾丝、克莱顿·托斯特、萨曼内·阿扎迪、刘熙慧、玛卡·卡拉拉什维利、安娜·罗尔巴赫、特雷弗·达雷尔
arXiv 2022。[论文] [项目]
2022年12月1日

SinDDM：一种单张图像去噪扩散模型
弗拉基米尔·库利科夫、沙哈尔·亚丁、马坦·克莱纳、托梅尔·米凯利
arXiv 2022。[论文] [项目]
2022年11月29日

DATID-3D：基于文本到图像扩散模型的保多样性的领域自适应方法，用于三维生成模型
金光贤、春世英
CVPR 2023. [论文] [GitHub]
2022年11月29日

面向视频字幕生成的频率扩散的精细化语义增强
钟贤、李子鹏、陈淑琴、蒋奎、陈晨、叶芒
arXiv 2022. [论文] [GitHub]
2022年11月28日

用于同时进行视觉—语言生成的统一离散扩散模型
胡明辉、郑川夏、郑和亮、詹达珍、王超悦、杨作鹏、陶大成、苏甘坦
arXiv 2022. [论文]
2022年11月27日

3DDesigner：基于文本引导的扩散模型实现逼真三维物体生成与编辑
李刚、郑和亮、王超悦、李畅、郑昌文、陶大成
arXiv 2022. [论文]
2022年11月25日

SpaText：用于可控图像生成的时空文本表征
奥姆里·阿夫拉哈米、托马斯·海耶斯、奥兰·加夫尼、索纳尔·古普塔、亚尼夫·泰格曼、戴维·帕里克、丹妮·利希金斯基、欧哈德·弗里德、殷曦
CVPR 2023. [论文] [项目]
2022年11月25日

草图引导的文本到图像扩散模型
安德烈·沃伊诺夫、基菲尔·阿伯曼、丹尼尔·科恩-奥尔
arXiv 2022. [论文] [项目]
2022年11月24日

用于文本到图像生成的偏移扩散
周宇凡、刘炳辰、朱一哲、杨晓、陈昌友、徐锦辉
CVPR 2023. [论文]
2022年11月24日

Make-A-Story：基于视觉记忆条件的一致性故事生成
坦齐拉·拉赫曼、李欣颖、任健、谢尔盖·图利亚科夫、什韦塔·马哈詹、列昂尼德·西格尔
CVPR 2023. [论文]
2022年11月23日

薛定谔的蝙蝠：扩散模型有时会在叠加态中生成多义词
詹妮弗·C·怀特、瑞安·科特雷尔
arXiv 2022. [论文]
2022年11月23日

EDICT：通过耦合变换实现精确的扩散反演
布拉姆·华莱士、阿卡什·戈库尔、尼基尔·奈克
arXiv 2022. [论文] [GitHub]
2022年11月22日

用于文本驱动图像到图像转换的即插即用扩散特征
纳雷克·图马尼扬、米哈尔·盖耶尔、沙伊·巴贡、塔莉·德克尔
CVPR 2023. [论文] [GitHub]
2022年11月22日

文本到图像模型在多任务基准上的人工评估
维塔利·佩秋克、亚历山大·E·西门恩、赛萨姆里特·苏尔贝赫拉、扎德·钦、基思·泰瑟、格雷戈里·亨特、阿尔温德·拉加万、扬·希克、布莱恩·A·普拉默、奥里·凯雷特、托尼奥·布奥纳西西、凯特·萨恩科、阿曼多·索拉尔-莱萨马、伊多·德罗里
NeurIPS研讨会2022. [论文]
2022年11月22日

SinDiffusion：从单张自然图像中学习扩散模型
王伟伦、鲍建民、周文刚、陈东东、陈东、袁璐、李厚强
arXiv 2022. [论文] [GitHub]
2022年11月22日

SinFusion：在单张图像或视频上训练扩散模型
亚尼夫·尼坎金、尼夫·海姆、米哈尔·伊拉尼
arXiv 2022. [论文] [GitHub]
2022年11月21日

探索用于图像字幕生成的离散扩散模型
朱子欣、魏一轩、王建峰、甘哲、张正、王乐、华刚、王丽娟、刘子程、胡汉
arXiv 2022. [论文] [GitHub]
2022年11月21日

研究扩散模型中的提示工程
萨姆·维特韦恩、马丁·安德鲁斯
NeurIPS研讨会2022. [论文]
2022年11月21日

VectorFusion：通过抽象像素级扩散模型实现文本到SVG的转换
阿贾伊·贾因、安珀·谢、皮特·阿贝尔
arXiv 2022. [论文] [项目]
2022年11月21日

利用自回归潜扩散模型合成连贯的故事
潘锡臣、秦鹏达、李宇宏、薛辉、陈文虎
arXiv 2022. [论文] [GitHub]
2022年11月20日

DiffStyler：用于文本驱动图像风格化的可控双扩散模型
尼莎·黄、张雨欣、唐帆、马重阳、黄海彬、张勇、董伟明、许长生
arXiv 2022. [论文]
2022年11月19日

Magic3D：高分辨率文本到三维内容创作
林振轩、高俊、唐露明、泷川拓也、曾晓辉、黄勋、卡斯滕·克莱斯、桑雅·菲德勒、刘明宇、林宗毅
CVPR 2023. [论文] [项目]
2022年11月18日

通过扩散梦境中的分布偏移进行不变量学习
普里亚塔姆·卡塔金达、亚历山大·莱文、索海尔·费伊齐
arXiv 2022. [论文]
2022年11月18日

无文本反演：利用引导式扩散模型编辑真实图像
罗恩·莫卡迪、阿米尔·赫兹、基菲尔·阿伯曼、雅埃尔·普里奇、丹尼尔·科恩-奥尔
arXiv 2022. [论文]
2022年11月17日

InstructPix2Pix：学习遵循图像编辑指令
蒂姆·布鲁克斯、亚历山大·霍林斯基、阿列克谢·A·埃夫罗斯
CVPR 2023. [论文] [项目] [GitHub]
2022年11月17日

多功能扩散：文本、图像及变体一体化扩散模型
徐兴谦、王章洋、张力行、王凯、史恒瑞
arXiv 2022. [论文] [GitHub]
2022年11月15日

直接反演：无需优化的文本驱动真实图像编辑，基于扩散模型
阿德哈姆·艾拉拉巴维、哈里什·卡马特、塞缪尔·登顿
arXiv 2022. [论文]
2022年11月15日

任意风格引导下的增强型基于扩散的文本到图像生成
潘志洪、周鑫、田浩
WACV 2023. [论文]
2022年11月14日

安全潜扩散：缓解扩散模型中的不当退化问题
帕特里克·施拉莫夫斯基、曼努埃尔·布拉克、比约恩·代泽罗特、克里斯蒂安·克尔斯廷
CVPR 2023. [论文] [GitHub]
2022年11月9日

艺术家的瑞克摇：在文本引导的图像生成模型中注入隐形后门
卢卡斯·斯特鲁佩克、多米尼克·欣特斯多夫、克里斯蒂安·克尔斯廷
arXiv 2022。[论文] [GitHub]
2022年11月4日

eDiffi：基于专家去噪器集成的文生图扩散模型
约格什·巴拉吉、徐俊娜、黄勋、阿拉什·瓦赫达特、宋嘉铭、卡斯滕·克莱斯、米卡·艾塔拉、蒂莫·艾拉、萨穆利·莱内、布莱恩·卡坦扎罗、泰罗·卡拉斯、刘明宇
arXiv 2022。[论文] [GitHub]
2022年11月2日

MagicMix：基于扩散模型的语义混合
刘俊豪、严汉书、周大泉、冯家世
arXiv 2022。[论文] [项目]
2022年10月28日

UPainting：跨模态引导的统一文生图扩散生成
李伟、许雪、肖新燕、刘佳晨、杨虎、李国昊、王占鹏、冯志凡、佘巧巧、吕雅娟、吴华
arXiv 2022。[论文]
2022年10月28日

文生图生成模型能多好地理解伦理自然语言干预？
赫里提克·班萨尔、殷达、马苏德·莫纳贾蒂普尔、张凯威
EMNLP 2022。[论文] [GitHub]
2022年10月27日

ERNIE-ViLG 2.0：基于知识增强的去噪专家混合体改进文生图扩散模型
冯志达、张振宇、于欣彤、方业伟、李兰馨、陈旭毅、陆宇翔、刘家祥、尹维冲、冯世坤、孙宇、田浩、吴华、王海峰
CVPR 2023。[论文]
2022年10月27日

DiffusionDB：面向文生图生成模型的大规模提示图库数据集
王子杰·J、埃文·蒙托亚、大卫·穆内奇卡、杨浩洋、本杰明·胡佛、周登鸿
arXiv 2022。[论文] [项目] [GitHub]
2022年10月26日

Lafite2：少样本文生图生成
周宇凡、李春元、陈昌友、高建峰、徐金辉
arXiv 2022。[论文]
2022年10月25日

通过多阶段混合扩散进行高分辨率图像编辑
约翰内斯·阿克曼、李敏俊
NeurIPS研讨会2022。[论文] [GitHub]
2022年10月24日

利用模型预测控制实现更少显式指导的条件扩散
麦克斯·W·申、埃桑·哈吉拉梅扎纳利、加布里埃莱·斯卡利亚、亚历克斯·曾、纳撒尼尔·迪亚曼特、托马索·比安卡拉尼、安德烈亚斯·卢卡斯
arXiv 2022。[论文]
2022年10月21日

当前多模态语言模型面临的挑战概览
沙尚克·松卡尔、刘乃明、理查德·G·巴拉纽克
arXiv 2022。[论文]
2022年10月22日

DiffEdit：基于扩散的掩码引导语义图像编辑
纪尧姆·库瓦隆、雅各布·费尔贝克、霍尔格·施文克、马蒂厄·科尔德
ICLR 2023。[论文]
2022年10月20日

扩散模型已经具备语义潜在空间
权珉基、郑在锡、禹英中
ICLR 2023。[论文] [项目]
2022年10月20日

UniTune：通过在单张图像上微调图像生成模型实现文本驱动的图像编辑
丹妮·瓦列夫斯基、马坦·卡尔曼、约西·马蒂亚斯、亚尼夫·列维坦
arXiv 2022。[论文]
2022年10月18日

Swinv2-Imagen：用于文生图生成的层次化视觉Transformer扩散模型
李瑞军、李卫华、杨毅、魏涵宇、江建华、白泉
arXiv 2022。[论文]
2022年10月18日

Imagic：基于扩散模型的文本驱动真实图像编辑
巴哈贾特·卡瓦尔、希兰·扎达、奥兰·朗、奥默·托夫、常慧雯、塔莉·德克尔、因巴尔·莫塞里、米哈尔·伊拉尼
CVPR 2023。[论文] [项目]
2022年10月17日

利用现成扩散模型进行多属性时尚图像操控
孔彩琳、全东贤、权五俊、郭诺俊
WACV 2022。[论文]
2022年10月12日

统一扩散模型的潜在空间及其在循环扩散和引导中的应用
陈亨利·吴、费尔南多·德拉托雷
arXiv 2022。[论文] [GitHub-1] [GitHub-2]
2022年10月11日

Imagen Video：基于扩散模型的高清视频生成
乔纳森·霍、威廉·钱、奇特万·萨哈里亚、杰伊·旺、高睿琪、阿列克谢·格里琴科、迪德里克·P·金玛、本·普尔、穆罕默德·诺鲁齐、戴维·J·弗利特、蒂姆·萨利曼斯
arXiv 2022。[论文]
2022年10月5日

DALL-E-Bot：将网络规模扩散模型引入机器人技术
伊万·卡佩柳赫、维塔利斯·沃西柳斯、爱德华·约翰斯
IEEE RA-L 2022。[论文]
2022年10月5日

LDEdit：迈向基于潜在扩散模型的通用文本引导图像操控
帕拉马南德·钱德拉穆利、坎恰娜·维什纳维·甘迪科塔
BMVC 2022。[论文]
2022年10月5日

clip2latent：利用去噪扩散和CLIP对预训练StyleGAN进行文本驱动采样
贾斯汀·N·M·平克尼、李川
BMVC 2022。[论文] [GitHub]
2022年10月5日

针对文生图生成模型的成员推断攻击
吴一昕、于宁、李正、迈克尔·巴克斯、张阳
arXiv 2022。[论文]
2022年10月3日

Make-A-Video：无需文本-视频数据的文生视频生成
乌里埃尔·辛格、亚当·波利亚克、托马斯·海耶斯、阴曦、安洁、张颂阳、胡启源、杨哈利、阿舒阿尔、加夫尼、帕里克、古普塔、泰格曼
arXiv 2022。[论文]
2022年9月29日

DreamFusion：使用2D扩散进行文生3D
本·普尔、阿贾伊·贾因、乔纳森·T·巴伦、本·米尔登霍尔
arXiv 2022。[论文] [GitHub]
2022年9月29日

Re-Imagen：检索增强型文生图生成器
陈文虎、胡恒翔、奇特万·萨哈里亚、威廉·W·科恩
arXiv 2022。[论文]
2022年9月29日

利用潜在扩散模型进行创意绘画
吴宪超
arXiv 2022。[论文]
2022年9月29日

绘制你的艺术梦想：多模态引导扩散的多样化数字艺术合成
尼莎·黄、唐凡、董伟明、徐长生
ACM MM 2022。[论文] [GitHub]
2022年9月27日

通过美学梯度个性化文本到图像生成
维克托·加列戈
NeurIPS 工作坊 2022。[论文] [GitHub]
2022年9月25日

文本到图像模型的最佳提示及其寻找方法
尼基塔·帕夫利琴科、德米特里·乌斯塔洛夫
NeurIPS 工作坊 2022。[论文]
2022年9月23日

有偏见的艺术家：利用同形异义词在文本引导图像生成模型中挖掘文化偏见
卢卡斯·斯特鲁佩克、多米尼克·欣特斯多夫、克里斯蒂安·克尔斯廷
arXiv 2022。[论文] [GitHub]
2022年9月19日

生成式视觉提示：统一预训练生成模型的分布控制
陈亨利·吴、萨曼·莫塔梅德、绍纳克·斯里瓦斯塔瓦、费尔南多·德拉托雷
NeurIPS 2022。[论文] [GitHub]
2022年9月14日

ISS：以图像为跳板的文本引导三维形状生成
刘正哲、戴鹏、李瑞辉、齐晓娟、傅志文
ICLR 2023。[论文] [GitHub]
2022年9月9日

DreamBooth：针对主体驱动生成的文本到图像扩散模型微调
纳塔尼尔·鲁伊斯、李远振、瓦伦·詹帕尼、雅埃尔·普里奇、迈克尔·鲁宾斯坦、克菲尔·阿伯曼
CVPR 2023。[论文] [项目] [GitHub]
2022年8月25日

基于检索增强扩散模型的文本引导艺术图像合成
罗宾·隆巴赫、安德烈亚斯·布拉特曼、比约恩·奥默
arXiv 2022。[论文] [GitHub]
2022年7月26日

用于跨模态和条件生成的离散对比扩散
朱叶、吴宇、凯尔·奥尔谢夫斯基、任健、谢尔盖·图利亚科夫、严燕
ICLR 2023。[论文] [GitHub]
2022年6月15日

混合潜在扩散
奥姆里·阿夫拉哈米、欧哈德·弗里德、丹尼·利希金斯基
ACM 2022。[论文] [项目] [GitHub]
2022年6月6日

基于可组合扩散模型的组合式视觉生成
刘楠、李爽、杜一伦、安东尼奥·托拉尔巴、乔舒亚·B·特南鲍姆
ECCV 2022。[论文] [项目] [GitHub]
2022年6月3日

DiVAE：基于去噪扩散解码器的逼真图像合成
施杰、吴晨飞、梁建、刘翔、段楠
arXiv 2022。[论文]
2022年6月1日

改进的向量量化扩散模型
唐志聪、顾书阳、鲍建民、陈东、温芳
arXiv 2022。[论文] [GitHub]
2022年5月31日

Text2Human：文本驱动的可控人体图像生成
蒋宇明、杨帅、邱浩楠、吴伟恩、陈昌礼·洛伊、刘子威
ACM 2022。[论文] [GitHub]
2022年5月31日

具有深度语言理解的逼真文本到图像扩散模型
奇特万·萨哈里亚、威廉·钱、索拉布·萨克塞纳、拉拉·李、杰伊·王、艾米丽·登顿、赛耶德·卡米亚尔·赛耶德·加塞米普尔、布尔库·卡拉戈尔·阿扬、S·萨拉·马赫达维、拉法·贡蒂霍·洛佩斯、蒂姆·萨利曼斯、乔纳森·霍、大卫·J·弗利特、穆罕默德·诺鲁齐
NeurIPS 2022。[论文] [GitHub]
2022年5月23日

检索增强扩散模型
安德烈亚斯·布拉特曼、罗宾·隆巴赫、卡恩·奥克泰、比约恩·奥默
NeurIPS 2022。[论文] [GitHub]
2022年4月25日

基于CLIP潜在空间的层次化文本条件图像生成
阿迪提亚·拉梅什、普拉富拉·达里瓦尔、亚历克斯·尼科尔、凯西·楚、马克·陈
arXiv 2022。[论文] [GitHub]
2022年4月13日

KNN-Diffusion：基于大规模检索的图像生成
奥龙·阿舒阿尔、雪莉·谢因因、亚当·波利亚克、乌里埃尔·辛格、奥兰·加夫尼、埃利亚·纳赫马尼、亚尼夫·泰格曼
ICLR 2023。[论文]
2022年4月6日

基于潜在扩散模型的高分辨率图像合成
罗宾·隆巴赫、安德烈亚斯·布拉特曼、多米尼克·洛伦茨、帕特里克·埃瑟、比约恩·奥默
CVPR 2022。[论文] [GitHub]
2021年12月20日

免费获得更多控制！基于语义扩散引导的图像合成
刘熙晖、朴东旭、萨曼内·阿扎迪、张功、阿尔曼·乔皮基扬、胡宇晓、洪福·史、安娜·罗尔巴赫、特雷弗·达雷尔
WACV 2021。[论文] [项目]
2021年12月10日

用于文本到图像合成的向量量化扩散模型
顾书阳、陈东、鲍建民、温芳、张博、陈冬冬、袁璐、郭百宁
CVPR 2022。[论文] [GitHub]
2021年11月29日

用于自然图像文本驱动编辑的混合扩散
奥姆里·阿夫拉哈米、丹尼·利希金斯基、欧哈德·弗里德
CVPR 2022。[论文] [项目] [GitHub]
2021年11月29日

用去噪扩散GAN解决生成学习三难问题
肖志胜、卡斯滕·克莱斯、阿拉什·瓦赫达特
ICLR 2022（亮点论文）。[论文] [项目]
2021年12月15日

DiffusionCLIP：使用扩散模型进行文本引导的图像操作
金光贤、叶宗哲
CVPR 2022。[论文] [GitHub]
2021年10月6日

3D视觉

基于分类器分数蒸馏的文本到3D生成
辛宇、郭元辰、李阳光、丁亮、张松海、齐晓娟
arXiv 2023年。[论文]
2023年10月30日

使用对比扩散模型的可控群体编舞
Nhát Lê、Tường Đỗ、Khoa Đỗ、Hiền Nguyễn、Erman Tjiputra、Quang D. Trần、Anh Nguyễn
ACM ToG 2023年。[论文]
2023年10月29日

基于SE(3)扩散模型的点云配准用于鲁棒的6D物体位姿估计
姜浩博、马蒂厄·萨尔茨曼、邓政、谢进、杨健
arXiv 2023年。[论文]
2023年10月26日

通过扩散模型构建6自由度稳定性场
米田拓真、蒋天冲、格雷戈里·沙赫纳罗维奇、马修·R·沃尔特
arXiv 2023年。[论文]
2023年10月26日

DreamCraft3D：基于自举扩散先验的层次化3D生成
孙景翔、张博、邵睿智、王丽珍、刘文、谢振达、刘业斌
arXiv 2023年。[论文]
2023年10月25日

DiffRef3D：一种基于扩散的3D目标检测提案精炼框架
金世浩、具仁勇、李仁英、朴炳俊、金昌植
arXiv 2023年。[论文]
2023年10月25日

iNVS：将扩散修复模型重新用于新视角合成
Yash Kant、Aliaksandr Siarohin、Michael Vasilkovsky、Riza Alp Guler、任坚、Sergey Tulyakov、Igor Gilitschenski
SIGGRAPH ASIA 2023年。[论文] [项目]
2023年10月24日

Wonder3D：利用跨域扩散从单张图像生成3D
龙晓晓、郭元辰、林诚、刘源、窦志扬、刘凌杰、马悦欣、张松海、马克·哈伯曼、克里斯蒂安·泰奥巴尔特、王文平
arXiv 2023年。[论文]
2023年10月23日

MAS：基于2D扩散的多视角祖先采样用于3D运动生成
罗伊·卡蓬、盖伊·特韦特、丹尼尔·科恩-奥尔、阿米特·H·贝尔马诺
arXiv 2023年。[论文]
2023年10月23日

利用仿射卷积网络进行高质量3D人脸重建
林志谦、林江科、李林成、袁毅、邹正霞
arXiv 2023年。[论文]
2023年10月22日

TexFusion：利用文本引导的图像扩散模型合成3D纹理
曹天时、卡斯滕·克莱斯、桑雅·菲德勒、尼古拉斯·夏普、尹康雪
arXiv 2023年。[论文]
2023年10月20日

面向图像、3D动画和视频的条件生成建模
维克拉姆·沃莱蒂
arXiv 2023年。[论文]
2023年10月19日

TapMo：无骨骼角色的形状感知运动生成
张嘉旭、黄绍莉、涂志刚、陈鑫、詹晓航、于刚、山英
arXiv 2023年。[论文]
2023年10月19日

通过逐像素梯度裁剪提升高分辨率3D生成质量
潘子杰、陆嘉晨、朱夏添、张力
arXiv 2023年。[论文]
2023年10月19日

Progressive3D：针对复杂语义提示的文本到3D内容创作中的渐进式局部编辑
程新华、杨天宇、王佳楠、李宇、张磊、张健、袁立
arXiv 2023年。[论文]
2023年10月18日

基于3D结构指导的网络用于2D照片中的牙齿矫正
窦玉龙、梅兰珠菊、沈定刚、崔志明
arXiv 2023年。[论文]
2023年10月17日

DynVideo-E：利用动态NeRF进行大规模、可变运动与视角的人像视频编辑
刘家伟、曹燕佩、吴张洁、毛伟嘉、顾宇超、赵锐、尤西·凯波、山英、郑守迈克
arXiv 2023年。[论文]
2023年10月16日

ConsistNet：为多视角图像扩散强制实现3D一致性
杨佳宇、程子昂、段云飞、潘继、李洪东
arXiv 2023年。[论文]
2023年10月16日

PaintHuman：通过去噪分数蒸馏实现高保真度文本到3D人体纹理生成
俞建辉、朱浩、蒋利明、洛陈昌、蔡卫东、吴伟恩
arXiv 2023年。[论文]
2023年10月14日

OmniControl：随时控制任意关节以生成人体运动
谢一鸣、贾姆帕尼·瓦伦、钟磊、孙德清、蒋怀祖
arXiv 2023年。[论文] [项目]
2023年10月12日

Consistent123：提升单张图像到3D物体合成的一致性
翁浩然、杨天宇、王佳楠、李宇、张彤、C. L. Philip Chen、张磊
arXiv 2023年。[论文] [项目]
2023年10月12日

稳定扩散对3D场景了解多少？
展冠奇、郑传霞、谢伟迪、安德鲁·齐塞曼
arXiv 2023年。[论文]
2023年10月10日

HiFi-123：迈向高保真度单张图像到3D内容生成
于王博、袁立、曹燕佩、高祥军、李晓宇、权龙、山英、田永红
arXiv 2023年。[论文]
2023年10月10日

IPDreamer：基于图像提示的外观可控3D物体生成
曾博文、李尚林、冯宇唐、李宏、高思成、刘嘉铭、李华夏、唐旭、刘建庄、张宝昌
arXiv 2023年。[论文]
2023年10月9日

DragD3D：基于顶点的编辑，利用2D扩散先验实现逼真的网格变形
谢天昊、尤金·贝利洛夫斯基、苏迪尔·穆杜尔、提贝里乌·波帕
arXiv 2023年。[论文]
2023年10月6日

Ctrl-Room：在布局约束下可控的文本到3D房间网格生成
方川、胡晓涛、罗昆明、谭平
arXiv 2023年。[论文]
2023年10月5日

FreeReg：利用预训练扩散模型和单目深度估计器实现图像到点云配准
王海平、刘源、王兵、孙玉静、董震、王文平、杨必胜
arXiv 2023年。[论文]
2023年10月5日

Consistent-1-to-3：通过几何感知扩散模型实现一致的图像到3D视图合成
叶江龙、王鹏、李克杰、史一春、王恒
arXiv 2023年。[论文] [项目]
2023年10月4日

Efficient-3DiM：一天内学习一个通用的单张图像新视角合成器
蒋逸凡、唐浩、Rick Chang Jen-Hao、宋梁臣、王张洋、曹梁梁
arXiv 2023年。[论文]
2023年10月4日

T$^3$Bench：文本到3D生成的当前进展基准测试
何宇泽、白宇诗、马蒂厄·林、赵旺、胡雨斌、珍妮·盛、易然、李娟子、刘永进
arXiv 2023年。[论文] [项目] [GitHub]
2023年10月4日

ED-NeRF：基于潜在空间NeRF的高效文本引导3D场景编辑
朴章浩、权基贤、叶宗哲
arXiv 2023年。[论文]
2023年10月4日

MagicDrive：具有多样化3D几何控制的街景生成
高瑞源、陈凯、谢恩泽、洪兰青、李振国、杨德彦、徐强
arXiv 2023年。[论文] [项目]
2023年10月4日

SweetDreamer：在2D扩散模型中对齐几何先验以实现一致的文本到3D生成
李伟宇、陈睿、陈雪琳、谭平
arXiv 2023年。[论文] [项目]
2023年10月4日

基于扩散概率模型的人体与物体交互分层生成
皮怀瑾、彭思达、杨明辉、周晓伟、鲍虎军
arXiv 2023年。[论文] [项目] [GitHub]
2023年10月3日

HumanNorm：学习法线扩散模型以实现高质量和逼真的3D人体生成
黄欣、邵睿智、张琪、张洪文、冯颖、刘业斌、王庆
arXiv 2023年。[论文] [项目]
2023年10月2日

用于歧义感知逆向渲染的扩散后验光照
吕林杰、阿尤什·特瓦里、马克·哈伯曼、斋藤俊介、迈克尔·佐尔霍费尔、托马斯·莱姆库勒、克里斯蒂安·特奥巴尔特
arXiv 2023年。[论文]
2023年9月30日

EPiC-ly：利用流匹配和扩散快速生成粒子云
埃里克·布赫曼、塞德里克·埃文、达里乌斯·A·法鲁吉、托比亚斯·戈林、格雷戈尔·卡西奇卡、马修·利、纪尧姆·奎唐、约翰·安德鲁·雷恩、迪巴乔蒂·森古普塔、大卫·史密斯
arXiv 2023年。[论文]
2023年9月29日

Consistent123：利用案例感知扩散先验，从一张图像生成高度一致的3D资产
林宇康、韩浩楠、龚超群、许遵南、张亚超、李秀
arXiv 2023年。[论文]
2023年9月29日

由物体运动引导的人体运动合成
李佳曼、吴嘉俊、C·凯伦·刘
arXiv 2023年。[论文]
2023年9月28日

ITEM3D：面向3D模型的光照感知定向纹理编辑
刘圣奇、陈卓、高静楠、严一超、朱文翰、李晓波、高科、吕江京、杨晓康
arXiv 2023年。[论文]
2023年9月26日

光场扩散用于单视图新视角合成
熊义峰、马浩宇、孙善霖、韩坤、谢晓辉
arXiv 2023年。[论文]
2023年9月20日

用于结构构件设计的潜在扩散模型
伊桑·赫伦、贾迪普·拉德、阿努什鲁特·吉格纳苏、巴斯卡尔·加纳帕蒂苏布拉马尼亚、阿迪提亚·巴卢、索米克·萨卡尔、阿达尔什·克里希纳穆提
arXiv 2023年。[论文]
2023年9月20日

FaceDiffuser：利用扩散技术实现语音驱动的3D面部动画合成
斯特凡·斯坦、卡济·英贾马穆尔·哈克、泽林·尤马克
arXiv 2023年。[论文]
2023年9月20日

TwinTex：面向抽象化3D建筑模型的几何感知纹理生成
熊维丹、张红倩、彭博涛、胡子宇、吴勇力、郭建伟、黄辉
SIGGRAPH ASIA 2023。[论文]
2023年9月20日

语言条件下的3D点云可达性—姿态检测
阮端、武明日、黄宝如、武团文、张薇、黎银、武秋、黎北、阮英
arXiv 2023年。[论文]
2023年9月19日

利用点扩散模型对大肠3D形状进行精细化处理以生成数字幻影
考瑟·穆赫布、莫比娜·戈焦格·内贾德、拉夫森·达哈尔、埃桑·萨梅伊、W·保罗·塞加尔斯、约瑟夫·Y·洛
arXiv 2023年。[论文]
2023年9月15日

利用3D感知潜在扩散模型对人脸表征进行无监督解耦
何瑞安、邢震、谭伟民、颜博
arXiv 2023年。[论文]
2023年9月15日

M3Dsynth：包含AI生成局部操作的医学3D图像数据集
贾达·津加里尼、达维德·科佐利诺、里卡多·科尔维、乔瓦尼·波吉、路易莎·韦尔多利瓦
arXiv 2023年。[论文]
2023年9月14日

基于Transformer的大词汇量3D扩散模型
曹子昂、洪方舟、吴通、潘亮、刘子威
arXiv 2023年。[论文] [项目] [GitHub]
2023年9月14日

UnifiedGesture：适用于多种骨骼的统一手势合成模型
杨思成、王子林、吴志勇、李明磊、张振松、黄巧楚、郝磊、徐松岑、吴晓飞、杨昌鹏、戴宗宏
ACM MM 2023。[论文]
2023年9月13日

Fg-T2M：通过扩散模型实现细粒度文本驱动的人体运动生成
王寅、冷志英、弗雷德里克·W·B·李、吴顺诚、梁晓辉
ICCV 2023。[论文]
2023年9月12日

SyncDreamer：从单视图图像生成多视角一致的图像
刘源、林程、曾子娇、龙小晓、刘玲洁、小村拓、王文平
arXiv 2023年。[论文] [项目] [GitHub]
2023年9月7日

SADIR：面向3D图像重建的形状感知扩散模型
尼维塔·贾亚库马尔、托姆莫伊·侯赛因、张苗苗
arXiv 2023年。[论文]
2023年9月6日

MCM：面向多场景的多条件运动合成框架
凌泽宇、韩博、王永康、康坎哈利·莫汉、耿卫东
arXiv 2023年。[论文]
2023年9月6日

DiverseMotion：通过离散扩散模型迈向多样化的人体运动生成
娄云鸿、朱林超、王亚雄、王晓涵、杨毅
AAAI 2024。[论文]
2023年9月4日

BuilDiff：利用单张图像条件下的点云扩散模型生成3D建筑形态
姚伟、乔治·沃塞尔曼、杨明志
ICCV研讨会2023年。[论文]
2023年8月31日

MVDream：用于3D生成的多视角扩散模型
史一春、王鹏、叶江龙、龙迈、李克杰、杨晓
arXiv 2023年。[论文]
2023年8月31日

Diffusion Inertial Poser：从任意稀疏IMU配置中重建人体运动
汤姆·范·沃韦、李承焕、安托万·法利斯、斯科特·德尔普、C·卡伦·刘
arXiv 2023年。[论文]
2023年8月31日

InterDiff：基于物理约束的扩散模型生成3D人-物交互
徐思睿、李正元、王宇雄、桂良燕
ICCV 2023。[论文] [项目] [GitHub]
2023年8月31日

离散潜在空间中的优先级导向人体运动生成
孔汉阳、龚可洪、连东泽、米凯尔·比米、王新超
arXiv 2023年。[论文]
2023年8月28日

HoloFusion：迈向照片级逼真的3D生成建模
阿尼梅什·卡尔内瓦尔、尼洛伊·J·米特拉、安德烈亚·韦达尔迪、大卫·诺沃特尼
ICCV 2023。[论文] [项目]
2023年8月28日

使用Transformer的条件向量量化代码扩散进行未对齐的2D到3D转换
阿布里尔·科罗纳-菲格罗亚、萨姆·邦德-泰勒、尼兰詹·鲍米克、约娜·法利涅·A·高斯、托比·P·布雷肯、胡伯特·P·H·舒姆、克里斯·G·威尔科克斯
ICCV 2023。[论文]
2023年8月27日

Sparse3D：从稀疏视图中蒸馏多视角一致的扩散模型以进行物体重建
邹子欣、程伟浩、曹延佩、黄世盛、单颖、张松海
arXiv 2023年。[论文]
2023年8月27日

基于多平面去噪扩散的维度扩展，用于具有协调采样的微结构2D到3D重建
李康贤、尹根镇
arXiv 2023年。[论文]
2023年8月27日

DiffuseStyleGesture+ 参与2023年GENEA挑战赛的作品
杨思成、薛海伟、张振松、李明磊、吴志勇、吴晓飞、徐松岑、戴宗宏
ICMI 2023。[论文] [GitHub]
2023年8月26日

分布对齐的扩散模型用于人体网格恢复
林耿福、龚佳、侯赛因·拉赫马尼、刘俊
ICCV 2023。[论文] [项目]
2023年8月25日

EfficientDreamer：通过正交视图扩散先验实现高保真且鲁棒的3D创作
赵敏达、赵超毅、梁心悦、李林诚、赵增、胡志鹏、樊昌杰、辛宇
arXiv 2023年。[论文]
2023年8月25日

DF-3DFace：基于扩散模型的一对多语音同步3D人脸动画
朴世珍、洪乔安娜、金民洙、卢永满
arXiv 2023年。[论文]
2023年8月23日

LongDanceDiff：基于条件扩散模型的长期舞蹈生成
杨思琪、杨泽军、王志胜
arXiv 2023年。[论文]
2023年8月23日

IT3D：通过显式视图合成改进文本到3D的生成
陈艺文、张驰、杨晓峰、蔡中刚、于刚、杨磊、林国生
arXiv 2023年。[论文] [GitHub]
2023年8月22日

基于点-UV扩散在3D网格上生成纹理
辛宇、戴鹏、李文博、马兰、刘正哲、齐小娟
ICCV 2023。[论文]
2023年8月21日

基于物理引导的姿态概率建模的人体动作捕捉
鞠静怡、黄步震、朱晨、李志豪、王洋刚
IJCAI 2023。[论文] [GitHub]
2023年8月19日

无监督的非刚性运动恢复结构建模下的3D姿态估计
姬浩瑞、邓辉、戴宇超、李洪东
arXiv 2023年。[论文]
2023年8月18日

MATLABER：基于LAtent BRDF自动编码器的材料感知文本到3D生成
许旭东、吕兆阳、潘兴刚、戴博
arXiv 2023年。[论文] [项目]
2023年8月18日

O^2-Recon：利用预训练的2D扩散模型完成场景中被遮挡物体的3D重建
胡宇斌、叶晟、赵旺、林马蒂厄、何宇泽、温玉辉、何英、刘永进
arXiv 2023年。[论文]
2023年8月18日

基于去噪扩散的图像到3D手部姿态估计
马克西姆·伊瓦谢奇金、奥斯卡·门德斯、理查德·鲍登
arXiv 2023年。[论文]
2023年8月18日

PoSynDA：用于鲁棒3D人体姿态估计的多假设姿态合成领域适应
刘汉冰、何俊彦、程志奇、项望梦、杨启泽、柴文浩、王高昂、包旭、罗斌、耿义峰、谢宣松
ACM MM 2023。[论文] [GitHub]
2023年8月18日

Guide3D：根据文本和图像指导创建3D虚拟形象
曹宇康、曹延佩、韩凯、单颖、王关仪
arXiv 2023年。[论文]
2023年8月18日

DMCVR：用于3D心脏体积重建的形态学引导扩散模型
何晓晓、谭朝伟、韩立功、刘波、莱昂·阿克塞尔、李康、迪米特里斯·N·梅塔克萨斯
MICCAI 2023。[论文] [GitHub]
2023年8月18日

HumanLiff：基于扩散模型的分层3D人体生成
胡守康、洪方舟、胡涛、潘亮、梅海怡、肖伟业、杨磊、刘子威
arXiv 2023年。[论文] [项目]
2023年8月18日

注意你的脚步：通过文本指令进行局部图像和场景编辑
阿什坎·米尔扎伊、特里斯坦·奥门塔多-阿姆斯特朗、马库斯·A·布鲁贝克、乔纳森·凯利、亚历克斯·列文施泰因、康斯坦丁诺斯·G·德尔帕尼斯、伊戈尔·吉利琴斯基
arXiv 2023年。[论文] [项目]
2023年8月17日

TeCH：基于文本指导的逼真着装人类重建
黄扬毅、易洪伟、修雨良、廖婷婷、唐家祥、蔡登、尤斯图斯·蒂斯
arXiv 2023年。[论文] [项目]] [GitHub]
2023年8月16日

CCD-3DR：用于单图像 3D 重建的扩散模型中的一致性条件化
Yan Di、Chenyangguang Zhang、Pengyuan Wang、Guangyao Zhai、Ruida Zhang、Fabian Manhardt、Benjamin Busam、Xiangyang Ji、Federico Tombari
arXiv 2023。[论文]
2023年8月15日

舞动化身：基于姿态与文本指导的图像扩散模型人体运动视频合成
Bosheng Qin、Wentao Ye、Qifan Yu、Siliang Tang、Yueting Zhuang
arXiv 2023。[论文]
2023年8月15日

利用场景图的 3D 场景扩散引导
Mohammad Naanaa、Katharina Schmid、Yinyu Nie
arXiv 2023。[论文]
2023年8月8日

Cloth2Tex：用于 3D 虚拟试衣的定制化布料纹理生成流水线
Daiheng Gao、Xu Chen、Xindi Zhang、Qi Wang、Ke Sun、Bang Zhang、Liefeng Bo、Qixing Huang
arXiv 2023。[论文]
2023年8月8日

AvatarVerse：基于文本和姿态的高质量且稳定的 3D 化身生成
Huichao Zhang、Bowen Chen、Hao Yang、Liao Qu、Xu Wang、Li Chen、Chao Long、Feida Zhu、Kang Du、Min Zheng
arXiv 2023。[论文] [项目]
2023年8月7日

基于扩散模型的概率人体网格恢复的生成式方法
Hanbyel Cho、Junmo Kim
ICCV 工作坊 2023。[论文] [GitHub]
2023年8月5日

DiffDance：用于舞蹈生成的级联人体运动扩散模型
Qiaosong Qi、Le Zhuo、Aixi Zhang、Yue Liao、Fei Fang、Si Liu、Shuicheng Yan
ACM MM 2023。[论文]
2023年8月5日

基于草图和文本指导的彩色点云生成扩散模型
Zijie Wu、Yaonan Wang、Mingtao Feng、He Xie、Ajmal Mian
arXiv 2023。[论文]
2023年8月5日

关于从神经表征到符号知识的过渡
Junyan Cheng、Peter Chin
arXiv 2023。[论文]
2023年8月3日

通过连贯采样利用扩散模型合成长期人体运动
Zhao Yang、Bing Su、Ji-Rong Wen
ACM MM 2023。[论文] [GitHub]
2023年8月3日

HD-Fusion：利用多噪声估计实现细节丰富的文本到 3D 生成
Jinbo Wu、Xiaobo Gao、Xing Liu、Zhengyang Shen、Chen Zhao、Haocheng Feng、Jingtuo Liu、Errui Ding
arXiv 2023。[论文]
2023年7月30日

TransFusion：一种实用且高效的基于 Transformer 的扩散模型，用于 3D 人体运动预测
Sibo Tian、Minghui Zheng、Xiao Liang
arXiv 2023。[论文]
2023年7月30日

TEDi：用于长期运动合成的时间纠缠扩散模型
Zihan Zhang、Richard Liu、Kfir Aberman、Rana Hanocka
arXiv 2023。[论文]
2023年7月27日

Points-to-3D：弥合稀疏点云与形状可控的文本到 3D 生成之间的差距
Chaohui Yu、Qiang Zhou、Jingliang Li、Zhe Zhang、Zhibin Wang、Fan Wang
arXiv 2023。[论文]
2023年7月26日

假装而不造假：用于精确 3D 面部形状估计的条件化人脸生成
Will Rowan、Patrik Huber、Nick Pears、Andrew Keeling
arXiv 2023。[论文]
2023年7月25日

NIFTY：用于引导式人体运动合成的神经对象交互场
Nilesh Kulkarni、Davis Rempe、Kyle Genova、Abhijit Kundu、Justin Johnson、David Fouhey、Leonidas Guibas
arXiv 2023。[论文] [项目]
2023年7月14日

AvatarFusion：使用 2D 指纹扩散模型零样本生成解耦服装的 3D 化身
Shuo Huang、Zongxin Yang、Liangting Li、Yi Yang、Jia Jia
arXiv 2023。[论文]
2023年7月13日

利用文本到图像扩散模型生成关节式 3D 头部化身
Alexander W. Bergman、Wang Yifan、Gordon Wetzstein
arXiv 2023。[论文]
2023年7月10日

回归优化：基于扩散的零样本 3D 人体姿态估计
Zhongyu Jiang、Zhuoran Zhou、Lei Li、Wenhao Chai、Cheng-Yen Yang、Jenq-Neng Hwang
arXiv 2023。[论文]
2023年7月7日

潜在 3D 指纹扩散模型的自动解码
Evangelos Ntavelis、Aliaksandr Siarohin、Kyle Olszewski、Chaoyang Wang、Luc Van Gool、Sergey Tulyakov
arXiv 2023。[论文]
2023年7月7日

SVDM：用于伪立体 3D 物体检测的单视图扩散模型
Yuguang Shi
arXiv 2023。[论文]
2023年7月5日

DiT-3D：探索用于 3D 形状生成的纯扩散 Transformer
Shentong Mo、Enze Xie、Ruihang Chu、Lewei Yao、Lanqing Hong、Matthias Nießner、Zhenguo Li
arXiv 2023。[论文]
2023年7月4日

Magic123：结合 2D 和 3D 指纹先验，仅凭一张图片即可生成高质量 3D 对象
Guocheng Qian、Jinjie Mai、Abdullah Hamdi、Jian Ren、Aliaksandr Siarohin、Bing Li、Hsin-Ying Lee、Ivan Skorokhodov、Peter Wonka、Sergey Tulyakov、Bernard Ghanem
arXiv 2023。[论文] [项目]
2023年6月30日

米开朗基罗：基于形状—图像—文本对齐的潜在表征的条件化 3D 形状生成
Zibo Zhao、Wen Liu、Xin Chen、Xianfang Zeng、Rui Wang、Pei Cheng、Bin Fu、Tao Chen、Gang Yu、Shenghua Gao
arXiv 2023。[论文]
2023年6月29日

DiffComplete：基于扩散的生成式 3D 形状补全
Ruihang Chu、Enze Xie、Shentong Mo、Zhenguo Li、Matthias Nießner、Chi-Wing Fu、Jiaya Jia
arXiv 2023。[论文]
2023年6月28日

DreamTime：用于文本到 3D 内容创作的改进优化策略
Yukun Huang、Jianan Wang、Yukai Shi、Xianbiao Qi、Zheng-Jun Zha、Lei Zhang
arXiv 2023。[论文]
2023年6月21日

EMoG：利用扩散模型合成富有情感的伴随言语 3D 手势
Lianying Yin、Yijun Wang、Tianyu He、Jinming Liu、Wei Zhao、Bohan Li、Xin Jin、Jianxin Lin
arXiv 2023。[论文]
2023年6月20日

利用预训练文本到图像指纹扩散模型进行点云补全
Yoni Kasten、Ohad Rahamim、Gal Chechik
arXiv 2023。[论文]
2023年6月18日

AvatarBooth：高质量且可定制的 3D 人类化身生成
Yifei Zeng、Yuanxun Lu、Xinya Ji、Yao Yao、Hao Zhu、Xun Cao
arXiv 2023。[论文]
2023年6月16日

Edit-DiffNeRF：基于2D扩散模型的3D神经辐射场编辑
陆宇、魏翔、韩康
arXiv 2023年。[论文]
2023年6月15日

在扩散模型中加入3D几何控制
马武飞、刘启豪、王嘉浩、王昂天、刘瑶瑶、亚当·科蒂莱夫斯基、艾伦·尤伊尔
arXiv 2023年。[论文]
2023年6月13日

视图集扩散：从2D数据生成(0-)图像条件的3D生成模型
斯坦尼斯瓦夫·希曼诺维奇、克里斯蒂安·鲁普雷希特、安德烈亚·韦达尔迪
arXiv 2023年。[论文]
2023年6月13日

通过去噪体素网格生成3D分子
佩德罗·O·皮涅罗、乔舒亚·拉克斯、约瑟夫·克莱因亨茨、迈克尔·马瑟、奥马尔·马赫穆德、安德鲁·马丁·沃特金斯、斯蒂芬·拉、维什努·斯雷什特、萨伊德·萨雷米
arXiv 2023年。[论文]
2023年6月13日

InstructP2P：学习使用文本指令编辑3D点云
徐佳乐、王新涛、曹燕沛、程伟浩、单莹、高圣华
arXiv 2023年。[论文]
2023年6月12日

RePaint-NeRF：通过语义掩码和扩散模型编辑NeRF
周兴晨、何颖、F·理查德·余、李建强、李友
arXiv 2023年。[论文]
2023年6月9日

随机多人3D运动预测
徐思睿、王宇雄、桂良燕
arXiv 2023年。[论文]
2023年6月8日

ARTIC3D：从噪声网络图像集合中学习鲁棒的可关节3D形状
姚春汉、阿米特·拉杰、洪伟志、李元振、迈克尔·鲁宾斯坦、杨明轩、瓦伦·詹帕尼
arXiv 2023年。[论文]
2023年6月7日

在潜在空间中利用去噪扩散合成逼真的沙粒集合
尼古拉奥斯·N·弗拉西斯、孙伟清、哈立德·A·阿尔希布利、理查德·A·雷盖罗
arXiv 2023年。[论文]
2023年6月7日

AvatarStudio：文本驱动的3D动态人头化身编辑
莫希特·门迪拉塔、潘星刚、穆罕默德·埃尔加里卜、卡尔蒂克·提奥蒂亚、Mallikarjun B R、阿尤什·特瓦里、弗拉季斯拉夫·戈利亚尼克、亚当·科蒂莱夫斯基、克里斯蒂安·泰奥巴尔特
arXiv 2023年。[论文]
2023年6月1日

DiffRoom：基于扩散模型的高质量3D房间重建与生成
鞠晓亮、黄兆阳、李一瑾、张国峰、乔宇、李宏胜
arXiv 2023年。[论文]
2023年6月1日

可控运动扩散模型
史毅、王景博、蒋学坤、戴波
arXiv 2023年。[论文] [项目]
2023年6月1日

FDNeRF：基于扩散模型的语义驱动人脸重建、提示编辑与重照明
张浩、许延波、戴天远、于永、唐志强
arXiv 2023年。[论文]
2023年6月1日

从单目图像中隐式重建手持物体并学习显式接触
胡俊星、张洪文、陈泽瑞、李梦成、王云龙、刘业斌、孙振楠
arXiv 2023年。[论文] [项目]
2023年5月31日

StyleAvatar3D：利用图文扩散模型生成高保真3D化身
张驰、陈艺文、傅一君、周正林、于刚、Billzb Wang、傅彬、陈涛、林国生、沈春华
arXiv 2023年。[论文]
2023年5月30日

HiFA：基于先进扩散引导的高保真文本到3D生成
朱俊哲、庄培烨
arXiv 2023年。[论文]
2023年5月30日

用于语义3D医学图像合成的条件扩散模型
卓那玛尔·多日森贝、包兴国、索达特维兰·奥东奇梅德、肖福仁
arXiv 2023年。[论文]
2023年5月29日

ZeroAvatar：从单张图像零样本生成3D化身
翁珍珍、王泽宇、谢丽娜·杨
arXiv 2023年。[论文]
2023年5月25日

NAP：神经3D关节先验
雷家辉、邓聪悦、申博魁、列奥尼达斯·吉巴斯、科斯塔斯·达尼利迪斯
arXiv 2023年。[论文] [项目]
2023年5月25日

CommonScenes：利用场景图生成常识性3D室内场景
翟广耀、埃文·皮纳尔·厄内克、吴顺诚、严迪、费德里科·汤巴里、纳西尔·纳瓦布、本杰明·布萨姆
arXiv 2023年。[论文]
2023年5月25日

ProlificDreamer：利用变分得分蒸馏实现高保真且多样化的文本到3D生成
王政毅、卢成、王亦凯、鲍凡、李崇轩、苏航、朱军
arXiv 2023年。[论文] [项目]
2023年5月25日

DiffCLIP：利用Stable Diffusion进行语言嵌入的3D分类
沈思恬、朱子琳、范琳倩、张哈利、吴欣晓
arXiv 2023年。[论文]
2023年5月25日

通过SE(3)上的基于分数的扩散解决6D目标位姿估计中的歧义问题
萧祖青、陈浩伟、杨玄功、李春义
arXiv 2023年。[论文]
2023年5月25日

Deceptive-NeRF：利用来自扩散模型的伪观测增强NeRF重建
刘欣航、高修鸿、陈嘉奔、于永、唐志强
arXiv 2023年。[论文]
2023年5月24日

流形扩散场
艾哈迈德·A·埃尔哈格、乔书亚·M·萨斯金德、米格尔·安赫尔·巴乌蒂斯塔
arXiv 2023年。[论文]
2023年5月24日

Sin3DM：从单个3D纹理形状中学习扩散模型
吴润地、刘若诗、卡尔·冯德里克、郑昌熙
arXiv 2023年。[论文] [项目] [GitHub]
2023年5月24日

借助扩散模型的关键帧协作理解文本驱动的运动合成
董伟、孙晓宁、孙怀江、李斌、胡盛祥、李卫青、陆建峰
arXiv 2023年。[论文]
2023年5月23日

DiffHand：通过扩散模型端到端的手部网格重建
李继军、卓莉安、张邦、薄立峰、陈晨
arXiv 2023年。[论文]
2023年5月23日

GMD：通过引导式扩散模型实现可控的人体运动合成
科拉韦·卡伦拉塔纳库尔、孔帕特·普里恰库尔、苏帕松·苏瓦贾纳科恩、唐思宇
arXiv 2023年。[论文] [项目]
2023年5月21日

通过运动扩散实现全局一致的随机人体运动预测
孙嘉睿、吉里什·乔杜里
arXiv 2023年。[论文]
2023年5月21日

少样本三维形状生成
朱京元、马慧敏、陈建生、袁健
arXiv 2023年。[论文]
2023年5月19日

Chupa：利用二维扩散概率模型从蒙皮形状先验中雕刻出穿着衣物的三维人体
金炳俊、帕特里克·权、李光浩、李明基、韩淑婉、金大植、朱汉别尔
arXiv 2023年。[论文] [项目]
2023年5月19日

Text2NeRF：基于文本驱动的神经辐射场三维场景生成
张景博、李晓宇、万子宇、王灿、廖静
arXiv 2023年。[论文]
2023年5月19日

RoomDreamer：基于文本驱动的具有连贯几何与纹理的三维室内场景合成
宋良辰、曹亮亮、许洪宇、康凯、唐峰、袁俊松、赵阳
arXiv 2023年。[论文]
2023年5月18日

LDM3D：用于三维的潜在扩散模型
加布里埃拉·本·梅莱赫·斯坦、黛安娜·沃尔夫克、斯科蒂·福克斯、亚历克斯·雷登、威尔·萨克斯顿、让·于、埃斯特尔·阿夫拉洛、邵燕·曾、法比奥·诺纳托、马蒂亚斯·穆勒、瓦塞德夫·拉尔
arXiv 2023年。[论文]
2023年5月18日

Make-An-Animation：大规模文本条件化的三维人体运动生成
萨曼内·阿扎迪、阿克巴尔·沙赫、托马斯·海耶斯、戴维·帕里克、索娜尔·古普塔
arXiv 2023年。[论文] [项目]
2023年5月16日

FitMe：深度照片级逼真的三维可变形模型化身
亚历山德罗斯·拉塔斯、斯蒂利亚诺斯·莫斯霍格卢、斯蒂利亚诺斯·普卢姆皮斯、巴里斯·盖切尔、邓建康、斯特凡诺斯·扎菲里乌
CVPR 2023年。[论文] [项目]
2023年5月16日

AMD：自回归运动扩散
韩博、彭浩、董敏静、徐畅、任毅、沈一轩、李宇恒
arXiv 2023年。[论文]
2023年5月16日

文本引导的高清晰度一致性纹理模型
汤志斌、何天童
arXiv 2023年。[论文]
2023年5月10日

Relightify：通过扩散模型从单张图像重建可重光照的三维人脸
福伊沃斯·帕拉佩拉斯·帕潘托尼乌、亚历山德罗斯·拉塔斯、斯蒂利亚诺斯·莫斯霍格卢、斯特凡诺斯·扎菲里乌
arXiv 2023年。[论文] [项目]
2023年5月10日

CaloClouds：快速、与几何无关的高粒度量能器模拟
埃里克·布赫曼、萨沙·迪芬巴赫、恩京·埃伦、弗兰克·盖德、格雷戈尔·卡西奇卡、阿纳托利·科罗尔、威廉·科尔卡里、卡佳·克吕格、彼得·麦基翁
arXiv 2023年。[论文]
2023年5月8日

局部注意力SDF扩散用于可控三维形状生成
郑新阳、潘浩、王鹏帅、佟欣、刘洋、沈向洋
SIGGRAPH 2023年。[论文]
2023年5月8日

DiffFacto：基于跨扩散的可控部件式三维点云生成
中山清弘、米凯拉·安杰莉娜·乌伊、黄家辉、胡士民、李科、列奥尼达斯·J·吉巴斯
arXiv 2023年。[论文] [GitHub]
2023年5月4日

Shap-E：生成条件化的三维隐式函数
Jun Heewoo、Alex Nichol
arXiv 2023年。[论文] [GitHub]
2023年5月3日

ContactArt：学习类别级别的可铰接物体及手部姿态估计的三维交互先验
朱泽昊、王嘉顺、秦宇哲、孙德庆、瓦伦·詹帕尼、王小龙
arXiv 2023年。[论文] [项目]
2023年5月2日

DreamPaint：无需三维建模的虚拟试穿用电商商品少样本修复
梅赫梅特·赛金·塞菲奥卢、卡里姆·布亚尔曼、苏仁·库马尔、阿米尔·塔瓦奈伊、伊斯梅尔·B·图塔尔
arXiv 2023年。[论文]
2023年5月2日

为NeRFs学习扩散先验
杨冠道、阿比吉特·昆杜、列奥尼达斯·J·吉巴斯、乔纳森·T·巴伦、本·普尔
ICLR研讨会2023年。[论文]
2023年4月27日

TextMesh：根据文本提示生成逼真的三维网格
克里斯蒂娜·察利科格鲁、法比安·曼哈特、阿莱西奥·托尼奥尼、迈克尔·尼迈耶、费德里科·汤巴里
arXiv 2023年。[论文]
2023年4月24日

Nerfbusters：去除随意拍摄的NeRF中的鬼影伪影
弗雷德里克·瓦尔堡、伊桑·韦伯、马修·坦西克、亚历山大·霍林斯基、安久·卡纳扎瓦
arXiv 2023年。[论文] [项目] [GitHub]
2023年4月20日

Farm3D：通过蒸馏二维扩散学习可铰接的三维动物
托马斯·雅卡布、李瑞宁、吴尚哲、克里斯蒂安·鲁普雷希特、安德烈亚·韦达尔迪
arXiv 2023年。[论文] [项目]
2023年4月20日

Anything-3D：迈向野外单视图任意物体重建
沈秋红、杨兴义、王新超
arXiv 2023年。[论文]
2023年4月19日

化身长出双腿：利用扩散模型从稀疏跟踪输入生成平滑的人体运动
杜宇明、罗宾·基普斯、阿尔伯特·普马罗拉、塞巴斯蒂安·施塔克、阿里·塔贝特、阿尔乔姆·萨纳科耶夫
CVPR 2023年。[论文] [项目] [GitHub]
2023年4月17日

通过奖励引导的探索迈向可控扩散模型
张恒通、许婷洋
arXiv 2023年。[论文]
2023年4月14日

从单视图图像学习可控三维扩散模型
顾家涛、高青哲、翟双飞、陈宝泉、刘凌杰、乔什·萨斯金德
arXiv 2023年。[论文] [项目]
2023年4月13日

单阶段扩散NeRF：一种统一的三维生成与重建方法
陈汉生、顾家涛、陈安培、田伟、涂卓文、刘凌杰、苏浩
arXiv 2023年。[论文] [项目]
2023年4月13日

从第一人称视角在三维场景中进行概率性人体网格恢复
张思伟、马倩丽、张燕、萨德格·阿里阿克巴里安、达伦·科斯克、唐思宇
arXiv 2023年。[论文] [项目]
2023年4月12日

InterGen：复杂交互下的基于扩散的多人体运动生成
Han Liang、Wenqian Zhang、Wenxuan Li、Jingyi Yu、Lan Xu
arXiv 2023年。[论文] [GitHub]
2023年4月12日

从第一人称视角中在3D场景中进行概率性人体网格恢复
Siwei Zhang、Qianli Ma、Yan Zhang、Sadegh Aliakbarian、Darren Cosker、Siyu Tang
arXiv 2023年。[论文] [项目]
2023年4月12日

重新构想负向提示算法：将2D扩散模型转化为3D，缓解Janus问题及更多
Mohammadreza Armandpour、Huangjie Zheng、Ali Sadeghian、Amir Sadeghian、Mingyuan Zhou
arXiv 2023年。[论文] [项目]
2023年4月11日

NeRF应用于卫星影像以进行地表重建
Federico Semeraro、Yi Zhang、Wenying Wu、Patrick Carroll
arXiv 2023年。[论文] [GitHub]
2023年4月9日

DITTO-NeRF：基于扩散的迭代式文本到全向3D模型生成
Hoigi Seo、Hayeon Kim、Gwanghyun Kim、Se Young Chun
arXiv 2023年。[论文] [项目]
2023年4月6日

基于3D感知扩散模型的生成式新视图合成
Eric R. Chan、Koki Nagano、Matthew A. Chan、Alexander W. Bergman、Jeong Joon Park、Axel Levy、Miika Aittala、Shalini De Mello、Tero Karras、Gordon Wetzstein
arXiv 2023年。[论文] [项目]
2023年4月5日

Trace and Pace：通过引导轨迹扩散实现可控行人动画
Davis Rempe、Zhengyi Luo、Xue Bin Peng、Ye Yuan、Kris Kitani、Karsten Kreis、Sanja Fidler、Or Litany
CVPR 2023年。[论文] [GitHub]
2023年4月4日

PODIA-3D：利用姿态保持的文生图扩散模型，在大领域差距下实现3D生成模型的域适应
Gwanghyun Kim、Ji Ha Jang、Se Young Chun
arXiv 2023年。[论文] [项目]
2023年4月4日

ReMoDiffuse：检索增强型运动扩散模型
Mingyuan Zhang、Xinying Guo、Liang Pan、Zhongang Cai、Fangzhou Hong、Huirong Li、Lei Yang、Ziwei Liu
arXiv 2023年。[论文] [项目] [GitHub]
2023年4月3日

基于自回归扩散模型的可控运动合成与重建
Wenjie Yin、Ruibo Tu、Hang Yin、Danica Kragic、Hedvig Kjellström、Mårten Björkman
arXiv 2023年。[论文]
2023年4月3日

DreamAvatar：通过扩散模型实现文本与形状引导的3D人类化身生成
Yukang Cao、Yan-Pei Cao、Kai Han、Ying Shan、Kwan-Yee K. Wong
arXiv 2023年。[论文]
2023年4月3日

DreamFace：在文本指导下逐步生成可动画化的3D人脸
Longwen Zhang、Qiwei Qiu、Hongyang Lin、Qixuan Zhang、Cheng Shi、Wei Yang、Ye Shi、Sibei Yang、Lan Xu、Jingyi Yu
arXiv 2023年。[论文] [项目]
2023年4月1日

AvatarCraft：通过参数化形状和姿态控制，将文本转化为神经网络驱动的人类化身
Ruixiang Jiang、Can Wang、Jingbo Zhang、Menglei Chai、Mingming He、Dongdong Chen、Jing Liao
arXiv 2023年。[论文] [项目] [GitHub]
2023年3月30日

HOLODIFFUSION：使用2D图像训练3D扩散模型
Animesh Karnewar、Andrea Vedaldi、David Novotny、Niloy Mitra
CVPR 2023年。[论文] [项目]
2023年3月29日

4D面部表情扩散模型
Kaifeng Zou、Sylvain Faisan、Boyang Yu、Sébastien Valette、Hyewon Seo
arXiv 2023年。[论文] [GitHub]
2023年3月29日

Instruct 3D-to-3D：文本指令引导的3D到3D转换
Hiromichi Kamata、Yuiko Sakuma、Akio Hayakawa、Masato Ishii、Takuya Narihira
arXiv 2023年。[论文] [项目] [GitHub]
2023年3月28日

利用可微分渲染进行人体新视图合成
Guillaume Rochette、Chris Russell、Richard Bowden
IEEE T-BIOM 2023年。[论文] [GitHub]
2023年3月28日

对2D扩散模型的评分和提示进行去偏处理，以实现稳健的文生3D生成
Susung Hong、Donghoon Ahn、Seungryong Kim
CVPR研讨会2023年。[论文]
2023年3月27日

Make-It-3D：基于扩散先验，从单张图像中创建高保真3D内容
Junshu Tang、Tengfei Wang、Bo Zhang、Ting Zhang、Ran Yi、Lizhuang Ma、Dong Chen
arXiv 2023年。[论文] [项目] [GitHub]
2023年3月24日

ISS++：以图像为跳板，实现文本指导的3D形状生成
Zhengzhe Liu、Peng Dai、Ruihui Li、Xiaojuan Qi、Chi-Wing Fu
ICLR 2023年。[论文]
2023年3月24日

CompoNeRF：文本引导的多物体组合式NeRF，具有可编辑的3D场景布局
Yiqi Lin、Haotian Bai、Sijia Li、Haonan Lu、Xiaodong Lin、Hui Xiong、Lin Wang
arXiv 2023年。[论文] [项目]
2023年3月24日

Fantasia3D：解耦几何与外观，用于高质量的文生3D内容创作
Rui Chen、Yongwei Chen、Ningxin Jiao、Kui Jia
arXiv 2023年。[论文] [项目] [GitHub]
2023年3月24日

DDT：基于扩散驱动的Transformer框架，用于从视频中恢复人体网格
Ce Zheng、Guo-Jun Qi、Chen Chen
arXiv 2023年。[论文]
2023年3月23日

Instruct-NeRF2NeRF：用指令编辑3D场景
Ayaan Haque、Matthew Tancik、Alexei A. Efros、Aleksander Holynski、Angjoo Kanazawa
arXiv 2023年。[论文] [项目]
2023年3月22日

FeatureNeRF：通过蒸馏基础模型学习可泛化的 NeRF
叶江龙、王乃延、王晓龙
arXiv 2023。[论文] [项目]
2023年3月22日

Vox-E：文本引导的三维物体体素编辑
埃泰·塞拉、加尔·菲贝尔曼、彼得·赫德曼、哈达尔·阿韦尔布赫-埃洛尔
arXiv 2023。[论文] [项目]
2023年3月21日

基于局部条件扩散的组合式三维场景生成
瑞安·波、戈登·韦茨施泰因
arXiv 2023。[论文] [GitHub]
2023年3月21日

基于扩散的多假设聚合三维人体姿态估计
单文康、刘振华、张新峰、王钊、韩凯、王善设、马思伟、高文
arXiv 2023。[论文] [GitHub]
2023年3月21日

3D-CLFusion：对比潜在扩散驱动的快速文本到三维渲染
李宇哲、克里斯·基塔尼
arXiv 2023。[论文]
2023年3月21日

Affordance Diffusion：合成手与物体的交互
叶宇飞、李雪婷、阿比纳夫·古普塔、沙利尼·德梅洛、斯坦·伯奇菲尔德、宋佳明、舒巴姆·图尔西亚尼、刘思飞
CVPR 2023。[论文] [项目]
2023年3月21日

SALAD：用于三维形状生成与操控的部件级潜在扩散模型
具俊一、柳承佑、阮明孝、成珉赫
arXiv 2023。[论文] [项目]
2023年3月21日

从低成本数据中学习三维可变形人脸反射率模型
韩宇轩、王志博、徐峰
CVPR 2023。[论文] [项目]
2023年3月21日

Text2Tex：基于扩散模型的文本驱动纹理合成
陈振宇、亚瓦尔·西迪基、李欣颖、谢尔盖·图利亚科夫、马蒂亚斯·尼斯纳
arXiv 2023。[论文] [项目]
2023年3月20日

Zero-1-to-3：零样本单张图像转三维物体
刘若诗、吴润迪、巴斯勒·范霍里克、帕维尔·托克马科夫、谢尔盖·扎哈罗夫、卡尔·冯德里克
arXiv 2023。[论文] [项目] [GitHub]
2023年3月20日

SKED：草图引导的文本驱动三维编辑
阿里扬·米卡伊利、奥尔·佩雷尔、丹尼尔·科恩-奥尔、阿里·马赫达维-阿米里
arXiv 2023。[论文]
2023年3月19日

3DQD：通过部件离散化扩散过程构建通用深度三维形状先验
李宇涵、窦义顺、陈玄洪、倪兵兵、孙怡琳、刘宇田、王福珍
CVPR 2023。[论文] [GitHub]
2023年3月18日

驯服扩散模型用于音频驱动的共言语手势生成
朱玲婷、刘贤、刘宣宇、钱睿、刘子威、于乐泉
CVPR 2023。[论文] [GitHub]
2023年3月16日

Diffusion-HPC：生成具有逼真人像的合成图像
翁振振、劳拉·布拉沃-桑切斯、塞蕾娜·杨
arXiv 2023。[论文] [GitHub]
2023年3月16日

DINAR：用于一次性生成人类化身的神经纹理扩散修复
大卫·斯维托夫、德米特里·古德科夫、雷纳特·巴希罗夫、维克托·伦皮茨基
arXiv 2023。[论文]
2023年3月16日

利用预训练的垂直二维扩散模型提升三维成像质量
李秀贤、郑炯镇、朴敏英、朴宗赫、柳威淳、叶钟哲
arXiv 2023。[论文]
2023年3月15日

通过稀疏潜在点扩散模型实现可控网格生成
吕兆阳、王金义、安宇伟、张雅、林大华、戴博
CVPR 2023。[论文] [项目]
2023年3月14日

MeshDiffusion：基于分数函数的生成式三维网格建模
刘震、冯瑶、迈克尔·J·布莱克、德里克·诺鲁泽扎赖、利亚姆·保尔、刘伟洋
ICLR 2023。[论文] [项目] [GitHub]
2023年3月14日

用于自动生成植入物的点云扩散模型
保罗·弗里德里希、茱莉娅·沃尔莱布、弗洛伦丁·比德尔、弗洛里安·M·蒂林格、菲利普·C·卡廷
arXiv 2023。[论文]
2023年3月14日

让二维扩散模型了解三维一致性，以实现稳健的文本到三维生成
徐俊英、张宇锡、郭敏燮、高在勋、金贤洙、金俊浩、金晋和、李智英、金承龙
arXiv 2023。[论文] [GitHub]
2023年3月14日

GECCO：几何条件约束下的点扩散模型
米哈尔·J·蒂什基维奇、帕斯卡尔·富阿、爱德华·特鲁尔斯
arXiv 2023。[论文]
2023年3月10日

3DGen：用于带纹理网格生成的三平面潜在扩散模型
安奇特·古普塔、熊文翰、聂毅欣、伊恩·琼斯、巴拉斯·奥古兹
arXiv 2023。[论文]
2023年3月9日

人类运动扩散作为生成先验
约纳坦·沙菲尔、盖伊·特韦特、罗伊·卡蓬、阿米特·H·贝尔马诺
arXiv 2023。[论文]
2023年3月2日

我们能否将扩散概率模型用于三维运动预测？
安慧敏、埃斯特韦·瓦尔斯·马斯卡罗、李东辉
ICRA 2023。[论文] [项目] [GitHub]
2023年2月28日

DiffusioNeRF：用去噪扩散模型正则化神经辐射场
杰米·温恩、达尼亚尔·图尔穆罕贝托夫
CVPR 2023。[论文] [GitHub] [GitHub]
2023年2月23日

PC2：投影条件约束的点云扩散用于单张图像三维重建
卢克·梅拉斯-基里亚齐、克里斯蒂安·鲁普雷希特、安德烈亚·韦达尔迪
arXiv 2023。[论文] [项目]
2023年2月23日

NerfDiff：基于NeRF引导的3D感知扩散蒸馏的单图像视图合成
贾涛·顾、亚历克斯·特雷维西克、林凯恩、乔什·萨斯金德、克里斯蒂安·托巴尔特、刘凌杰、拉维·拉马穆尔蒂
ICML 2023。[论文] [GitHub]
2023年2月20日

SinMDM：单运动扩散模型
西加尔·拉布、因巴尔·莱博维奇、盖伊·特韦特、莫阿布·阿拉尔、阿米特·H·伯曼诺、丹尼尔·科恩-奥尔
arXiv 2023。[论文] [项目] [GitHub]
2023年2月12日

通过扩散从单张RGB图像重建3D彩色形状
李博、魏晓林、陈峰伟、刘斌
arXiv 2023。[论文]
2023年2月11日

HumanMAC：用于人体运动预测的掩码式运动补全
陈凌浩、张佳伟、李业文、庞一仁、夏小波、刘通梁
arXiv 2023。[论文] [项目] [GitHub]
2023年2月7日

TEXTure：文本引导的3D形状纹理化
埃拉德·理查森、加尔·梅策尔、尤瓦尔·阿拉卢夫、拉贾·吉里耶斯、丹尼尔·科恩-奥尔
arXiv 2023。[论文] [项目] [GitHub]
2023年2月3日

Zero3D：语义驱动的多类别3D形状生成
韩博、刘逸桐、沈奕轩
arXiv 2023。[论文]
2023年1月31日

神经小波域扩散用于3D形状生成、反演与操控
胡景宇、许嘉辉、刘正哲、李瑞辉、傅志威
SIGGRAPH ASIA 2023。[论文] [GitHub]
2023年2月1日

3DShape2VecSet：一种用于神经场和生成扩散模型的3D形状表示
张彪、唐家鹏、马蒂亚斯·尼斯纳、彼得·翁卡
SIGGRAPH 2023。[论文] [GitHub] [GitHub]
2023年1月26日

DiffMotion：基于去噪扩散模型的语音驱动手势合成
张帆、季娜叶、高福兴、李永平
arXiv 2023。[论文]
2023年1月24日

用于人类交互生成的二分图扩散模型
巴普蒂斯特·肖潘、唐浩、穆罕默德·达乌迪
arXiv 2023。[论文]
2023年1月24日

基于扩散的3D场景生成、优化与规划
黄思远、王赞、李普浩、贾宝雄、刘腾宇、朱怡欣、梁伟、朱松春
arXiv 2023。[论文] [项目] [GitHub]
2023年1月15日

Modiff：基于去噪扩散概率模型的动作条件3D运动生成
赵梦依、刘梦媛、任斌、戴淑玲、尼库·塞贝
arXiv 2023。[论文]
2023年1月10日

用于场景尺度3D分类数据的扩散概率模型
李柱民、严武彬、李世彬、尹成义
arXiv 2023。[论文] [GitHub]
2023年1月2日

Dream3D：利用3D形状先验和文本到图像扩散模型实现零样本文本到3D合成
徐佳乐、王新涛、程伟豪、曹燕佩、山英、齐晓虎、高盛华
CVPR 2023。[论文] [项目]
2022年12月28日

Point-E：一个可根据复杂提示生成3D点云的系统
亚历克斯·尼科尔、俊熙佑、普拉富拉·达里瓦尔、帕梅拉·米什金、马克·陈
arXiv 2022。[论文] [GitHub]
2022年12月16日

利用学习迁移实时渲染任意曲面几何体
西里孔达·达瓦尔、阿卡什·KT、P.J.纳拉亚南
ICVGIP 2022。[论文]
2022年12月19日

统一人体运动合成与风格迁移的去噪扩散概率模型
常子怡、埃德蒙·J.C. 芬德利、张浩正、许柏勋
arXiv 2022。[论文]
2022年12月16日

Rodin：一个使用扩散生成3D数字化身的生成模型
王腾飞、张博、张婷、顾书阳、鲍建敏、塔达斯·巴尔特鲁赛蒂斯、沈静静、陈东、温芳、陈启峰、郭百宁
arXiv 2022。[论文] [项目]
2022年12月12日

通过RGBD扩散模型进行增量视图修复的生成式场景合成
雷家宝、唐家鹏、贾奎
CVPR 2023。[论文] [项目] [GitHub]
2022年12月12日

通过自我头部姿态估计进行自我身体姿态估计
李佳满、C. 卡伦·刘、吴家俊
CVPR 2023。[论文]
2022年12月9日

MoFusion：基于去噪扩散的运动合成框架
里沙布·达布拉尔、穆罕默德·哈姆扎·穆加尔、弗拉季斯拉夫·戈利亚尼克、克里斯蒂安·托巴尔特
CVPR 2023。[论文] [项目]
2022年12月8日

SDFusion：多模态3D形状补全、重建与生成
郑彦驰、李欣颖、谢尔盖·图利亚科夫、亚历山大·施温格、桂良燕
CVPR 2023。[论文] [项目]
2022年12月8日

在潜在空间中通过运动扩散执行你的命令
陈鑫、蒋彪、刘文、黄子龙、付斌、陈涛、于静怡、于刚
CVPR 2023。[论文] [项目] [GitHub]
2022年12月8日

Magic：多艺术流派智能编舞数据集及3D舞蹈生成网络
李荣辉、赵俊凡、张雅超、苏明阳、任泽平、张涵、李秀
arXiv 2022。[论文]
2022年12月7日

NeRDi：以语言引导的扩散作为通用图像先验的单视角NeRF合成
邓聪悦、江致宇“Max”、查尔斯·R·齐、闫新晨、周音、莱昂尼达斯·圭巴斯、德拉戈米尔·安古洛夫
arXiv 2022。[论文]
2022年12月6日

Diffusion-SDF：基于体素化扩散的文本到形状生成
李木恒、段岳奇、周杰、陆继文
CVPR 2023。[论文] [GitHub]
2022年12月6日

用于统一人体运动合成的预训练扩散模型
马建新、白帅、周畅
arXiv 2022。[论文] [项目]
2022年12月6日

DiffuPose：基于去噪扩散概率模型的单目三维人体姿态估计
崔正俊、沈东锡、金H·珍
arXiv 2022。[论文]
2022年12月6日

PhysDiff：物理引导的人体运动扩散模型
袁晔、宋嘉明、伊克巴尔·乌马尔、瓦赫达特·阿拉什、考茨·扬
arXiv 2022。[论文] [项目]
2022年12月5日

利用直线流快速生成点云
吴乐萌、王迪林、龚成悦、刘兴超、熊云阳、兰詹·拉凯什、克里希纳穆尔蒂·拉古拉曼、钱德拉·维卡斯、刘强
arXiv 2022。[论文]
2022年12月4日

DiffRF：基于渲染引导的三维辐射场扩散
诺曼·穆勒、西迪基·亚瓦尔、波尔齐·洛伦佐、布洛·塞缪尔、孔施蒂德·彼得、尼瑟纳·马蒂亚斯
CVPR 2023。[论文] [项目]
2022年12月2日

3D-LDM：基于潜在扩散模型的神经隐式三维形状生成
南基民、哈利菲·玛丽姆、罗德里格斯·安德鲁、托诺·阿尔贝托、周林琪、格雷罗·保罗
arXiv 2022。[论文]
2022年12月1日

分数雅可比链：将预训练的二维扩散模型扩展至三维生成
王浩辰、杜晓丹、李家豪、叶雷蒙德·A、沙赫纳罗维奇·格雷格
CVPR 2023。[论文] [项目]
2022年12月1日

SparseFusion：为三维重建提炼视图条件扩散
周志卓、图尔西亚尼·舒巴姆
CVPR 2023。[论文] [项目] [GitHub]
2022年12月1日

使用三平面扩散生成三维神经场
舒厄·J·瑞安、陈埃里克·瑞安、波·瑞安、安克纳·扎卡里、吴佳俊、韦茨施泰因·戈登
arXiv 2022。[论文] [项目]
2022年11月30日

DiffPose：迈向更可靠的三维姿态估计
龚佳、耿福林、范志鹏、柯秋红、拉赫马尼·侯赛因、刘军
CVPR 2023。[论文] [GitHub]
2022年11月30日

DiffPose：利用扩散模型进行多假设人体姿态估计
霍尔姆奎斯特·卡尔、万特·巴斯蒂安
arXiv 2022。[论文] [GitHub]
2022年11月29日

DATID-3D：利用文本到图像扩散实现三维生成模型的多样性保持域适应
金光贤、春世英
CVPR 2023。[论文] [GitHub]
2022年11月29日

NeuralLift-360：将野外拍摄的二维照片提升为具有360°视角的三维物体
徐德佳、蒋一凡、王培浩、范志文、王毅、王张洋
arXiv 2022。[论文] [项目] [GitHub]
2022年11月29日

Ada3Diff：通过自适应扩散防御三维对抗性点云攻击
张奎、周航、张杰、黄启东、张伟明、余能海
arXiv 2022。[论文]
2022年11月29日

UDE：用于人体运动生成的统一驱动引擎
周子翔、王宝元
arXiv 2022。[论文] [项目] [GitHub]
2022年11月29日

3DDesigner：借助文本引导的扩散模型，实现逼真的三维物体生成与编辑
李刚、郑和亮、王超跃、李昌、郑昌文、陶大成
arXiv 2022。[论文]
2022年11月25日

DiffusionSDF：有符号距离函数的条件生成建模
周基因、巴哈特·尤瓦尔、海德·费利克斯
arXiv 2022。[论文] [GitHub]
2022年11月24日

用于三维形状生成的四面体扩散模型
卡利舍克·尼古拉伊、彼特斯·托本、韦格纳·扬·D、辛德勒·康拉德
arXiv 2022。[论文]
2022年11月23日

IC3D：基于图像条件的三维扩散用于形状生成
斯布罗利·克里斯蒂安、库德拉诺·保罗、弗罗西·马泰奥、马泰乌奇·马泰奥
arXiv 2022。[论文]
2022年11月20日

听，去噪，行动！基于扩散模型的音频驱动运动合成
亚历山德森·西蒙、纳吉·拉蒙德、贝斯科夫·乔纳斯、亨特·古斯塔夫·埃耶
arXiv 2022。[论文]
2022年11月17日

RenderDiffusion：用于三维重建、修复与生成的图像扩散
安丘凯维丘斯·提塔斯、许泽翔、费舍尔·马修、亨德森·保罗、比伦·哈坎、米特拉·尼洛伊·J、格雷罗·保罗
CVPR 2023。[论文] [GitHub]
2022年11月17日

用于形状引导的三维形状和纹理生成的潜在NeRF
梅策尔·加尔、理查德森·埃拉德、帕塔什尼克·奥尔、吉雷斯·拉贾、科恩-奥尔·丹尼尔
arXiv 2022。[论文] [GitHub]
2022年11月14日

ReFu：细化并融合未观测视图，实现细节保留的单张图像三维人体重建
沈圭敏、李敏洙、秋在国
ACM 2022。[论文]
2022年11月9日

StructDiffusion：以对象为中心的扩散技术，用于新型物体的语义重组
刘伟宇、赫尔曼斯·塔克、切尔诺娃·索尼娅、派克斯顿·克里斯
RSS 2023。[论文]
2022年11月8日

扩散运动：利用扩散模型生成文本引导的三维人体运动
任志远、潘志洪、周欣、康乐
ICASSP 2023。[论文]
2022年10月22日

LION：用于三维形状生成的潜在点扩散模型
曾晓辉、瓦赫达特·阿拉什、威廉姆斯·弗朗西斯、戈伊契奇·赞、利塔尼·奥尔、菲德勒·桑雅、克莱斯·卡斯滕
NeurIPS 2022。[论文] [项目]
2022年10月12日

用于随机运动预测的人体关节运动学扩散-精炼方法
董伟、孙怀江、李斌、陆建峰、李伟青、孙晓宁、胡胜祥
AAAI 2023。[论文]
2022年10月12日

一种基于扩散的通用方法，用于野外场景下的三维人体姿态预测
萨伊德·萨达特内贾德、阿里·拉塞赫、穆罕默德雷扎·莫法耶齐、亚萨敏·梅德加尔奇、萨拉·拉贾布扎德、泰勒·莫丹、亚历山大·阿拉希
ICRA 2023。[论文]
2022年10月11日

基于扩散模型的新视角合成
丹尼尔·沃森、威廉·陈、里卡多·马丁-布鲁亚、乔纳森·霍、安德烈亚·塔利亚萨基、穆罕默德·诺鲁齐
ICLR 2023。[论文]
2022年10月6日

神经体积网格生成器
郑燕、吴乐萌、刘兴超、陈震、刘强、黄启星
NeurIPS 2022研讨会。[论文]
2022年10月6日

用于风格化行走合成的去噪扩散概率模型
埃德蒙·J·C·芬德利、张浩正、常子怡、沈旭辉
ICLR 2023。[论文]
2022年9月29日

人体运动扩散模型
盖伊·特韦特、西格尔·拉阿布、布莱恩·戈登、约纳坦·沙菲尔、阿米特·H·伯曼诺、丹尼尔·科恩-奥尔
arXiv 2022。[论文] [项目]
2022年9月29日

ISS：以图像为跳板的文本引导三维形状生成
刘正哲、戴鹏、李瑞辉、齐小娟、傅志文
ICLR 2023。[论文] [GitHub]
2022年9月9日

SE(3)-DiffusionFields：通过扩散学习联合抓取与运动优化的成本函数
朱伦·乌赖恩、尼克拉斯·冯克、乔治娅·查尔瓦察基、扬·彼得斯
arXiv 2022。[论文] [GitHub]
2022年9月8日

首次命中扩散模型用于生成流形、图及类别型数据
叶茂、吴乐萌、刘强
NeruIPS 2022。[论文]
2022年9月2日

FLAME：自由形式的语言驱动运动合成与编辑
金智勋、金志燮、崔成俊
AAAI 2023。[论文]
2022年9月1日

让我们架起桥梁：理解与扩展扩散生成模型
刘兴超、吴乐萌、叶茂、刘强
NeurIPS 2022研讨会。[论文]
2022年8月31日

MotionDiffuse：基于扩散模型的文本驱动人体运动生成
张明远、蔡中刚、潘亮、洪方舟、郭欣颖、杨磊、刘子威
arXiv 2022。[论文] [项目]
2022年8月31日

一种扩散模型可从二维显微镜图像预测三维形状
多米尼克·J·E·韦贝尔、恩斯特·罗埃尔、巴斯蒂安·里克、拉贾·吉里耶斯、卡斯滕·马尔
arXiv 2022。[论文]
2022年8月30日

PointDP：基于扩散的净化技术，抵御针对三维点云识别的对抗攻击
孙嘉晨、聂伟力、于志定、Z·莫利·毛、肖朝伟
arXiv 2022。[论文]
2022年8月21日

用于三维点云补全的条件点扩散-精炼范式
吕兆阳、孔志峰、徐旭东、潘亮、林大华
ICLR 2022。[论文] [GitHub]
2021年12月7日

基于分数的点云去噪
罗世通、胡伟
ICCV 2021。[论文] [GitHub]
2021年7月23日

DiffuStereo：利用稀疏相机进行基于扩散的立体视觉实现高质量人体重建
邵睿智、郑泽荣、张宏文、孙景翔、刘业彬
ECCV 2022。[论文] [项目] [GitHub]
2022年7月16日

通过点-体素扩散进行三维形状生成与补全
周林琪、杜一伦、吴家俊
ICCV 2021。[论文] [项目]
2021年4月8日

用于三维点云生成的扩散概率模型
罗世通、胡伟
CVPR 2021。[论文] [GitHub]
2021年3月2日

对抗攻击

生成分布就是针对生成模型的成员推理攻击所需的一切
Minxing Zhang、Ning Yu、Rui Wen、Michael Backes、Yang Zhang
arXiv 2023年。[论文]
2023年10月30日

对抗样本并非真实特征
Ang Li、Yifei Wang、Yiwen Guo、Yisen Wang
NeurIPS 2023。[论文]
2023年10月29日

Purify++：通过先进扩散模型与随机性控制提升扩散净化效果
Boya Zhang、Weijian Luo、Zhihua Zhang
arXiv 2023年。[论文]
2023年10月28日

基于能量模型的异常检测：流形扩散恢复方法
Sangwoong Yoon、Young-Uk Jin、Yung-Kyun Noh、Frank C. Park
arXiv 2023年。[论文]
2023年10月28日

在缺乏标注验证数据的情况下异常检测器的模型选择
Clement Fung、Chen Qiu、Aodong Li、Maja Rudolph
arXiv 2023年。[论文]
2023年10月16日

利用条件扩散模型增强对深度神经网络的黑盒攻击
Renyang Liu、Wei Zhou、Tianwei Zhang、Kangjie Chen、Jun Zhao、Kwok-Yan Lam
arXiv 2023年。[论文]
2023年10月11日

利用概率流ODE探究密度估计的对抗鲁棒性
Marius Arvinte、Cory Cornelius、Jason Martin、Nageen Himayat
arXiv 2023年。[论文]
2023年10月10日

理解并改进针对潜在扩散模型的对抗攻击
Boyang Zheng、Chumeng Liang、Xiaoyu Wu、Yan Liu
arXiv 2023年。[论文]
2023年10月7日

基于扩散模型的语义对抗攻击
Chenan Wang、Jinhao Duan、Chaowei Xiao、Edward Kim、Matthew Stamm、Kaidi Xu
arXiv 2023年。[论文]
2023年9月14日

“无处不在地抓住你”：通过概念水印保护文本反转技术
Weitao Feng、Jiyan He、Jie Zhang、Tianwei Zhang、Wenbo Zhou、Weiming Zhang、Nenghai Yu
arXiv 2023年。[论文]
2023年9月12日

Diff-Privacy：基于扩散模型的人脸隐私保护
Xiao He、Mingrui Zhu、Dongxin Chen、Nannan Wang、Xinbo Gao
arXiv 2023年。[论文]
2023年9月11日

DiffDefense：利用扩散模型防御对抗攻击
Hondamunige Prasanna Silva、Lorenzo Seidenari、Alberto Del Bimbo
arXiv 2023年。[论文] [GitHub]
2023年9月7日

“我的艺术，我的选择”：抵御失控AI的对抗防护
Anthony Rhodes、Ram Bhagat、Umur Aybars Ciftci、Ilke Demir
arXiv 2023年。[论文]
2023年9月6日

通过对抗修复同时提升人脸识别对抗攻击的视觉质量和迁移性
Fengfan Zhou
arXiv 2023年。[论文]
2023年9月4日

扩散模型的有趣特性：用于评估文生图生成模型自然攻击能力的大规模数据集
Takami Sato、Justin Yue、Nanze Chen、Ningfei Wang、Qi Alfred Chen
arXiv 2023年。[论文]
2023年8月30日

DiffSmooth：基于扩散模型与局部平滑的可认证鲁棒学习
Jiawei Zhang、Zhongzhu Chen、Huan Zhang、Chaowei Xiao、Bo Li
USENIX Security 2023。[论文]
2023年8月28日

基于概率波动的扩散模型成员推理攻击
Wenjie Fu、Huandong Wang、Chen Gao、Guanghua Liu、Yong Li、Tao Jiang
arXiv 2023年。[论文]
2023年8月23日

针对扩散模型的白盒成员推理攻击
Yan Pang、Tianhao Wang、Xuhui Kang、Mengdi Huai、Yang Zhang
arXiv 2023年。[论文]
2023年8月11日

BAGM：一种操纵文生图生成模型的后门攻击
Jordan Vice、Naveed Akhtar、Richard Hartley、Ajmal Mian
arXiv 2023年。[论文] [GitHub] [[数据集](https://ieee-datapo

Awesome-Diffusion-Models 快速上手指南

Awesome-Diffusion-Models 并非一个单一的可安装软件包，而是一个精选的扩散模型（Diffusion Models）资源集合库，涵盖了论文、教程、代码实现和应用案例。本指南将帮助你利用该仓库中的资源，快速搭建环境并运行基础的扩散模型示例。

环境准备

在开始之前，请确保你的开发环境满足以下要求：

操作系统: Linux (推荐), macOS, 或 Windows (需配置 WSL2 以获得最佳 GPU 支持)。
硬件: 推荐使用配备 NVIDIA GPU 的机器（显存建议 8GB 以上，运行 Stable Diffusion 等大模型建议 12GB+）。
Python: 版本 3.8 或更高。
前置依赖:
- git: 用于克隆仓库。
- pip 或 conda: 用于管理 Python 包。
- CUDA 和 cuDNN: 如需使用 GPU 加速，请预先安装与 PyTorch 版本匹配的驱动。

安装步骤

由于本仓库是资源列表，你需要先克隆仓库以获取教程代码，然后选择一个具体的教程项目进行环境配置。以下以仓库中推荐的 Hugging Face Diffusers 和 从零训练 (Train from Scratch) 为例。

1. 克隆资源仓库

首先获取 Awesome-Diffusion-Models 仓库，以便查阅最新的论文和教程链接：

git clone https://github.com/hee9joon/Awesome-Diffusion-Models.git
cd Awesome-Diffusion-Models

2. 创建虚拟环境

建议使用 Conda 创建独立的虚拟环境：

conda create -n diffusion-env python=3.9
conda activate diffusion-env

3. 安装核心依赖

根据仓库中 "Tutorial and Jupyter Notebook" 部分的主流方案，安装 PyTorch 和 Diffusers 库。 (注：国内用户可使用清华源或阿里源加速下载)

# 安装 PyTorch (以 CUDA 11.8 为例，其他版本请访问 pytorch.org 查询)
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

# 安装 Hugging Face Diffusers 及相关依赖
pip install diffusers transformers accelerate scipy safetensors

若你想尝试仓库中提到的 "DiffusionFastForward" (从零开始训练)，请克隆其对应仓库并安装依赖：

git clone https://github.com/mikonvergence/DiffusionFastForward.git
cd DiffusionFastForward
pip install -r requirements.txt

基本使用

以下提供两个最简单的入门示例，分别对应“调用预训练模型生成图像”和“运行基础教程代码”。

示例一：使用 Hugging Face Diffusers 生成图像

这是最快体验扩散模型的方式，基于仓库中推荐的 Diffusers - Hugging Face 笔记本内容。

from diffusers import StableDiffusionPipeline
import torch

# 加载预训练的 Stable Diffusion 模型
# 国内网络若连接缓慢，可考虑配置 HF_ENDPOINT 环境变量使用镜像
pipe = StableDiffusionPipeline.from_pretrained(
    "runwayml/stable-diffusion-v1-5", 
    torch_dtype=torch.float16
)

# 将模型移至 GPU
pipe = pipe.to("cuda")

# 定义提示词并生成图像
prompt = "a photo of an astronaut riding a horse on mars"
image = pipe(prompt).images[0]  

# 保存结果
image.save("astronaut_rides_horse.png")
print("Image generated successfully!")

示例二：运行从零训练教程 (基于 DiffusionFastForward)

如果你想深入理解原理，可以运行仓库中推荐的 DiffusionFastForward 教程中的简化训练脚本。

# 进入教程目录
cd ../DiffusionFastForward

# 运行简单的 Colab/本地训练脚本 (具体文件名请参考该仓库 notebook 章节)
# 以下为一个典型的启动命令示例，具体参数需参考该项目的 README
python train.py --config configs/default_config.yaml --epochs 10

提示：更多具体的 Jupyter Notebook 示例（如 Disco Diffusion, Deforum 等）可直接在 Google Colab 中打开仓库 Resources 章节提供的链接一键运行，无需本地配置复杂环境。

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

★ 349.3k|★★★☆☆|2周前

Agent开发框架图像

n8n

n8n 是一款面向技术团队的公平代码（fair-code）工作流自动化平台，旨在让用户在享受低代码快速构建便利的同时，保留编写自定义代码的灵活性。它主要解决了传统自动化工具要么过于封闭难以扩展、要么完全依赖手写代码效率低下的痛点，帮助用户轻松连接 400 多种应用与服务，实现复杂业务流程的自动化。 n8n 特别适合开发者、工程师以及具备一定技术背景的业务人员使用。其核心亮点在于“按需编码”：既可以通过直观的可视化界面拖拽节点搭建流程，也能随时插入 JavaScript 或 Python 代码、调用 npm 包来处理复杂逻辑。此外，n8n 原生集成了基于 LangChain 的 AI 能力，支持用户利用自有数据和模型构建智能体工作流。在部署方面，n8n 提供极高的自由度，支持完全自托管以保障数据隐私和控制权，也提供云端服务选项。凭借活跃的社区生态和数百个现成模板，n8n 让构建强大且可控的自动化系统变得简单高效。

★ 184.7k|★★☆☆☆|今天

数据工具开发框架Agent

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|2周前

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 161.1k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 109.2k|★★☆☆☆|昨天

开发框架图像Agent

gemini-cli

gemini-cli 是一款由谷歌推出的开源 AI 命令行工具，它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言，它提供了一条从输入提示词到获取模型响应的最短路径，无需切换窗口即可享受智能辅助。这款工具主要解决了开发过程中频繁上下文切换的痛点，让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用，还是执行复杂的 Git 操作，gemini-cli 都能通过自然语言指令高效处理。它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口，具备出色的逻辑推理能力；内置 Google 搜索、文件操作及 Shell 命令执行等实用工具；更独特的是，它支持 MCP（模型上下文协议），允许用户灵活扩展自定义集成，连接如图像生成等外部能力。此外，个人谷歌账号即可享受免费的额度支持，且项目基于 Apache 2.0 协议完全开源，是提升终端工作效率的理想助手。

★ 100.8k|★★☆☆☆|1周前

插件Agent图像