papers_for_protein_design_using_DL

1.9k 216 非常简单 2 次阅读昨天GPL-3.0开发框架

AI 解读由 AI 自动生成，仅供参考

papers_for_protein_design_using_DL 是一个专注于“利用深度学习进行蛋白质设计”领域的开源论文清单库。它旨在解决该交叉学科领域文献爆炸式增长、研究者难以快速追踪最新前沿成果的痛点，为社区提供了一个系统化、持续更新的知识导航平台。

该资源特别适合计算生物学研究人员、AI 算法开发者以及从事新药或新材料设计的科学家使用。无论是需要调研抗体、酶、结合肽等特定方向的设计方法，还是寻找基准数据集与评测标准，用户都能在此找到分类清晰的学术指引。其独特亮点在于不仅涵盖了从序列到结构、从功能到骨架等多种设计范式的经典与最新论文，还紧密跟进每周发表的顶刊成果与预印本（如 2026 年最新的 AAV 衣壳设计、组合变异基准平台等），并关联了相关的代码仓库与技术报告。此外，项目倡导负责任的 AI 生物设计理念，部分论文还配有中文知乎专栏的深度笔记，极大地降低了跨学科学习门槛，是进入智能蛋白质设计领域的理想入门工具。

使用场景

某生物制药公司的 AI 研发团队正致力于利用深度学习技术，从头设计一种能特异性结合无序蛋白的新型抗体药物，急需追踪该领域的最新算法突破。

没有 papers_for_protein_design_using_DL 时

文献检索大海捞针：研究人员需在 PubMed、arXiv 和 GitHub 等多个平台手动搜索关键词，极易遗漏如"Reinforcement-guided generative protein language models"等跨学科的最新预印本。
代码复现门槛高：找到论文后，往往难以快速定位对应的开源代码仓库或基准测试平台（如 CombinGym），导致验证新算法的时间成本高达数周。
领域视野受限：缺乏系统性的分类整理，团队难以全面掌握从“序列数据集”到“酶设计”等细分方向的全貌，容易陷入局部技术盲区。
前沿动态滞后：无法及时获取像"Latent-Y"这样经过实验室验证的自主智能体报告，导致研发路线可能落后于社区最新进展。

使用 papers_for_protein_design_using_DL 后

一站式精准获取：团队直接在该库中查阅按“抗体设计”、“结合物设计”分类的更新列表，瞬间锁定上周发布的关于无序蛋白结合物设计的前沿综述。
资源链接直达：每篇论文旁均附带官方代码、补充材料甚至在线演示网站链接，研究人员可立即克隆"genAAV"等项目的代码进行微调实验。
知识体系结构化：借助清晰的目录导航，团队迅速梳理出从“功能到结构”再到“序列”的各种设计范式，明确了技术选型的最佳路径。
同步社区脉搏：通过每周更新的列表，团队第一时间掌握了商业化技术报告和高影响力基准测试，确保研发策略始终处于行业最前沿。

papers_for_protein_design_using_DL 将原本分散且耗时的文献调研工作转化为高效的战略情报获取，显著加速了蛋白质药物从概念验证到实验设计的转化周期。

运行环境要求

GPU

未说明

内存

未说明

依赖

notes该仓库是一个关于“使用深度学习进行蛋白质设计”的论文列表和资源索引，并非一个可执行的软件工具或代码库。因此，它没有特定的操作系统、GPU、内存、Python 版本或依赖库要求。用户仅需浏览器即可访问其中的链接，或根据列表中引用的具体论文对应的独立代码仓库去配置相应的运行环境。

python未说明

papers_for_protein_design_using_DL hero image

快速开始

基于深度学习的蛋白质设计论文列表

本仓库受杨凯创及其杰出项目Machine-learning-for-proteins的启发而创建。我们建立此仓库，旨在为蛋白质设计中的深度学习这一快速发展的计算生物学领域，提供一个专业且聚焦的平台。

欢迎大家贡献内容和提出建议！蛋白质设计人工智能负责任发展的社区价值观、指导原则及承诺：详情

上周论文更新于2026年3月28日：

固有无序蛋白结合蛋白设计的前沿与挑战
- [Current Opinion in Structural Biology]
强化学习引导的生成式蛋白质语言模型实现高度多样化的AAV衣壳从头设计
- [arXiv:2603.19473] • [代码]
CombinGym：用于机器学习辅助组合型蛋白质变体设计的基准测试平台
- [bioRxiv 2026.03.24.714074] • [代码] • [补充材料] • [官网]
Latent-Y：经实验室验证的自主药物从头设计智能体
- [技术报告] • [官网] • 商业用途

deep learning for protein design

0) Benchmarks and datasets
序列数据集/基准测试 • 结构数据集/基准测试 • 公共数据库 • 相似列表 • 指南
1) 评论与综述
从头设计 • 抗体设计 • 肽设计 • 结合蛋白设计 • 酶设计
2) 基于模型的设计
基于结构预测的模型 • CM-Align • 基于MSA的Transformer • 基于LLM • 采样算法
3) 功能到支架
基于GAN • 基于自编码器 • 基于MLP • 基于扩散 • 基于强化学习 • 基于流模型 • 基于评分模型 • 自回归
4) 支架到序列
综述 • 基于MLP • 基于VAE • 基于LSTM • 基于CNN • 基于GNN • 基于GAN • 基于Transformer • 基于ResNet • 基于扩散 • 贝叶斯方法 • 基于流模型 • 基于强化学习 • 训练方法
5) 功能到序列
基于CNN • 基于VAE • 基于GAN • 基于Transformer • 贝叶斯方法 • 强化学习 • 基于流模型 • 基于RNN • 基于LSTM • 自回归模型 • 基于玻尔兹曼机 • 基于扩散 • 基于GNN • 基于评分模型
6) 功能到结构
综述 • 基于LSTM • 基于扩散 • 基于RoseTTAFold • 基于CNN • 基于GNN • 基于Transformer • 基于MLP • 基于流模型 • 基于AlphaFold
7) 其他
突变效应与适应度景观 • 蛋白质语言模型与表征学习 • 分子设计模型 • 未分类

0. 基准测试和数据集

0.1 序列数据集、基准测试

FLIP：用于蛋白质适应度景观推断的基准任务 Christian Dallago、Jody Mou、Kadina E Johnston、Bruce Wittmann、Nick Bhattacharya、Samuel Goldman、Ali Madani、Kevin K Yang NeurIPS 2021 数据集与基准测试赛道/bioRxiv 2021 • 网站 • 代码 • 补充材料

评估蛋白质设计中结构到序列模型的基准框架 Jeffrey Chan、Seyone Chithrananda、David Brookes、Sam Sinai 该论文未在2022年结构生物学中的机器学习研讨会上发表。

PDBench：评估蛋白质序列设计的计算方法 Leonardo V Castorina、Rokas Petrenas、Kartic Subr、Christopher W Wood Bioinformatics, 2023;, btad027 • 代码

针对多样化抗体序列设计的深度生成模型基准测试 Igor Melnyk、Payel Das、Vijil Chenthamarakshan、Aurelie Lozano arXiv:2111.06801

蛋白质工程锦标赛：蛋白质建模与设计的开放科学基准 Chase Armer、Hassan Kane、Dana Cortade、Dave Estell、Adil Yusuf、Radhakrishna Sanka、Henning Redestig、TJ Brunette、Pete Kelly、Erika DeBenedictis arXiv:2309.09955

神经网络生成的酶的计算评分与实验评估 Sean R.Johnson、Xiaozhi Fu、Sandra Viknander、Clara Goldin、Sarah Monaco、Aleksej Zelezniak、Kevin K. Yang bioRxiv (2023) • 代码

FLOP：用于蛋白质野生型适应度景观的任务 彼得·莫尔奇·格罗特、理查德·迈克尔、耶斯珀·萨洛蒙、田鹏飞、沃特·布姆斯马 bioRxiv 2023.06.21.545880 • 代码

ProteinGym：蛋白质设计与适应度预测的大规模基准测试 帕斯卡尔·诺丁、亚伦·W·科拉施、丹尼尔·里特、卢德·范·尼凯克、施特法妮·保罗、汉森·斯皮纳、内森·罗林斯、艾达·肖、鲁本·魏茨曼、乔纳森·弗雷泽、马法尔达·迪亚斯、丁科·弗朗切斯基、罗斯·奥伦布赫、亚林·加尔、黛博拉·S·马克斯 bioRxiv 2023.12.07.570727 • 代码

蛋白质工程锦标赛结果：蛋白质建模与设计的开放科学基准测试 蔡斯·阿默、哈桑·卡内、达娜·L·科塔德、亨宁·雷德斯蒂格、大卫·A·埃斯特尔、阿迪尔·优素福、内森·罗林斯、汉森·斯皮纳、黛博拉·马克斯、TJ·布鲁内特、彼得·J·凯利、艾丽卡·德贝内迪克蒂斯 bioRxiv 2024.08.12.606135/Proteins: Structure, Function, and Bioinformatics (2025) • 代码 • 补充材料

用于蛋白质支架填充问题的生成式AI模型 乐图青格、库沙尔·巴达尔、理查德·安南、乔丹·斯特茨、刘晓文和宾海·朱计算生物学杂志

抗体CDR序列设计的逆折叠模型基准测试 佩尔·朱尼尔·格赖森、李一凡、郎宇翔、徐晨睿、周毅、庞子威 bioRxiv 2024.12.16.628614

自监督机器学习方法用于蛋白质设计可改善采样效率，但无法提升高适应度变体的识别能力 莫里茨·埃尔特尔、罗科·莫雷蒂、延斯·迈勒和克拉拉·T·舍德尔 Science Advances 11.7 (2025) • 代码

众包蛋白质设计：来自Adaptyv EGFR结合剂竞赛的经验教训 图多尔-斯特凡·科泰特、伊戈尔·克拉夫丘克、菲利波·斯托科、诺埃利亚·费鲁兹、安东尼·吉特、小室洋一、卢卡斯·德·阿尔梅达·马查多、弗朗切斯科·帕埃萨尼、西安娜·N·卡利亚、钱斯·A·查拉科姆布、尼基尔·哈斯、艾哈迈德·卡马尔、布鲁诺·E·科雷亚、马丁·帕塞萨、伦纳特·尼克尔、卡蒂克·苏布、莱昂纳多·V·卡斯托里纳、麦克斯韦尔·J·坎贝尔、康斯坦斯·费拉古、帕特里克·基德格、洛根·哈利、克里斯托弗·W·伍德、迈克尔·J·斯塔姆、塔达斯·克卢尼斯、苏莱曼·梅尔特·乌纳尔、埃利安·贝洛特、亚历山大·纳卡以及Adaptyv竞赛组织者 bioRxiv 2025.04.17.648362 • GitHub

利用安全生物代理对AI驱动蛋白质设计风险的实验评估 斯维特兰娜·P·伊科诺莫娃、布鲁斯·J·维特曼、费尔南达·皮奥里诺、大卫·J·罗斯、塞缪尔·W·沙夫特、奥尔加·瓦西里耶娃、埃里克·霍维茨、詹姆斯·迪甘斯、伊丽莎白·A·斯特里查尔斯基、盛琳·林-吉布森、杰弗里·J·塔贡 bioRxiv 2025.05.15.654077 • 代码

抗体结合亲和力成熟与设计的基准测试 辛燕·赵、易清·唐、阿克希塔·辛格、维克多·J·坎图、关浩·安、俊锡·李、亚当·E·斯托格斯迪尔、阿什温·库马尔·拉梅什、志强·安、晓倩·蒋、艺珍·金 arXiv:2506.04235 • 数据集 • 代码

戴霍夫图谱：扩展序列多样性以提升蛋白质生成质量 凯文·K·杨、萨拉·阿拉姆达里、亚历克斯·J·李、凯莉·凯马克-洛夫莱斯、萨米尔·查尔、加里克·布里克西、卡尔斯·多明戈-恩里奇、陈通·王、苏悦·吕、尼科洛·富西、尼尔·滕嫩霍尔茨、艾娃·P·阿米尼 bioRxiv 2025.07.21.665991 • 代码 • 数据集

一致的合成序列解锁全原子从头蛋白质设计中的结构多样性 丹尼·赖登巴赫、钟林·曹、左白·张、基兰·迪迪、托马斯·格夫纳、郭庆·周、建·唐、克里斯蒂安·达拉戈、阿拉什·瓦赫达特、埃米内·库楚克本利、卡斯滕·克莱斯 arXiv:2512.01976

生成式AI蛋白质模型的基准测试揭示了基于结构与基于序列方法之间的差异 亚历山大·J·巴内特、拉真德拉·KC、普拉蒂克夏·潘黛、帕莫达·索马西里、克尔斯滕·A·费尔法克斯、桑迪·洪、亚历克斯·W·休伊特基因组学、蛋白质组学与生物信息学（2026）

AFD-INSTRUCTION：包含功能注释的全面抗体指令数据集，用于基于LLM的理解与设计 凌·罗、文斌·江、洪远·昌、欣康·王、旭时·张、月婷·熊、孟莎·童、荣山·于 arXiv:2602.04916 • 代码 • 数据集 • 网站

0.2 结构数据集、基准测试

AlphaDesign：一种基于图的蛋白质设计方法及在AlphaFoldDB上的基准测试 高章阳、谭成、Stan Z. Li arXiv (2022)

SidechainNet：用于机器学习的全原子蛋白质结构数据集 乔纳森·E·金、大卫·瑞安·科斯 arXiv • GitHub::sidechainnet

TDC 维护着一个资源列表，目前包含22项与小分子和大分子相关的任务（及其数据集），包括PPI、DDI等。MoleculeNet 四年前发布了一个与小分子相关的基准测试。

在数据集和基准测试方面，蛋白质设计远不如药物发现成熟（paperwithcode药物发现基准测试）。（或许可以增加对蛋白质设计中深度学习方法（尤其是深度生成模型）的评估）困难与机遇总是并存。很高兴看到克里斯蒂安·达拉戈、乔迪·穆、卡迪娜·E·约翰斯顿、布鲁斯·J·维特曼、尼古拉斯·巴塔查里亚、塞缪尔·戈德曼、阿里·马达尼、凯文·K·杨以及高章阳、谭成、Stan Z. Li的工作。

小型蛋白质折叠结构与序列空间的采样 托马斯·W·林斯基、凯尔·诺布尔、奥特姆·R·托宾、瑞秋·克劳、劳伦·卡特、杰弗里·L·乌尔鲍尔、大卫·贝克和伊娃-玛丽亚·施特劳赫 Nat Commun 13, 7151 (2022) • 代码 • 补充材料

OpenProteinSet：面向大规模结构生物学的训练数据集 古斯塔夫·阿德里茨、纳齐姆·布阿塔、萨钦·卡迪安、卢卡斯·雅罗施、丹尼尔·贝伦贝格、伊恩·菲斯克、安德鲁·M·沃特金斯、斯蒂芬·拉、理查德·邦诺、穆罕默德·阿尔库赖希 arXiv:2308.05326 • OpenFold

ProteinInvBench：针对多样化任务、模型和指标的蛋白质设计基准测试 高张洋、谭成、张一杰、陈星然、李斯坦 Z. GitHub

PDB-Struct：基于结构的蛋白质设计综合基准测试 王传锐、钟博泽涛、张佐白、纳伦德拉·乔杜里、桑奇特·米斯拉、唐健 arXiv 预印本 arXiv:2312.00080 (2023) • 代码

Scaffold-Lab：统一框架下对蛋白质骨架生成方法的批判性评估与排名 郑卓奇、张博、钟博泽涛、刘可欣、于金宇、李正新、朱俊杰、魏婷、陈海峰 bioRxiv 2024.02.10.579743 • 代码 • 补充材料

抗体 DomainBed：治疗性蛋白质设计中的分布外泛化能力 娜塔莎·塔加索夫斯卡、朴智源、马蒂厄·基尔希迈耶、内森·C·弗雷、安德鲁·马丁·沃特金斯、阿亚·阿卜杜勒萨拉姆·伊斯梅尔、阿里安·罗库姆·贾马斯布、埃迪丝·李、泰勒·布莱森、斯蒂芬·拉、丘京贤 arXiv:2407.21028 • 代码 • 数据集

大型蛋白质数据库揭示结构互补性与功能局部性 帕韦乌·什切尔比亚克、卢卡什·希德洛夫斯基、维托尔德·维尔德曼斯基、P·道格拉斯·伦弗鲁、朱莉娅·科勒·莱曼、托马什·科西奥莱克 bioRxiv 2024.08.14.607935 • 代码 • 补充材料 • 网站

蛋白质设计档案（PDA）：40年蛋白质设计的洞见 玛尔塔·克罗诺夫斯卡、迈克尔·J·斯塔姆、德里克·N·伍尔夫森、路易吉·F·迪·康斯坦佐、克里斯托弗·W·伍德 bioRxiv 2024.09.05.611465/Nat Biotechnol (2025) • 代码 • 补充材料 • 网站

ProteinBench：蛋白质基础模型的全面评估 叶飞、郑在祥、薛东宇、沈雨宁、王立浩、马一鸣、王燕、王鑫友、周向新、顾全全 arXiv:2409.06744 • 代码

抗体设计生成模型的基准测试及利用对数似然进行序列排序的探索 塔利普·乌恰尔、塞德里克·马尔贝尔、费兰·冈萨雷斯 bioRxiv 2024.10.07.617023 • 代码

迈向稳健的蛋白质生成模型评估：指标的系统性分析 帕维尔·斯特拉什诺夫、安德烈·谢夫佐夫、维亚切斯拉夫·梅什恰尼诺夫、玛丽亚·伊万诺娃、费多尔·尼古拉耶夫、奥尔加·卡尔迪蒙、德米特里·韦特罗夫 bioRxiv 2024.10.25.620213

MotifBench：用于基序支架问题的标准化蛋白质设计基准测试 郑卓奇、张博、基兰·迪迪、杨凯文 K.、尹杰森、约瑟夫 L. 沃森、陈海峰、特里普 Brian L. arXiv:2502.12479 • 代码

生成式 AI 蛋白质模型的系统比较揭示了结构与序列基础方法之间的根本差异 亚历山大 J·巴内特、KC 拉真德拉、普拉提克夏·潘黛、帕莫达·索马西里、克尔斯滕 A·费尔法克斯、桑迪·洪、亚历克斯 W·休伊特 bioRxiv 2025.03.23.644844 • 代码 • 补充材料

构象特异性设计：一种新的基准测试与算法，应用于工程化组成型活性 MAP 激酶 雅各布 A·斯特恩、西巴·阿尔哈尔比、阿南苏基尔蒂·桑德霍卢、斯特凡 T·阿罗尔德、丹尼斯·德拉科尔特 bioRxiv 2025.04.23.650138 • 代码 • 数据集

PRIDE-新型蛋白质结构设计基准数据集 曹汉群、dchenhe github

蛋白质 FID：改进的蛋白质结构生成模型评估方法 费利克斯·法尔廷斯、汉内斯·斯塔克、汤米·雅科拉、雷吉娜·巴尔齐莱 arXiv:2505.08041

PDFBench：从功能出发的从头蛋白质设计基准测试 匡嘉豪、刘诺伟、孙昌志、季涛、吴元彬 arXiv:2505.20346 • 网站 • 代码

一种用于预测具有多样几何形状的从头设计蛋白质的改进模型 本杰明·奥尔、斯蒂芬妮 E·克里利、代尼兹·阿克皮纳罗格鲁、埃莉诺·朱、迈克尔 J·凯瑟、坦雅·科尔特梅 bioRxiv 2025.06.02.657515

蛋白质 SE(3)：基于 SE(3) 的蛋白质结构生成模型基准测试 于朗、高张洋、谭成、秦晨、周杰、何亮 arXiv:2507.20243

评估 AlphaFold、ESMFold 和 ProteinMPNN 对蛋白质设计成功与否的零样本预测能力 马里奥·加西亚、加布里埃尔·雅各布·罗克林、苏吉扬·迪克西特 bioRxiv 2025.07.29.667290

从头设计结合物的实验成功率预测：对3,766个经实验表征的结合物的荟萃分析
马克斯·丹尼尔·奥韦拉特、安德烈亚斯·雷加德、克里斯蒂安·佩德尔·雅各布森、瓦伦塔斯·布拉萨斯、奥利弗·莫雷尔、皮耶特罗·索尔曼尼、蒂莫西·帕特里克·詹金斯
bioRxiv 2025.08.14.670059 • 数据集

用于从头蛋白质设计的重折叠流程的局限性
凯伦·T·科尔贝尔德、弗谢沃洛德·维柳加、马克西米利安·J.L.J. 弗斯特
bioRxiv 2025.12.09.693122 • 补充材料 • 数据

针对G蛋白偶联受体的生成式从头肽设计方法评估
汉内斯·容克、克拉拉·T·舍德尔
bioRxiv 2026.02.26.708415

0.3 数据库

推荐的蛋白质数据库列表，更多列表请参见中国国家生物信息中心。

0.3.1 序列数据库

0.3.2 结构数据库

数据库	描述
PDB	蛋白质数据库（PDB）是一个包含大型生物分子（如蛋白质和核酸）三维结构数据的数据库。这些数据通过X射线晶体学、核磁共振波谱学或冷冻电子显微镜等实验方法获得。
AlphaFoldDB	AlphaFoldDB是由DeepMind的AlphaFold系统生成的蛋白质结构预测数据库。它提供了高度准确的蛋白质三维结构预测结果。
PDBbind	PDBbind是PDB数据库中所有类型生物分子复合物结合数据的综合汇编，主要用于开发和验证预测分子相互作用的计算方法。
AB-Bind	AB-Bind是一个抗体结合亲和力数据的数据库，提供经过精心整理的实验结合数据及相应的抗体-蛋白质复合物结构。
AntigenDB	AntigenDB是一个手动 curated 的实验验证抗原数据库，包含关于抗原、来源生物体以及相关抗体的详细信息。
CAMEO	CAMEO（连续自动化模型评估）是一个用于自动评估大分子结构预测方法的项目，持续对自动化蛋白质结构预测服务器的性能进行评估。
CAPRI	蛋白质-蛋白质相互作用预测的关键评估（CAPRI）是一项面向整个社区的实验，旨在评估蛋白质-蛋白质相互作用预测方法。
PIFACE	PIFACE是一个用于预测蛋白质-蛋白质相互作用的网络服务器，能够识别蛋白质表面潜在的相互作用界面。
SAbDab	结构抗体数据库（SAbDab）是一个自动更新的资源，提供来自PDB的抗体结构信息。它允许用户方便地访问经过整理、注释和分类的抗体结构。
SKEMPI v2.0	SKEMPI 2.0是一个包含蛋白质-蛋白质复合物中突变引起的结合自由能变化的实验测量值的数据库。
ProtCAD	ProtCAD是一套用于设计和工程化新型蛋白质结构、序列和功能的工具。它允许用户构建和操作复杂的蛋白质结构，生成和评估序列文库，并模拟突变效应。ProtCAD是一套用于设计和工程化新型蛋白质结构、序列和功能的工具。它允许用户构建和操作复杂的蛋白质结构，生成和评估序列文库，并模拟突变效应。
Proteinbase	蛋白质设计数据的家园。由adaptyvbio打造的一个开放平台，用于分享蛋白质设计、其实验验证及其设计方法。

0.4 相似列表

一些包含使用深度学习进行蛋白质设计相关论文的相似 GitHub 列表：

0.5 指南

GitHub 上面向初学者的指南/教程：

蛋白质设计实验室合集：

1. 综述

1.1 从头设计蛋白质

蛋白质设计：从计算机模型到人工智能 Antonella Paladino, Filippo Marchetti, Silvia Rinaldi, Giorgio Colombo Wiley跨学科评论：计算分子科学 7.5 (2017): e1318

蛋白质结构预测与设计的进展 Brian Kuhlman, Philip Bradley Nat Rev Mol Cell Biol 20, 681-697 (2019)

深度学习在蛋白质结构建模与设计中的应用 Wenhao Gao, Sai Pooja Mahajan, Jeremias Sulam, 和 Jeffrey J. Gray Patterns 1.9 • 2020年

高分子科学百年纪念观点：数据驱动的蛋白质设计 Ferguson, Andrew L., 和 Rama Ranganathan ACS宏分子快报 10.3 (2021)

人工智能在早期药物发现中的应用，助力精准医学 Fabio Bonioloa, Emilio Dorigattia, Alexander J. Ohnmachta, Dieter Saurb, Benjamin Schuberta, 和 Michael P. Menden Expert Opinion on Drug Discovery 16.9 (2021)

利用深度学习进行蛋白质设计 Defresne, Marianne, Sophie Barbe, 和 Thomas Schiex 国际分子科学杂志 22.21 (2021)

基于深度生成模型的蛋白质序列设计 Zachary Wu, Kadina E. Johnston, Frances H. Arnold, Kevin K. Yang Current Opinion in Chemical Biology 65 • 笔记 • 2021年

基于结构的深度学习蛋白质设计 Ovchinnikov, Sergey, 和 Po-Ssu Huang Current opinion in chemical biology 65 • 笔记 • 2021年

深度学习技术对蛋白质结构预测和蛋白质设计产生了重大影响 Pearce, Robin, 和 Yang Zhang Current opinion in structural biology 68 (2021)

从头设计蛋白质的最新进展：原理、方法与应用 Pan, Xingjie, 和 Tanja Kortemme Journal of Biological Chemistry 296 (2021)

通过深度学习进行蛋白质设计 Wenze Ding, Kenta Nakai, Haipeng Gong Briefings in Bioinformatics • 2022年3月25日

用于蛋白质设计的深度生成建模 Strokach, Alexey, 和 Philip M. Kim Current Opinion in Structural Biology • 2022年

膜蛋白设计新时代的曙光 Sowlati-Hashjin, Shahin, Aanshi Gandhi, 和 Michael Garton BioDesign Research (2022)

深度学习方法在蛋白质设计中对构象灵活性和开关特性的影响 Rudden, Lucas SP, Mahdi Hijazi, 和 Patrick Barth Frontiers in Molecular Biosciences

基于进化和物理启发的建模进行蛋白质计算设计：当前与未来的协同作用 Cyril Malbranke, David Bikard, Simona Cocco, Rémi Monasson, Jérôme Tubiana arXiv:2208.13616v2

从序列到功能，经由结构：深度学习在蛋白质设计中的应用 Noelia Ferruz, Michael Heinzinger, Mehmet Akdel, Alexander Goncearenco, Luca Naef, Christian Dallago bioRxiv 2022.08.31.505981/Computational and Structural Biotechnology Journal 第21卷，2023年 • 补充资料 • 配套列表

基于数据驱动方法的蛋白质计算设计：最新进展与展望 Haiyan Liu, Quan Chen WIREs Comput Mol Sci. 2022. e1646

以设计促理解：将深度学习从蛋白质结构预测推进到蛋白质设计 Gao, Yuanxu, Jiangshan Zhan, 和 Albert CH Yu MedComm-Future Medicine 1.2 (2022): e22

生物信息学中的扩散模型：深度学习革命的新浪潮正在发挥作用 Zhiye Guo, Jian Liu, Yanli Wang, Mengrui Chen, Duolin Wang, Dong Xu, Jianlin Cheng arXiv:2302.10907

机器学习在基于进化和物理启发的蛋白质设计中的应用：当前与未来的协同作用 Cyril Malbranke, David Bikard, Simona Cocco, Rémi Monasson, Jérôme Tubiana Current Opinion in Structural Biology

多面体蛋白质组装的从头设计：AI革命前后 Bhoomika Basu Mallik, Jenna Stanislaw, Tharindu Madhusankha Alawathurage, 和 Alena Khmelinskaia ChemBioChem 2023, e202300117

人工智能在蛋白质设计中的研究进展 CHEN Zhihang, JI Menglin, QI Yifei 合成生物学杂志 (2023)

图扩散模型综述：生成式AI在分子、蛋白质和材料科学中的应用 Mengchun Zhang, Maryam Qamar, Taegoo Kang, Yuna Jung, Chenshuang Zhang, Sung-Ho Bae, Chaoning Zhang https://arxiv.org/abs/2304.01565

利用全局生成模型探索蛋白质序列空间 塞尔吉奥·罗梅罗-罗梅罗、塞巴斯蒂安·林德纳、诺埃利亚·费鲁斯 arXiv:2305.01941

蛋白质设计的机器学习时代：四大关键方法综述 LucianoSphere Towards Data Science

新颖性可以预测吗？ 克拉拉·范江、珍妮弗·利斯特加滕 arXiv:2306.00872

计算蛋白质设计——未来走向何方？ 徐彬彬、陈英俊和薛伟伟《当前药物化学》2023年刊

蛋白质设计界如何最好地支持希望利用AI工具进行蛋白质结构预测与设计的生物学家？ 比尔特·霍克尔、陆培龙、阿努姆·格拉斯哥、黛博拉·S·马克斯普拉南·查特吉、乔安娜·S.G. 斯卢斯基、奥拉·舒勒-福尔曼、黄伯苏《细胞系统》第14卷第8期（2023）

从头设计纳米孔的创制 新津蓝《生物工程学会杂志》第101卷第8期（2023）

用于从头蛋白质设计的生成式人工智能 亚当·温尼弗里思、卡洛斯·欧特伊拉尔、布莱恩·希 arXiv:2310.09685

智能蛋白质设计与分子表征技术：综合评述 王晶晶、陈昌、姚戈、丁俊杰、王亮亮和姜辉《分子》第28卷第23期（2023）

用于蛋白质序列建模的生成模型：最新进展与未来方向 梅赫萨·马尔迪科雷姆、王子睿、纳撒尼尔·帕斯夸尔、丹尼尔·沃尔德林 Briefings in Bioinformatics

深度学习赋能下的蛋白质设计新时代 哈迈德·哈克扎德、伊利亚·伊加绍夫、阿尔内·施诺因、卡斯珀·戈韦尔德、迈克尔·布朗斯坦、布鲁诺·科雷亚《细胞系统》第14卷第11期

深度学习在蛋白质结构预测与设计中的进展及应用 尤尔根·雅内斯和佩德罗·贝尔特劳 Mol Syst Biol（2024）

从头蛋白质设计——从新结构到可编程功能 坦雅·科尔特梅《细胞》第187卷第3期（2024）

蛋白质结构与序列的生成模型 克洛伊·许、克拉拉·范江和珍妮弗·利斯特加滕 Nat Biotechnol 42, 196–199 (2024)

功能性蛋白质工程与设计实现“AlphaFold时刻”需要什么？ 罗伯托·A·奇卡和诺埃利亚·费鲁斯 Nat Biotechnol 42, 173–174 (2024)

蛋白质设计：专家观点 安妮·多尔 Nat Biotechnol 42, 175–178 (2024)

用于功能性蛋白质设计的机器学习 帕斯卡尔·诺廷、内森·罗林斯、亚林·加尔、克里斯·桑德和黛博拉·马克斯 Nat Biotechnol 42, 216–228 (2024)

通过从头蛋白质设计激发功能火花 亚历山大·E·楚、陆天宇和黄伯苏 Nat Biotechnol 42, 203–215 (2024) • 海报

用于从头药物设计的生成式AI综述：分子与蛋白质生成的新前沿 唐翔儒、戴浩华、伊丽莎白·奈特、吴芳、李云阳、李天晓和马克·格斯坦 arXiv:2402.08703

AI辅助蛋白质设计带来的安全挑战 菲利普·亨特 EMBO Rep（2024）

蛋白质功能设计与优化的机遇与挑战 迪娜·利斯托夫、卡斯珀·A·戈韦尔德、布鲁诺·E·科雷亚和萨雷尔·雅各布·弗莱施曼 Nat Rev Mol Cell Biol（2024）

深度学习在精准蛋白质设计与结构预测中的应用现状概述 萨伯·萨哈尔基兹、梅赫纳兹·莫斯塔法维、阿敏·比拉什克、希瓦·卡里米安、沙扬·哈利洛拉、索赫拉卜·贾费里安、雅尔达·亚兹达尼、伊拉吉·阿里普尔法尔德、尹锡许、马尔齐耶·拉梅扎尼·法拉尼和雷扎·阿哈万-西加里 Top Curr Chem (Z) 382, 23 (2024)

用于蛋白质设计的计算方法 诺埃利亚·费鲁斯、阿梅莉·施泰因《蛋白质工程、设计与选择》第37卷，2024年刊

基于结构的蛋白质和小分子生成：EGNN与扩散模型的综合评述 法尔赞·索莱马尼、埃里克·帕凯、埃尔纳·莉迪娅·维克托和沃杰特·米哈洛夫斯基《计算与结构生物技术期刊》（2024）

机器学习在生物物理学中的应用：从生物分子预测到设计 乔纳森·马丁、马科斯·莱奎里卡·马特奥斯、何塞·N·奥努奇克和法鲁克·莫尔科斯《美国国家科学院院刊》第121卷第27期（2024）

AI已梦想到大量新型蛋白质。它们真的有用吗？ 尤恩·卡拉威 Nature 634.8034（2024）

五个仍对AI构成挑战的蛋白质设计问题 萨拉·里尔登 Nature 635.8037（2024）

人工智能时代的从头蛋白质设计 刘楠、金晓成、杨崇州、王梓洋、闵晓平、葛圣祥《生物工程学报》

蛋白质工程中的生成模型：综合调查 陈欣慧、袁艺文、约瑟夫·刘、卓涛梁、朱晓叶、陈佳琪 NeurIPS 2024研讨会

蛋白质生物信息学中深度学习方法及其对蛋白质设计影响的调查 魏航戴 arXiv:2501.01477

蛋白质设计的前景：与诺贝尔奖得主大卫·贝克的问答 大卫·贝克和林菲 GEN生物技术（2025）

蛋白质设计与结构解析在药物发现中的应用 佩特拉·邦比茨《晶体学评论》（2024）

以模型为中心的深度学习在蛋白质设计中的综述 格雷戈里·W·凯罗、邱天音、维克多·S·巴蒂斯塔 arXiv:2502.19173

计算蛋白质设计 凯瑟琳·I·阿尔巴内塞、索菲·巴贝、田上俊介、德里克·N·伍尔夫森和托马斯·希耶克斯《自然综述·方法总论》5.1期（2025年）

探索生命的蓝图：抗体与蛋白质设计的创新 杨志伟和杰拉尔德·H·卢辛顿《组合化学与高通量筛选》

用于蛋白质结构预测与设计的先进深度学习方法 张一超、邓宁远、宋欣源、毕子谦、王天阳、姚哲宇、陈可宇、李明、牛倩、刘俊宇、彭本吉、张森、刘明、张力、潘宣赫、王金朗、冯泊逊、温义竹、严立秋、曾洪明、王云泽、秦子渊、景博文、杨俊杰、周俊、梁嘉欣、宋俊豪 arXiv:2503.13522

深度学习驱动的蛋白质结构预测与设计：诺奖得主的关键模型进展及多领域应用 杨万青、王延伟、王洋 arXiv:2504.01490

蛋白质的智能挖掘、工程化与从头设计 刘翠、史振坤、马洪武、廖小平《生物工程学报》41卷第3期（2025年）

基于蛋白质的材料：应用、修饰与分子设计 阿力提乃·吐努热、郑泽、饶欣然、于洪波、马福英、周雅娴、谢尚贤《BioDesign Research》（2025年）

人工智能正在变革蛋白质研究：结构及其更深层次的应用 刘海燕、陈权和刘宇峰 hLife（2025年）

用于蛋白质折叠与设计的人工智能方法 张志典、欧晨曦、曹叶琳、秋山洋、谢尔盖·奥夫钦尼科夫《当前结构生物学观点》93期（2025年）

AI4Protein：重塑蛋白质设计的未来 王德全、谭哲灵、高进、张绍婷、沈佳琪和陆宇明《中国科学：生命科学》（2025年）

关于将基于人工智能的蛋白质设计应用于自身免疫性脑炎的评论：令人振奋的可能性与实际考量 寇增威《多发性硬化症及相关疾病杂志》（2025年）

计算蛋白质设计：通过计算机辅助工程推动生物技术发展 兰吉特·兰博尔、鲁特维克·文卡特桑、阿迈·桑杰·雷德卡尔、维宾·拉马克里希南《生物物理学与分子生物学进展》（2025年）

计算蛋白质设计的进展：原理、策略及在营养与健康领域的应用 赵子凌、曲启扬、孙富伟、臧家辰、郑博文、张拓、赵广华、吕晨妍、王中江《生物技术进展》（2025年）

人工智能在从头蛋白质设计中的应用 姚嘉伟和王晓刚《新型技术和设备中的医学》（2025年）

人工智能驱动的蛋白质设计 许环怡、郑依珍、杨玛德琳、罗希特·阿罗拉、杰弗里·I·韦伯、潘诗睿、李莉和乔治·M·丘奇《自然综述·生物工程》（2025年）

DL4Proteins Jupyter笔记本：教你如何利用人工智能进行生物分子结构预测与设计 迈克尔·钟友恩、加布·奥、布丽特妮·卡彭蒂埃、斯里瓦尔沙·普瓦达、考特妮·托马斯、杰弗里·J·格雷 arXiv:2511.02128

指导生成式模型进行蛋白质设计：提示、引导与对齐 菲利波·斯托科、米凯莱·加里博、诺埃利亚·费鲁兹 arXiv:2511.21476

RFDiffusion：用生成式人工智能革新蛋白质设计 彭章志（弗雷德）《丝蚕医学杂志》2卷第4期（2025年）

人工智能驱动的从头蛋白质设计在探索蛋白质功能宇宙中的作用 张国浩、刘传阳、陆嘉杰、张绍伟和朱凌云《生物学》14卷第9期（2025年）：1268页

蛋白质设计与RNA设计：展望 陈曦、戴旭、陆培龙《定量生物学》14卷第2期（2026年）

蛋白质设计的变革：从传统方法到人工智能驱动的精准工程 方欣《MedScien》1卷第1期（2025年）

利用人工智能的最新进展进行蛋白质设计 拉塞尔·约翰逊《自然化学生物学》（2025年）：1—4页

从头蛋白质设计：临床蛋白质应用中的变革性前沿 高杰、郑载勇、于雪婷、罗亚美、于洋和张春翔《转化医学杂志》（2026年）

从头设计TIM桶蛋白：稳定化、多样化与功能化策略的见解 朱利安·贝克、塞尔吉奥·罗梅罗-罗梅罗《生物化学学会交流》

人工智能赋能的蛋白质设计助力未来的植物研究与作物育种 娄宇轩、吴天昊、夏凡、赵安雯、王向峰《植物生理学》

内在无序蛋白质结合剂设计的前沿与挑战 王晨桐、张彦哲、方敏超、彭章志、曹隆兴《当前结构生物学观点》

1.2 抗体设计

抗体深度学习方法综述 乔丹·格雷夫斯、雅各布·拜尔利、爱德华多·普里戈、纳伦·马卡帕蒂、S·文斯·帕里什、布伦达·梅德林和莫妮卡·贝隆多 Antibodies 9.2 (2020)

基于机器学习的适切性单克隆抗体设计的进展与挑战 拉赫马德·阿克巴尔、哈比卜·巴舒尔、普尼特·拉瓦特、菲利普·A·罗伯特、伊娃·斯莫罗迪娜、图多尔-斯特凡·科泰特、卡琳·弗莱姆-卡尔森、罗伯特·弗兰克、布里杰·布尚·梅塔、迈·哈·武、塔利普·曾金、何塞·古铁雷斯-马科斯、弗里特约夫·伦德-约翰森、扬·特耶·安德森和维克托·格雷夫 Mabs. 第14卷第1期. 泰勒和弗朗西斯, 2022年

基于计算结构的抗体设计进展 胡默尔、阿莉莎·M·布伦南·阿巴内德斯和夏洛特·M·迪恩 Current Opinion in Structural Biology 74 (2022)

用于抗体开发的计算与人工智能方法 金智善、马修·麦克菲、方乔、奥萨马·阿卜丁、菲利普·M·金 Trends in Pharmacological Sciences (2023)

利用深度学习改进疫苗设计 安德鲁·P·海德曼、玛格丽特·E·阿克曼 Trends in immunology (2023)

通过计算机模拟方法实现更优抗体的设计：过去、现在与未来 安德烈亚斯·埃弗斯、希普拉·马尔霍特拉、瓦尼塔·D·苏德 arXiv:2305.07488

蛋白质设计的AI模型正在推动抗体工程的发展 迈克尔·钟友恩、杰弗里·J·格雷 Current Opinion in Biomedical Engineering (2023): 100473

免疫学与疫苗学中的计算方法：抗体和免疫原的设计与开发 费德里卡·瓜拉和乔治奥·科隆博 Journal of Chemical Theory and Computation (2023)

利用机器学习简化复杂的抗体工程 马科夫斯基、艾米丽·K·陈欣婷和彼得·M·泰西耶 Cell Systems 14.8 (2023)/2022 AIChE年度会议. AIChE, 2022年。

AI驱动的B细胞免疫疗法设计 布鲁娜·莫雷拉·达席尔瓦、大卫·B·阿舍、尼古拉斯·吉亚德、道格拉斯·E·V·皮雷斯 arXiv:2309.01122

抗体发现与开发中机器学习的最佳实践 莱昂纳德·沃斯尼格、诺伯特·富尔特曼、安德鲁·布坎南、桑迪普·库马尔、维克托·格赖夫 arXiv:2312.08470/Drug Discovery Today (2024)

下一代多特异性抗体工程 丹尼尔·凯里、马特·沃克、伊莎·辛格、凯尔·西西川、费尔南多·加尔塞斯 Antibody Therapeutics (2023): tbad027

抗体工程中机器学习入门 ABHISHAIKE MAHAJAN Substack • 博客

利用深度学习进行抗体设计：从序列与结构设计到亲和力成熟 萨拉·朱比、阿莱西奥·米凯利、保罗·米拉佐、朱塞佩·马卡里、乔治奥·恰诺、达里奥·卡达莫内、杜奇奥·梅迪尼 Briefings in Bioinformatics, 第25卷第4期, 2024年7月, bbae307

AI加速的治疗性抗体开发：实践见解 卢卡·桑图阿里、玛丽安娜·巴赫曼·萨尔维、伊万尼斯·泽纳里奥斯、布拉克·阿尔帕特 Frontiers in Drug Discovery 4 (2024)

生成扩散模型驱动的AI抗体设计：当前见解与未来方向 辛恒·何、俊睿·李、詹姆斯·徐、洪山、诗怡·沈、思涵·高及H·埃里克·徐 Acta Pharmacologica Sinica (2024)

将计算蛋白质设计应用于治疗性抗体的发现——现状与展望 韦罗妮卡·别尔斯卡、伊戈尔·雅什奇津、帕维尔·杜季茨、巴托什·扬努什、达维德·霍米奇、索尼娅·沃贝尔、维克托·格赖夫、瑞安·菲汉、贾雷德·阿道夫-布赖福格尔、康拉德·克拉夫奇克 arXiv:2503.00913/Frontiers in Immunology 16 (2025)

人工智能驱动的抗体设计与优化计算方法
路易斯·费利佩·韦基耶蒂、布莱恩·纳撒尼尔·维贾亚、阿扎马特·阿尔马努利、贝根奇·杭盖尔季耶夫、玄奎·郑、秀妍·李、美英·车及浩敏·金
mAbs, 2025年

计算机模拟肽设计：方法、资源及AI的作用
普里扬卡·雷·乔杜里、赛·库马尔·米什拉、西达尔特·亚达夫、舒布希·辛格、普尼蒂·马图尔
Journal of Peptide Science 31.12 (2025)

人工智能在抗体设计与开发中的应用：利用计算方法的力量
索达贝·卡武西普尔、马赫迪·巴拉泽什、希瓦·穆罕默迪
Medical & Biological Engineering & Computing (2025)

利用深度学习加速抗体和适配体的开发
潘坦、宋李、金黄、子义周、梁宏
Acta Pharmaceutica Sinica B (2025)

1.3 肽设计

用于肽设计的深度生成模型 万方平、达芙妮·孔托吉奥戈斯-海因茨和塞萨尔·德拉富恩特-努涅斯 Digital Discovery（2022）

针对蛋白质靶标结合的蛋白质片段与肽的设计 古普塔、苏切塔娜、诺拉·阿扎德瓦里和帕丽萨·侯赛因扎德 BioDesign Research 2022（2022）

革新基于肽的药物发现：AlphaFold时代后的进展 李伟昌、阿鲁普·蒙达尔、布米卡·辛格、伊塞尔·马丁内斯-诺亚、阿尔贝托·佩雷斯 Wiley跨学科评论：计算分子科学

通过人工智能进行基于肽的药物发现：迈向治疗性肽的自主设计 蒙瑟拉特·戈莱斯、阿纳玛丽娅·达萨、加布里埃尔·卡巴斯-莫拉、林迪贝丝·萨尔米恩托-巴隆、胡莉埃塔·塞普尔韦达-雅涅斯、霍达·安瓦里-卡泽马巴德、梅赫迪·D·达瓦里、罗伯托·乌里贝-帕雷德斯、阿尔瓦罗·奥利韦拉-纳帕、马塞洛·A·纳瓦雷特、大卫·梅迪纳-奥尔蒂斯 Briefings in Bioinformatics 25.4（2024）

加速抗菌肽设计：利用深度学习实现快速发现 艾哈迈德·M·阿尔-奥马里、亚赞·H·阿卡姆、阿拉·祖尤特、谢玛·尤尼斯、谢法·M·塔瓦勒贝、哈立德·阿尔-萨瓦尔梅、阿姆杰德·阿尔·法胡姆、乔纳森·阿诺德 PloS one 19.12（2024）：e0315477

肽偶联药物研发趋势：人工智能辅助设计 张东E、张东E、何通、何通、史天义、史天义、黄坤、黄坤、彭安林、彭安林 Frontiers in Pharmacology 16

用于抗菌肽设计的生成模型：自编码器及更多 卢卡斯·拜尔勒、朱利安·哈恩费尔德、亚历山大·戈斯曼、雷哈内·莫斯托利扎德、弗朗茨·切米奇 bioRxiv 2025.10.29.685317 • 补充资料 • 代码

1.4 结合物设计

利用深度学习改进从头设计蛋白质结合物 纳撒尼尔·贝内特、布莱恩·科文特里、英娜·戈列什尼克、黄步伟、阿扎·艾伦、狄俄涅·瓦菲阿多斯、彭英波、尤斯塔斯·道帕拉斯、白敏京、兰斯·斯图尔特、弗兰克·迪马约、史蒂文·德芒克、萨瓦斯·萨维德斯、大卫·贝克 bioRxiv 2022.06.15.495993/Nat Commun 14, 2625（2023） • 代码 • 新闻

数据与人工智能驱动的合成结合蛋白发现 李延林、段子欣、李振文、薛伟伟 Trends in Pharmacological Sciences（2025）

从代码到复杂结构：人工智能驱动的从头结合物设计 丹尼尔·R·福克斯、辛西娅·塔韦诺、雅尼克·克莱门特、里斯·格林特、加文·J·诺特 Structure（2025）

1.5 酶设计

人工智能在催化稳定性方面的酶设计综述 明永凡、王文康、尹锐、曾敏、唐莉、唐世哲、李敏 Briefings in Bioinformatics，2023年

“可折叠性”在智能酶工程与设计中的应用：以AlphaFold2为例 孟巧珍、郭飞 Synthetic Biology Journal（2023）

AlphaFold2与深度学习在阐明酶构象灵活性及其设计应用中的作用 卡萨德瓦尔、吉列姆、克里斯蒂娜·杜兰和西尔维娅·奥苏纳 JACS Au（2023）

利用机器学习加速生物催化发现：酶工程、发现与设计的范式转变 布劳恩·马库斯、格鲁伯·克里斯蒂安·C、克拉思尼格·安德烈亚斯、库默尔·阿卡迪耶、卢茨·施特凡、奥伯多尔费尔·古斯塔夫、西罗拉·埃琳娜和斯奈德罗娃·拉德卡 ACS Catal. 2023

通过设计与进化构建酶 霍萨克、欧恩·J、佛罗伦斯·J·哈迪和安东尼·P·格林 ACS Catalysis 13.19（2023）

用于设计新型酶以生产可再生化学品和燃料的生成建模方法及数据集的进展 拉娜·A·巴尔古特、许志清、西达尔斯·贝塔拉、拉达克里希南·马哈德文 Current Opinion in Biotechnology，第84卷，2023年

机器学习辅助酶工程的机遇与挑战 杰森·杨、周凡·李、弗朗西斯卡·H·阿诺德 ACS Central Science（2024）

探索酶设计领域：从分子模拟到机器学习 周佳慧、黄美兰 Chemical Society Reviews（2024）

结构预测与计算蛋白质设计用于高效生物催化剂和生物活性蛋白质 丽贝卡·布尔、季里·丹博尔斯基、唐纳德·希尔弗特、乌韦·博恩绍尔 Angewandte Chemie（英文国际版）

用于酶设计与生物催化的生成式人工智能
拉塞·米登多夫、诺埃利亚·费鲁兹
arXiv:2602.03779

2. 基于模型的设计

通过迭代优化算法对训练好的模型进行反演，以进行序列设计。反演后的结构预测模型被称为“幻觉”。

2.1 基于结构预测模型

2.1.1 基于trRosetta

利用深度学习设计呈现不连续功能位点的蛋白质 道格·提舍尔、西德尼·利桑扎、王珏、董润泽、查看ORCID个人资料的伊万·阿尼申科、卢卡斯·F·米勒斯、谢尔盖·奥夫钦尼科夫、大卫·贝克 bioRxiv（2020）

面向分子设计的快速可微DNA和蛋白质序列优化 林德尔、约翰内斯和格奥尔格·泽利格 arXiv预印本arXiv:2005.11275（2020）

基于深度网络幻觉的从头蛋白质设计 伊万·阿尼申科、塞缪尔·J·佩洛克、塔穆卡·M·奇迪亚西库、特蕾莎·A·拉梅洛特、谢尔盖·奥夫钦尼科夫、郝景州、库什布·巴夫纳、克里斯托弗·诺恩、亚历克斯·康、阿西姆·K·贝拉、弗兰克·迪马约、劳伦·卡特、卡梅隆·M·乔、加埃塔诺·T·蒙特利奥内及大卫·贝克《自然》杂志（2021年） • 代码 • trRosetta

通过构象景观优化进行蛋白质序列设计 克里斯托弗·诺恩、巴斯勒·I·M·维基、戴维·尤尔根斯和谢尔盖·奥夫钦尼科夫《美国国家科学院院刊》2021年第11期 • 代码

小型β桶状蛋白质的从头设计 大卫·E·金、达文·R·詹森、大卫·费尔德曼、道格·蒂舍尔和阿耶莎·萨利姆、卡梅隆·M·乔、李欣婷、劳伦·卡特、卢卡斯·米勒斯、汉娜·阮、亚历克斯·康、阿西姆·K·贝拉、弗朗西斯·C·彼得森、布莱恩·F·沃尔克曼、谢尔盖·奥夫钦尼科夫、大卫·贝克 PNAS（2023年），e2207974120 • 代码

利用深度学习探索“暗物质”蛋白质折叠 赞德·哈特韦尔德、亚历山德拉·范·霍尔-博瓦伊斯、伊琳娜·莫罗佐娃、乔舒亚·桑德林、卡斯珀·亚历山大·戈弗德、桑德琳·乔治翁、斯特凡·罗塞、安德烈亚斯·卢卡斯、皮埃尔·万德盖因斯特、迈克尔·布朗斯坦、布鲁诺·科雷亚 bioRxiv 2023.08.30.555621/《细胞系统》杂志 • 补充材料 • 代码

利用深度网络幻觉雕刻出糖苷水解酶活性位点，并将其整合到新型蛋白质支架中 安德斯·伦斯特鲁普·汉森、弗雷德里克·弗里斯·泰森、拉蒙·克雷韦特、恩里克·马科斯、努辛·阿加贾里和马丁·威廉莫斯 ACS合成生物学（2024年）

通过对构象景观和序列的隐式建模，实现稳定蛋白质的评分与生成 叶林·乔、尤斯塔斯·道帕拉斯、小野山孝太郎、加布里埃尔·罗克林、谢尔盖·奥夫钦尼科夫 bioRxiv 2024.12.20.629706/《自然通讯》（2025年） • 代码 • 补充材料

2.1.2 基于AlphaFold

使用可微分的Smith-Waterman算法进行多序列比对的端到端学习 佩蒂、萨曼莎、巴塔查里亚、尼古拉斯、拉奥、罗山、道帕拉斯、尤斯塔斯、托马斯、尼尔、周俊楠、拉什、亚历山大·M、库、彼得·K、奥夫钦尼科夫、谢尔盖 bioRxiv（2021年）/生物信息学，2022年，btac724 • ColabDesign、SMURF、AF2反向传播 • 我们的笔记1、笔记2 • 讲座1、讲座2 • Discord

AlphaDesign：基于AlphaFold的从头蛋白质设计框架 延德鲁施、迈克尔、扬·O·科尔贝尔和S·卡希夫·萨迪克 bioRxiv（2021年）/分子系统生物学（2025年）

利用AlphaFold实现快速且准确的固定主链蛋白质设计 莫法特、刘易斯、乔·G·格里纳和戴维·T·琼斯 bioRxiv（2021年）

利用AlphaFold进行蛋白质模型精度的最先进评估 詹姆斯·P·罗尼、谢尔盖·奥夫钦尼科夫 bioRxiv 2022.03.11.484043/《物理评论快报》2022年第129卷第23期 • 代码

利用AlphaFold进行考虑溶解度的蛋白质结合肽设计 高杉隆次、大植正仁 bioRxiv 2022.05.14.491955/《生物医学》2022年第10卷第7期 • 补充材料 • 代码

幻觉生成蛋白质组装体 巴斯勒·I M 维基、卢卡斯·F 米勒斯、阿莱克西斯·库尔贝、罗伯特·J 拉戈特、尤斯塔斯·道帕拉斯、以利亚斯·金富、萨姆·蒂普斯、瑞安·D 基布勒、明京·白、弗兰克·迪马约、李欣婷、劳伦·卡特、亚历克斯·康、汉娜·阮、阿西姆·K 贝拉、大卫·贝克 bioRxiv 2022.06.09.493773/《科学》杂志（2022年） • 相关幻灯片 • 我们的笔记 • 新闻

EvoBind：利用AlphaFold在硅胶中定向进化肽类结合剂 帕特里克·布莱恩特、阿尔内·埃洛夫松 bioRxiv 2022.07.23.501214 • 代码

幻觉生成包含中心口袋的闭合重复蛋白质 林娜·安、德里克·R·希克斯、德米特里·佐林、尤斯塔斯·道帕拉斯、巴斯勒·I. M. 维基、卢卡斯·F 米勒斯、阿莱克西斯·库尔贝、阿西姆·K 贝拉、汉娜·阮、亚历克斯·康、劳伦·卡特、大卫·贝克 bioRxiv 2022.09.01.506251/《自然结构与分子生物学》2023年第30卷，1755–1760页 • 补充数据

利用AlphaFold和蒙特卡洛树搜索预测大型蛋白质复合物的结构 帕特里克·布莱恩特、加布里埃莱·波扎蒂、朱文思、阿迪蒂·谢诺伊、彼特拉斯·昆德罗塔斯以及阿尔内·埃洛夫松《自然通讯》2022年第13卷第1期 • gitlab、github • 补充数据1、补充数据2

通过反转 AlphaFold 结构预测网络进行从头蛋白质设计 Casper Goverde、Benedict Wolf、Hamed Khakzad、Stephane Rosset、Bruno E Correia bioRxiv 2022.12.13.520346 • 代码 • 讲座1 • 讲座2

OpenComplex 的代码 Jingcheng、Yu 和 Zhaoming、Chen 和 Zhaoqun、Li 和 Mingliang、Zeng 和 Wenjun、Lin 和 He、Huang 和 Qiwei、Ye 代码

利用松弛的序列空间进行高效且可扩展的从头蛋白质设计 Christopher Josef Frank、Ali Khoshouei、Yosta de Stigter、Dominik Schiewitz、Shihao Feng、Sergey Ovchinnikov、Hendrik Dietz bioRxiv 2023.02.24.529906 • 代码

使用 AlphaFold 进行环肽结构预测与设计 Stephen A. Rettie、Katelyn V. Campbell、Asim K. Bera、Alex Kang、Simon Kozlov、Joshmyn De La Cruz、Victor Adebomi、Guangfeng Zhou、Frank DiMaio、Sergey Ovchinnikov、Gaurav Bhardwaj bioRxiv/Nat Commun 16, 4730 (2025) • 代码 • 补充材料

利用深度学习进行荧光素酶的从头设计 Andy Hsien-Wei Yeh、Christoffer Norn、Yakov Kipnis、Doug Tischer、Samuel J. Pellock、Declan Evans、Pengchen Ma、Gyu Rie Lee、Jason Z. Zhang、Ivan Anishchenko、Brian Coventry、Longxing Cao、Justas Dauparas、Samer Halabiya、Michelle DeWitt、Lauren Carter、K. N. Houk 和 David Baker Nature • 代码 • 补充材料

利用深度学习模型进行结构预测和序列设计，实现蛋白质结合物的计算机模拟进化 Odessa J Goudy、Amrita Nallathambi、Tomoaki Kinjo、Nicholas Randolph、Brian Kuhlman bioRxiv 2023.05.03.539278 • 补充材料 • 代码

跨膜蛋白结构可溶性类似物的计算设计 Casper Alexander Goverde、Martin Pacesa、Lars Jeremy Dornfeld、Sandrine Georgeon、Stephane Rosset、Justas Dauparas、Christian Shellhaas、Simon Kozlov、David Baker、Sergey Ovchinnikov、Bruno Correia bioRxiv 2023.05.09.540044/Nature (2024) • 代码 • 补充材料

利用 AlphaFold2 和结合亲和力预测模型进行抗体互补决定区序列设计 Takafumi Ueki、Masahito Ohue bioRxiv 2023.06.02.543382

基于深度学习的诱导契合酶上下文依赖性设计，生成表达良好、热稳定且具有活性的酶 Lior Zimmerman、Noga Alon、Itay Levin、Anna Koganitsky、Nufar Shpigel、Chen Brestel、Gideon David Lapidoth bioRxiv 2023.07.27.550799 • 补充材料

使用 CarbonDesign 进行高精度且稳健的蛋白质序列设计/使用 CarbonDesign 进行精确且稳健的蛋白质序列设计 Milong Ren、Chungong Yu、Dongbo Bu、Haicang Zhang bioRxiv 2023.08.07.552204/Nat Mach Intell 6, 536–547 (2024) • 代码

利用 AlphaFold 设计靶向蛋白质-蛋白质相互作用的环肽 Takatsugu Kosugi、Masahito Ohue bioRxiv 2023.08.20.554056 • 补充材料 • 代码

MetaPPI：基于 CRBN 的新型底物的计算机筛选 neoxbio 网站 • 新闻 • 基于 masif • 商业化

用于蛋白质设计的 AlphaFold 蒸馏 匿名 ICLR 2024 • 代码

利用 AlphaFold 高通量计算发现抑制性蛋白质片段 Andrew Savinov、Sebastian Swanson、Amy E. Keating、Gene-Wei Li bioRxiv 2023.12.19.572389 • 代码

通过多目标优化实现蛋白质序列设计的整合方法 Lu Hong、Tanja Kortemme bioRxiv 2024.03.01.582670/PLOS Computational Biology 20(7) • 代码 • 补充材料

利用结构预测网络进行蛋白质设计：AlphaFold 和 RoseTTAFold 作为蛋白质结构基础模型 Jue Wang、Joseph L. Watson 和 Sidney L. Lisanza Cold Spring Harbor Perspectives in Biology(2024)

利用深度学习进行上下文依赖性设计的诱导契合酶，可产生表达良好、热稳定性高且具有活性的酶 Lior Zimmerman、Noga Alon、Itay Levin 和 Gideon D. Lapidoth 美国国家科学院院刊 121.11(2024)

带有封端螺旋的重复 α-β 蛋白质设计 Dmitri Zorine、David Baker bioRxiv 2024.06.15.590358 • 代码

仅根据蛋白质靶序列设计不同长度的线性与环状肽结合物 李秋珍、埃夫斯塔提奥斯·尼古拉斯·弗拉霍斯、帕特里克·布莱恩特 bioRxiv 2024.06.20.599739 • 代码 • 补充材料

BindCraft：功能性蛋白质结合物的一次性设计 马丁·帕切萨、伦纳特·尼克尔、约瑟夫·施密特、叶卡捷琳娜·皮亚托娃、克里斯蒂安·谢尔哈斯、卢卡斯·基斯林、安娜·阿尔卡拉兹-塞尔纳、耶林·乔、库鲁什·H·加马里、劳拉·维纽、布拉姆·J·亚赫宁、安德鲁·M·沃拉科特、斯蒂芬·巴克利、桑德琳·乔治翁、卡斯珀·A·戈韦尔德、格奥尔吉奥斯·N·哈佐普洛斯、皮埃尔·贡齐、扬尼克·D·穆勒、杰拉尔德·施万克、谢尔盖·奥夫钦尼科夫、布鲁诺·E·科雷亚 bioRxiv 2024.09.30.615802/Nature (2025) • 代码

基于蛋白质序列信息设计不同长度的线性与环状肽结合物 李秋珍、埃夫斯塔提奥斯·尼古拉斯·弗拉霍斯、帕特里克·布莱恩特 bioRxiv 2024.06.20.599739 • 代码

在松弛序列空间中进行优化以实现可扩展的蛋白质设计 克里斯托弗·弗兰克、阿里·霍绍伊、拉拉·福布、多米尼克·希维茨、多米尼克·普茨、拉拉·韦伯、赵志轩、服部元幸、冯世豪、约斯塔·德·斯蒂赫特、谢尔盖·奥夫钦尼科夫、亨德里克·迪茨 Science386,439–445(2024) • 代码

AlphaFold2精炼提升大型从头设计蛋白质的可设计性 克里斯托弗·约瑟夫·弗兰克、多米尼克·希维茨、拉拉·福斯、谢尔盖·奥夫钦尼科夫、亨德里克·迪茨 bioRxiv 2024.11.21.624687 • Colab

Low-N OpenFold微调可在无需额外结构的情况下改进肽设计 西奥多·斯特恩利布、雅库布·奥特维诺夫斯基、萨姆·锡奈、杰弗里·陈机器学习用于结构生物学研讨会，NeurIPS 2024

HighPlay：基于强化学习和蛋白质结构预测的环肽序列设计 林辉天、朱成、商天峰、朱宁、林康、邵翔、王旭东、段洪亮 bioRxiv 2025.03.17.643626

利用计算机模拟进化设计新型螺线管蛋白 丹妮拉·普雷托里乌斯、格奥尔吉·伊万诺夫·尼科夫、小盐浩之、史蒂夫-威廉·弗洛伦特、亨利·陶恩特、谢尔盖·奥夫钦尼科夫、詹姆斯·威廉·默里 bioRxiv 2025.04.23.646631 • 补充材料

使用EvoBind一次性设计针对HIV-1膜融合的环肽抑制剂 迪安德拉·道米勒、费德丽卡·贾马里诺、李秋珍、安德斯·松内博格、拉斐尔·塞尼亚·迪埃斯、帕特里克·布莱恩特 bioRxiv 2025.04.30.651413

BindEnergyCraft：将蛋白质结构预测器转化为基于能量的模型用于结合物设计 迪维娅·诺里、阿尼莎·帕尔桑、卡罗琳·乌勒、温功金 arXiv:2505.21241

盲目的双重环肽激动剂从头设计，靶向GCGR和GLP1R 李秋珍、艾莉丝·维塔、托马斯·赫莱戴、帕特里克·布莱恩特 bioRxiv 2025.06.06.658268 • 代码

用于反向蛋白质设计的AlphaFold蒸馏 伊戈尔·梅尔尼克、奥蕾莉·洛萨诺、帕耶尔·达斯和维吉尔·琴塔马拉克尚 Sci Rep 15, 21743 (2025) • 代码

通过AlphaFold2-Multimer幻觉进行折叠条件下的从头结合物设计 孔达米尔·R·鲁斯塔莫夫、阿廖姆·Y·巴耶夫 bioRxiv 2025.07.02.662497 • 补充材料 • 代码

基于蛋白质序列信息设计线性与环状肽结合物 李秋珍、埃夫斯塔提奥斯·尼古拉斯·弗拉霍斯和帕特里克·布莱恩特 Commun Chem 8, 211 (2025)

使用BindCraft生成高亲和力肽的设计 迈克·菲利乌斯、塔纳西斯·帕索斯、于戈·米尼、詹卢卡·图尔科、刘景明、莫妮卡·格纳齐、拉蒙·S.M.鲁思、安迪·C.H.刘、罗莎·D.T.塔、伊萨·H.A.赖克、萨菲娅·齐亚尼、费姆克·J.博克斯曼、塞巴斯蒂安·J.庞普伦 bioRxiv 2025.07.23.666285 • 补充材料

具有保留抗体结合能力的可溶性CCR8类似物的计算设计 阮氏姮、刘松明、李一凡、丛龙飞、罗杰·谢克、李德贤、李毅、佩尔·格雷森 bioRxiv 2025.08.18.670068

从头设计一种肽调节剂，以逆转与心律失常和癫痫相关的钠通道功能障碍 瑞安·马林、本策·黑吉、艾琳·R·卡伦、蒂莫西·M·乔、亚伦·R·罗德里格斯、吕西尔·福西耶、马克·耶海亚、杨林、陈碧星、亚历山大·N·卡奇曼、努尔丁·沙库里、季瑞平、伊莲·Y·万、贾里德·库什纳、史蒂文·O·马克思、谢尔盖·奥夫钦尼科夫、克里斯托弗·D·麦金森、唐纳德·M·伯斯、马努·本-约翰尼 Cell (2025)

使用Germinal高效生成表位靶向的从头抗体 路易斯·圣地亚哥·米列-弗拉戈索、约翰·N·王、克劳迪娅·L·德里斯科尔、戴浩宇、塔拉勒·M·维达塔拉、张晓伟、布莱恩·L·希、高晓静 bioRxiv 2025.09.19.677421 • 补充材料 • 代码

mBER：可控制的从头抗体设计，配合百万级实验筛选 埃里克·斯旺森、迈克尔·尼科尔斯、苏普里亚·拉维昌德兰、皮尔斯·奥格登 bioRxiv 2025.09.26.678877

基于深度学习的自动化多目标从头蛋白质设计流程 阿姆里塔·纳拉坦比、布莱恩·库尔曼 Current protocols 5.10 (2025)

蛋白质猎手：利用扩散模型中的结构幻觉进行蛋白质设计
Yehlin Cho、Griffin Rangel、Gaurav Bhardwaj、Sergey Ovchinnikov
bioRxiv 2025.10.10.681530 • 代码

从头设计蛋白质可靶向难以攻克的致癌性界面
Varshika Ram Prakash、Yusuf Najy、Kalel Garrett、Brian F.P. Edwards、Benjamin L Kidder
bioRxiv 2025.10.22.683953 • 补充材料

HalluDesign：通过迭代式结构幻觉与序列设计实现蛋白质优化及从头设计
Minchao Fang、Chentong Wang、Jungang Shi、Fangbai Lian、Qihan Jin、Zhe Wang、Yanzhe Zhang、Zhanyuan Cui、YanJun Wang、Yitao Ke、Qingzheng Han、Longxing Cao
bioRxiv 2025.11.08.686881 • 代码

高效从头设计嵌合抗原受体的序列与结构决定因素
Arthur Chow、Hoyin Chu、Ruofan Li、Benan Nalbant、Abdul Dozic、Laura Kida、Caleb Lareau
bioRxiv 2025.12.12.694033 • 代码

用于小分子免疫传感的蛋白质竞争者从头设计
Yosta de Stigter、Tallie Godschalk、Maarten Merkx
bioRxiv 2025.12.16.694474 • 补充材料

2.1.3 基于DMPfold2

在黑暗中设计：学习深度生成模型用于从头蛋白质设计
Moffat、Lewis、Shaun M. Kandathil 和 David T. Jones
bioRxiv（2022） • DMPfold2

2.1.4 基于DeepAb

迈向针对特定靶标的抗体设计深度学习模型
Sai Pooja Mahajan、Jeffrey Ruffolo、Rahel Frick、Jeffrey J. Gray
生物物理杂志 121.3（2022） • DeepAb • 讲座

为靶标特异性结合剂幻觉生成结构条件下的抗体文库
Sai Pooja Mahajan、Jeffrey A Ruffolo、Rahel Frick、Jeffrey J. Gray
bioRxiv 2022.06.06.494991/Front. Immunol. 13:999034 • 补充材料 • 代码

2.1.5 基于TRDesign

TRDesign新闻
 TIANRANG XLab
论文未公开 • 幻灯片 • 网站 • 商业化 • 新闻

2.1.6 基于Boltz

Boltzdesign1：反演全原子结构预测模型以实现广义生物分子结合剂设计
Yehlin Cho、Martin Pacesa、Zhidian Zhang、Bruno E. Correia、Sergey Ovchinnikov
bioRxiv 2025.04.06.647261 • 代码

2.1.7 基于RareFold

RareFold：具有非经典氨基酸的蛋白质结构预测与设计
Qiuzhen Li、Diandra Daumiller、Patrick Bryant
bioRxiv 2025.05.19.654846 • 代码

2.1.8 基于HelixFold

HelixDesign-Binder：基于HelixFold3构建的可扩展生产级结合剂设计平台
Jie Gao、Jun Li、Jing Hu、Shanzhuo Zhang、Kunrui Zhu、Yueyang Huang、Xiaonan Zhang、Xiaomin Fang
arXiv:2505.21873 • 基于ESM-IF

HelixDesign-Antibody：基于HelixFold3构建的可扩展生产级抗体设计平台
Jie Gao、Jing Hu、Shanzhuo Zhang、Kunrui Zhu、Sheng Qian、Yueyang Huang、Xiaonan Zhang、Xiaomin Fang
arXiv:2507.02345 • 网站

2.1.9 基于ESMfold

在序列空间中通过平行退火设计蛋白质
Preet Kalani、Vojtěch Spiwok
蛋白质科学 34.10（2025）

2.1.10 基于tFold

通过结构驱动的计算工作流程从头设计表位特异性抗体
Fandi Wu、Yu Zhao、JiaXiang Wu、Biaobin Jiang、Bing He、Longkai Huang、Chenchen Qin、Yang Xiao、Fan Yang、Rubo Wang、Ningqiao Huang、Huaxian Jia、Yuyi Liu、Houtim Lai、Tingyang Xu、Fang Wang、Zihan Wu、Yidong Song、Shaoning Li、Wei Liu、Yu Rong、Peilin Zhao 和 Jianhua Yao
Nat Commun（2025） • 代码

2.1.11 基于Chai

包括蛋白质柔性和构象适应在内的从头设计蛋白质配体
Jakob Agamia、Martin Zacharias
bioRxiv 2026.01.08.698398 • 代码 • 补充材料

2.2 CM-Align

AutoFoldFinder：用于从头蛋白质折叠设计的自动化自适应优化工具包
Shuhao Zhang、Youjun Xu、Jianfeng Pei、Luhua Lai
NeurIPS 2021

2.3 基于MSA-transformer

基于多序列比对训练的蛋白质语言模型能够学习系统发育关系
Damiano Sgarbossa、Umberto Lupo、Anne-Florence Bitbol
arXiv预印本 arXiv:2203.15465（2022）/bioRxiv 2022.04.14.488405

EvoOpt：一种由MSA引导、完全无监督的序列优化管道，用于蛋白质设计
Hideki Yamaguchi、Yutaka Saito
NeurIPS 2022

基于多序列比对训练的蛋白质语言模型的生成能力
Sgarbossa、Damiano、Umberto Lupo 和 Anne-Florence Bitbol
Elife 12（2023）：e79854 • 代码

2.4 基于大语言模型

2.4.1 基于GPT

用于深度流形采样的多片段保留采样 丹尼尔·贝伦伯格、李在贤、西蒙·凯洛、朴智源、安德鲁·沃特金斯、弗拉基米尔·格利戈里耶维奇、理查德·邦诺、史蒂芬·拉、曹庆贤 arXiv预印本 arXiv:2205.04259 (2022)

作为多目标结合物设计范式的蛋白质语言模型偏好优化 普里亚·米斯塔尼、文卡特什·梅索尔 arXiv:2403.04187

HMAMP：超体积驱动的多目标抗菌肽设计 王莉、李一平、付向征、叶秀才、石俊峰、加里·G·延、曾祥祥 arXiv:2405.00753

2.4.2 基于ESM

利用掩码语言模型的吉布斯采样生成新型蛋白质序列 肖恩·R·约翰逊、萨拉·莫纳科、肯尼思·马西、扎伊德·赛义德 bioRxiv 2021.01.26.428322 • 代码

用于生成式蛋白质设计的高级编程语言 布莱恩·希、萨尔瓦托雷·坎迪多、林泽明、奥里·卡贝利、罗山·饶、尼基塔·斯梅塔宁、汤姆·塞尔库、亚历山大·里夫斯 bioRxiv 2022.12.21.521526

语言模型的泛化能力超越天然蛋白质 罗伯特·韦库伊尔、奥里·卡贝利、杜一伦、巴斯勒·IM·维基、卢卡斯·F·米勒斯、尤斯塔斯·道帕拉斯、大卫·贝克、谢尔盖·奥夫钦尼科夫、汤姆·塞尔库、亚历山大·里夫斯 bioRxiv 2022.12.21.521521

ESMFold 幻觉出类天然蛋白质序列 杰利亚兹科·R·杰利亚兹科夫、迭戈·德尔阿拉莫、乔尔·D·卡尔皮亚克 bioRxiv 2023.05.23.541774

蛋白质语言模型监督下的精确高效蛋白质主链设计方法 张博、刘可欣、郑卓奇、刘云飞阳、穆俊熙、魏婷、陈海峰 bioRxiv 2023.10.26.564121/预印本 • 代码 • 补充材料

由折叠调优型语言模型库大规模揭示的蛋白质序列-结构图未探索区域 阿朱纳·M·苏布拉马尼安、马特·汤姆森 bioRxiv 2023.12.22.573145

神经网络生成酶的计算评分与实验评估 肖恩·R·约翰逊、傅晓志、桑德拉·维克南德、克拉拉·戈尔丁、萨拉·莫纳科、阿列克谢·泽列兹尼亚克及凯文·K·杨自然生物技术（2024） • 代码

利用蛋白质语言模型探索潜在空间以生成肽类似物 梁博宇、黄雪婷、蒂博·杜兰、安德鲁·J·威默、白俊 arXiv:2408.08341 • 代码

借助大型语言模型闭环设计多样且高性能蛋白质 卡洛斯·A·戈麦斯-乌里韦、贾菲斯·加多、梅尔别克·伊斯兰诺夫 bioRxiv 2024.10.25.620340

钥匙切割机：一种用于定制化蛋白质和肽设计的新颖优化框架 颜·C·莱瓦、马塞洛·D·T·托雷斯、卡洛斯·A·奥利瓦、塞萨尔·德拉富恩特-努涅斯、卡洛斯·A·布里苏埃拉 bioRxiv 2025.01.05.631393 • 代码

通过基础模型衍生的潜在空间似然优化提升功能性蛋白质生成 关昌格、万芳平、马塞洛·D·T·托雷斯、塞萨尔·德拉富恩特-努涅斯 bioRxiv 2025.01.07.631724 • 补充材料

DPAC：基于序列的对比学习预测与设计蛋白质-DNA相互作用 陈天来、里沙布·普卢古尔塔、普拉奈·武雷、普拉南·查特吉 bioRxiv 2025.05.14.654102 • 代码

BAGEL：通过探索能量景观进行蛋白质工程 雅库布·拉拉、艾哈姆·阿尔-萨法尔、斯特凡诺·安吉奥莱蒂-乌贝尔蒂 bioRxiv 2025.07.05.663138 • 代码

GeoEvoBuilder：用于高效功能性和耐热性蛋白质设计的深度学习框架 刘佳乐、郭政和赖陆华美国国家科学院院刊 122.41 (2025) • 代码

利用蛋白质折叠算法靶向药物内在无序表位 雅库布·拉拉、斯特凡诺·安吉奥莱蒂-乌贝尔蒂 bioRxiv 2025.11.11.687846

2.4.3 基于Antiberta

DyAb：低数据环境下基于序列的抗体设计与属性预测 林耀宇、詹妮弗·L·霍夫曼、安德鲁·利弗-费伊、梁伟青、斯特法尼亚·瓦西拉基、伊迪丝·李、佩德罗·O·皮涅罗、娜塔莎·塔加索夫斯卡、詹姆斯·R·基弗、吴燕、弗兰齐斯卡·西格尔、理查德·邦诺、弗拉基米尔·格利戈里耶维奇、安德鲁·沃特金斯、曹庆贤、内森·C·弗雷 bioRxiv 2025.01.28.635353 • 代码 • 补充材料

基于能量景观的方法利用蛋白质语言模型嵌入实现酶的小型化 雅库布·拉拉、哈什·阿格拉瓦尔、董凡飞、朱德·威尔斯、斯特凡诺·安吉奥莱蒂-乌贝尔蒂 bioRxiv 2026.03.04.709378

2.5 采样算法

AdaLead：一种简单且鲁棒的自适应贪心搜索算法，用于序列设计 萨姆·西奈、理查德·王、亚历山大·沃特利、斯图尔特·斯洛克姆、埃莉娜·洛卡内、埃里克·D·凯尔西 arXiv 预印本 arXiv:2010.02141 (2020) • 代码

基于模型设计的自动聚焦预言机 范江、克拉拉、珍妮弗·利斯特加滕神经信息处理系统进展第33卷（2020）

蛋白质结构预测中能量函数优化的高效 MCMC 方法 拉克什米·A·甘塔萨拉、里西·贾伊斯瓦尔、苏普里约·达塔 arXiv:2211.03193

基于梯度的离散 MCMC 插拔式蛋白质定向进化 帕特里克·埃马米、艾丹·佩罗、杰弗里·劳、大卫·比亚乔尼、彼得·圣约翰 NeurIPS 2022/arXiv:2212.09925

重要性加权期望-最大化方法在蛋白质序列设计中的应用 宋振桥、李磊 arXiv:2305.00386 • 补充材料

利用进化信息指导的蛋白质设计同时增强多种功能特性 本杰明·弗拉姆、伊恩·特鲁布里奇、苏阳、亚当·J·里塞尔曼、约翰·B·英格拉汉姆、亚历山德罗·帕塞拉、伊芙·纳皮尔、妮可·N·萨达尼、塞缪尔·林、克里斯汀·罗伯茨、古尔琳·考尔、迈克尔·斯蒂夫勒、黛博拉·S·马克斯、克里斯托弗·D·巴尔、阿米尔·R·汗、克里斯·桑德、尼古拉斯·P·高蒂耶 bioRxiv（2023）：2023-05

使用基于图的平滑 Gibbs 采样优化蛋白质适应度 安德鲁·基尔杰纳、杰森·尹、拉曼·萨穆塞维奇、汤米·雅科拉、雷吉娜·巴尔齐莱、伊拉·菲特 arXiv:2307.00494 • 代码

为功能性蛋白质设计采样蛋白质语言模型 热雷米·泰迪·达尔马万、亚林·加尔、帕斯卡尔·诺丁 ICLR 2025 工作坊 LMRL

机器学习引导设计中的可靠算法选择 克拉拉·范江、朴智源 arXiv:2503.20767

为什么风险对蛋白质结合剂设计至关重要 图多尔-斯特凡·科特、伊戈尔·克拉夫丘克 arXiv:2504.00146

指导您最喜欢的蛋白质序列生成模型 熊俊豪、亨特·尼索诺夫、伊尚·高尔、珍妮弗·利斯特加滕 arXiv:2505.04823

利用图神经网络和 Metropolis 蒙特卡洛采样进行计算纳米抗体设计 王磊、何晓明、郭高星、钱新洲、黄强 bioRxiv 2025.06.08.658414 • 代码

具有多专家的蒙特卡洛树扩散用于蛋白质设计 刘雪峰、曹明轩、蒋松浩、罗晓、段小天、王梦迪、托宾·R·索斯尼克、徐金波、里克·史蒂文斯 arXiv:2509.15796

用于多样化蛋白质设计的松弛序列采样 具周焕、阿里斯托法尼斯·荣托吉安尼斯、班义恩·安德鲁、阿克塞尔·埃拉尔迪、尼古拉斯·富兰克林 arXiv:2510.23786

通过基于 Pareto 的协作优化的多智能体强化学习推进蛋白质设计 朱明明、饶嘉华、陈晓宇、袁千木、杨跃东 bioRxiv 2026.01.13.699365

3. 骨架构建功能

这些模型以笛卡尔坐标、接触图、距离图以及 φ 和 ψ 角度来设计主链/骨架/模板。包括条件/非条件生成模型。

3.1 基于 GAN 的

蛋白质结构的生成建模 阿南德、南拉塔、黄博思 NeurIPS 2018

完全可微分的全原子蛋白质主链生成 阿南德·南拉塔、拉斐尔·江口、黄博思 OpenReview ICLR 2019 工作坊 DeepGenStruct • 无代码

RamaNet：利用长短期记忆生成神经网络进行从头螺旋蛋白质主链设计 萨班、萨里、米哈伊尔·马尔科夫斯基 F1000Research 第9卷（2020） • 代码 • pyRosetta • tensorflow • 最大化蛋白质荧光

用于创建路径限定螺旋蛋白质的生成模型 尼古拉斯·B·伍德尔、瑞安·基布勒、巴西勒·维基、布莱恩·科文特里 bioRxiv 2023.05.24.542095 • 代码

3.2 基于自编码器的方法

基于自适应采样的鲁棒设计条件化 Brookes, David, Hahnbeom Park 和 Jennifer Listgarten
国际机器学习会议。PMLR，2019年 • 无代码

IG-VAE：通过直接生成三维坐标进行免疫球蛋白蛋白质的生成建模 Raphael R. Eguchi, Christian A. Choe, Po-Ssu Huang
Biorxiv（2020） • 无代码

通过可解释变分自编码器生成蛋白质三级结构 Xiaojie Guo, Yuanqi Du, Sivani Tadepalli, Liang Zhao, Amarda Shehu
arXiv 预印本 arXiv:2004.07119（2020） • 代码不可用

基于深度流形采样的功能导向蛋白质设计 Vladimir Gligorijevic, Stephen Ra, Daniel Berenberg, Richard Bonneau, Kyunghyun Cho
NeurIPS 2021 • 无代码

用于从头蛋白质设计的拓扑特征深度锐化 Zander Harteveld, Joshua Southern, Michaël Defferrard, Andreas Loukas, Pierre Vandergheynst, Micheal Bronstein, Bruno Correia
ICLR2022 药物发现中的机器学习。2022年 • 代码不可用

用于蛋白质设计的端到端深度结构生成模型 Boqiao Lai, matthew McPartlon, Jinbo Xu
bioRxiv 2022.07.09.499440

通过潜在构象优化进行表位特异性结合蛋白质的深度生成设计 Raphael R Eguchi, Christian A Choe, Udit Parekh, Irene S Khalek, Michael D Ward, Neha Vithani, Gregory R Bowman, Joseph G Jardine, Possu Huang
bioRxiv 2022.12.22.521698

利用深度生成模型进行蛋白质计算设计与优化 Boqiao Lai
arXiv:2408.17241 • 博士论文

CyclicCAE：用于高效异手性大环骨架采样的构象自编码器 Andrew C. Powers, P. Douglas Renfrew, Parisa Hosseinzadeh, Vikram Khipple Mulligan
bioRxiv 2025.02.21.639569

3.3 基于MLP的方法

用于蛋白质设计的以主链为中心的神经网络能量函数 Bin Huang, Yang Xu, Xiuhong Hu, Yongrui Liu, Shanhui Liao, Jiahai Zhang, Chengdong Huang, Jingjun Hong, Quan Chen & Haiyan Liu
Nature（2022） • 代码

具有空腔的蛋白质的从头设计：基于主链中心的神经网络能量函数 Yang Xu, Xiuhong Hu, Chenchen Wang, Yongrui Liu, Quan Chen
Haiyan Liu
Structure（2024）

3.4 基于扩散的方法

针对基序支架问题的蛋白质主链三维概率扩散建模 Brian L. Trippe, Jason Yim, Doug Tischer, Tamara Broderick, David Baker, Regina Barzilay, Tommi Jaakkola
arXiv:2206.04119/NeurIPS 2022/ICLR 2023 • 海报 • 补充材料 • 代码

ProteinSGM：基于分数的生成模型用于从头蛋白质设计 Jin Sub Lee, Philip M Kim
bioRxiv 2022.07.13.499967/Nat Comput Sci（2023） • 代码

通过折叠扩散生成蛋白质结构 Kevin E. Wu, Kevin K. Yang, Rianne van den Berg, James Y. Zou, Alex X. Lu, Ava P. Amini
arXiv:2209.15611/Nat Commun 15, 1059（2024） • 代码

通过等变扩散定向残基云生成新颖、可设计且多样的蛋白质结构 Yeqing Lin, Mohammed AlQuraishi
arXiv:2301.12485v3 • 代码 • 新闻

具有蛋白质主链生成应用的SE(3)扩散模型 Jason Yim, Brian L. Trippe, Valentin De Bortoli, Emile Mathieu, Arnaud Doucet, Regina Barzilay, Tommi Jaakkola
arXiv:2302.02277/ICLR 2023 • 代码 • 补充材料

用于蛋白质结构生成的潜在扩散模型 Cong Fu, Keqiang Yan, Limei Wang, Wing Yee Au, Michael McThrow, Tao Komikado, Koji Maruhashi, Kanji Uchino, Xiaoning Qian, Shuiwang Ji
arXiv:2305.04120

扩散模型中实用且渐近精确的条件采样 Luhuan Wu, Brian L. Trippe, Christian A. Naesseth, David M. Blei, John P. Cunningham
arXiv:2306.17775 • 代码

基于动力学信息的结构条件化蛋白质设计 Simon V. Mathis, Urszula Julia Komorowska, Mateja Jamnik, Pietro Lió
WCBICML2023/ICLR 2024

ForceGen：基于非线性机械展开响应的端到端从头蛋白质生成，使用蛋白质语言扩散模型 Bo Ni 和 David L. Kaplan 和 M. Buehler
arXiv:2310.10605/Science Advances 10.6（2024） • 补充材料 • 代码

DiffSDS：用于蛋白质主链修复的几何序列扩散模型 匿名
ICLR 2024/arXiv:2301.09642

一种用于条件扩散建模的框架及其在蛋白质设计基序支架中的应用 Kieran Didi, Francisco Vargas, Simon V Mathis, Vincent Dutordoir, Emile Mathieu, Urszula J Komorowska, Pietro Lio
arXiv:2312.09236

基于全局几何感知潜在编码改进的扩散蛋白骨架生成 张宇阳、刘宇航、马津娅、李敏、徐春富和龚海鹏
bioRxiv 2023.12.13.571602/Nat Mach Intell (2025)• 代码

利用SE(3)流匹配改进基序支架构建 杰森·尹、安德鲁·坎贝尔、埃米尔·马蒂厄、安德鲁·Y·K·冯、迈克尔·加斯特格、何塞·希门尼斯-卢纳、萨拉·刘易斯、维克托·加西亚·萨托拉斯、巴斯蒂安·S·维尔林、弗兰克·诺埃、雷吉娜·巴尔齐莱、汤米·S·雅科拉 arXiv:2401.04082/TMLR • 代码1,代码2

DiffTopo：利用粗粒度蛋白质拓扑表示进行折叠探索 苗洋洋、布鲁诺·科雷亚 bioRxiv 2024.02.01.578456/ICLR 2024

蛋白质结构与对接中的扩散模型 杰森·尹、汉内斯·施塔克、加布里埃莱·科尔索、景博文、雷吉娜·巴尔齐莱、汤米·S·雅科拉 Wiley跨学科评论：计算分子科学 14.2 (2024) • 综述

基于SE(3)扩散的从头抗体设计 丹尼尔·卡廷、弗雷德里克·A·德雷耶、大卫·埃林顿、康斯坦丁·施奈德、夏洛特·M·迪恩 arXiv:2405.07622

众里寻一：利用Genie 2在结构宇宙尺度上设计与搭建蛋白质 林叶青、李敏智、张兆、穆罕默德·阿尔库赖希 arXiv:2405.15489 • 代码 • 新闻

DSG2-mini DiffuseBio 技术附录 • 网站 • 商业化

用于多基序支架构建的浮动锚点扩散模型 刘凯、毛伟安、沈帅科、焦晓然、孙正、陈浩、沈春华 ICML 2024/arXiv:2406.03141 • 代码 • 海报

用于GPCR研究的融合蛋白工具的从头设计 高凯轩、张欣、聂佳、孟恒宇、张伟设、田博雪、刘向宇 bioRxiv 2024.09.14.613090/美国国家科学院院刊 122.29 (2025) • 补充材料 • 基于RF扩散

Text2Protein：基于给定描述的指定蛋白质设计生成模型 拉姆廷·侯赛尼、张思扬、谢鹏涛预印本（第1版）可在Research Square上获取 • 代码

通过顺序蒙特卡洛进行扩散后验采样，实现蛋白质基序的零样本支架构建 杨、詹姆斯·马修·乌永戈科和奥梅尔·德尼兹·阿基尔迪兹帝国理工学院科学、技术和医学学院，2024年 • 代码 • 硕士论文 • 基于Genie

基于扩散和ESM2模型的类似蛋白A肽的设计 赵龙、何强、宋慧嘉、周天谦、罗安、文振国、王腾和林晓竹 Molecules 29.20 (2024) • 代码

FoldMark：通过水印保护蛋白质生成模型 张在熙、金若凡、傅凯迪、黎聪、马林卡·齐特尼克、王梦迪 arXiv:2410.20354 • 代码

ProteinWeaver：一种用于蛋白质骨架设计的分而治之方法 马一鸣、叶飞、周毅、郑在祥、薛东宇、顾全全 arXiv:2411.16686

关于通过顺序蒙特卡洛进行扩散后验采样以实现蛋白质基序的零样本支架构建 詹姆斯·马修·杨、O·德尼兹·阿基尔迪兹 arXiv:2412.05788 • 代码

从热力学到蛋白质设计：面向自主蛋白质工程的生物分子生成扩散模型 李文然、泽维尔·F·卡代、大卫·梅迪纳-奥尔蒂斯、梅赫迪·D·达瓦里、拉马纳坦·索德哈米尼、塞德里克·达穆尔、李宇、阿兰·米兰维尔、弗雷德里克·卡代 arXiv:2501.02680 • 综述

RF扩散在用于生化检测的功能性蛋白质结合剂的从头设计中表现出较低的成功率 布鲁斯·江、李晓晓、郭安珀、莫里斯·魏、吴乔尼 bioRxiv 2025.02.07.636769

从原子到片段：用于高效且功能性蛋白质设计的粗粒度表示 莱昂纳多·V·卡斯托里纳、克里斯托弗·W·伍德、卡尔蒂克·苏布 bioRxiv 2025.03.19.644162 • 补充材料 • 基于RF扩散

基于潜在空间和结构扩散的分层蛋白质骨架生成 杰森·尹、马鲁安·贾基克、刘戈、雅各布·格申、卡斯滕·克莱斯、戴维·贝克、雷吉娜·巴尔齐莱、汤米·雅科拉 ICLR 2025

原子之舞——基于扩散模型的从头蛋白质设计 秦宇杰、何明、于昌勇、倪明、刘贤、薄晓晨 arXiv:2504.16479 • 综述

ProT-GFDM：用于蛋白质生成的生成式分数阶扩散模型
梁晓、马文涛、埃里克·帕克、埃尔娜·莉迪娅·维克托、沃伊切赫·米哈洛夫斯基 arXiv:2504.21092

NMA-tune：生成高度可设计且考虑动态特性的蛋白质骨架
乌尔舒拉·朱莉娅·科莫罗夫斯卡、弗朗西斯科·巴尔加斯、亚历山德罗·隆迪纳、皮耶特罗·利奥、马泰娅·雅姆尼克
ICML 2025海报

AIDO.StructureDiffusion：用于分子设计的AIDO模块
GenBio团队
 网站

从头设计磷酸化诱导的蛋白质开关，用于细胞中的合成信号传导
斯蒂芬·巴克利、苗阳阳、穆巴拉克·伊德里斯、李宝婉、利奥·谢勒、罗兰·里克、塞巴斯蒂安·J·马克尔、卢西亚诺·A·阿布里亚塔、布鲁诺·E·科雷亚
bioRxiv 2025.09.10.675034

具有严格结构约束的蛋白质设计中的受限扩散
雅各布·K·克里斯托弗、奥斯汀·西曼、崔静怡、萨加尔·卡雷、费迪南多·菲奥雷托
bioRxiv 2025.10.15.682365

通过费曼-卡茨引导实现可控的蛋白质设计
埃里克·哈特曼、乔纳斯·瓦林、约翰·马尔姆斯特伦、吉米·奥尔松
arXiv:2511.09216 • 代码

基于嵌入学习的蛋白质生成，用于基序多样化
凯文·米夏列维奇、金晨、菲利普·亚历山大·蒂尔、汤姆·迪特、毛里西奥·巴拉霍纳、芭芭拉·布拉维、阿舍尔·穆洛坎多夫
arXiv:2510.18790

扭转空间扩散法用于蛋白质主链生成及几何精修
拉克沙迪提亚·辛格、阿德瓦特·谢尔克、迪万尚·阿格瓦尔
arXiv:2511.19184

SaDiT：基于潜在结构标记和扩散变换器的高效蛋白质主链设计
莫申通、李兰青
arXiv:2602.06706

3.5 基于强化学习的方法

利用强化学习自上而下设计蛋白质纳米材料
艾萨克·D·卢茨、王顺志、克里斯托弗·诺恩、安德鲁·J·博斯特、赵艳婷、安妮·多西、曹龙兴、李哲、白敏京、尼尔·P·金、汉内莱·鲁霍拉-贝克、大卫·贝克
bioRxiv 2022.09.25.509419/Science380, 266-273(2023) • 代码,代码2

基于模型的强化学习用于蛋白质主链设计
弗雷德里克·雷纳尔、西普里安·库尔托、阿尔弗雷多·赖克林、奥利弗·本特
arXiv:2405.01983

基于目标的环肽结合蛋白从头设计
王凡浩、张天田、朱金涛、张晓玲、张昌盛、赖陆华
bioRxiv 2025.01.18.633746 • 补充资料

3.6 基于流的方法

SE(3)-随机流匹配用于蛋白质主链生成
阿维谢克·乔伊·博斯、塔拉·阿洪德-萨德格、基利安·法特拉斯、纪尧姆·于盖、贾里德·雷克托-布鲁克斯、刘成浩、安德烈·克里斯蒂安·尼卡、马克西姆·科拉布廖夫、迈克尔·布朗斯坦、亚历山大·通
arXiv:2310.02391/ICLR 2024

利用SE(3)流匹配快速生成蛋白质主链
杰森·尹、安德鲁·坎贝尔、安德鲁·Y·K·冯、迈克尔·加斯特格尔、何塞·希门尼斯-卢纳、莎拉·刘易斯、维克托·加西亚·萨托拉斯、巴斯蒂安·S·维尔林、雷吉娜·巴尔齐莱、汤米·雅科拉、弗兰克·诺埃
arXiv:2310.05297 • 代码

序列增强的SE(3)流匹配用于条件性蛋白质主链生成
纪尧姆·于盖、詹姆斯·武科维奇、基利安·法特拉斯、埃里克·蒂博多-劳费尔、巴勃罗·莱莫斯、里亚沙特·伊斯兰、刘成浩、贾里德·雷克托-布鲁克斯、塔拉·阿洪德-萨德格、迈克尔·布朗斯坦、亚历山大·通、阿维谢克·乔伊·博斯
arXiv:2405.20313/NeurIPS 2024 • 网站 • 讲座

利用原子流匹配设计配体结合蛋白质
刘俊奇、李绍宁、施辰策、杨智、唐健
arXiv:2409.12080

ReQFlow：修正四元数流用于高效高质量的蛋白质主链生成
岳昂霄、王子冲、许鸿腾
arXiv:2502.14637 • 代码

Proteina：扩展基于流的蛋白质结构生成模型
托马斯·格夫纳、基兰·迪迪、张佐白、丹尼·赖登巴赫、曹忠林、杰森·尹、马里奥·盖格、克里斯蒂安·达拉戈、埃米内·库丘克本利、阿拉什·瓦赫达特、卡斯滕·克莱斯
ICLR 2025 口头报告 • 代码 • 网站 • 讲座

ProtComposer：基于3D椭球的组合式蛋白质结构生成
汉内斯·斯塔克、景博文、托马斯·格夫纳、杰森·尹、汤米·雅科拉、阿拉什·瓦赫达特、卡斯滕·克莱斯
ICLR 2025 口头报告 • 代码 • 讲座

稳健可靠的从头蛋白质设计：基于流匹配的蛋白质生成模型实现了极高的成功率
闫俊宇、崔子博、严文清、陈宇航、蒲孟晨、李帅、叶晟
bioRxiv 2025.04.29.651154 • 代码

基于流匹配的柔性条件化蛋白质结构设计
弗谢沃洛德·维柳加、莱夫·绍特、尼古拉斯·沃尔夫、西蒙·瓦格纳、阿内·埃洛夫松、扬·施图默、弗劳克·格雷特
ICML 2025

深度生成式蛋白质设计的挑战与指南：四个案例研究
郑天元、亚历山德罗·隆迪纳、戈斯·米克勒姆、皮耶特罗·利奥
FM4LS 2025

让物理学指引你的蛋白质流：拓扑感知的展开与生成
约格什·维尔马、马库斯·海诺宁、维卡斯·加格
arXiv:2509.25379

蒸馏式蛋白质主链生成
谢立洋、张浩然、王振东、韦斯利·坦西、周明远
arXiv:2510.03095

流，直而不疾：探索修正流在蛋白质设计中的设计空间
陈俊华、西蒙·马蒂斯、查尔斯·哈里斯、基兰·迪迪、皮耶特罗·利奥
arXiv:2510.24732

通过流匹配和体内成熟设计高亲和力蛋白质结合剂
于启林、郭梁悦、秦夏燕、黄锡坤、田柏慧、王洪准、刘宇、郎云芝、王迪、沈周涵宇、林杰以及陈明晨
预印本 • 代码

3.7 基于评分

基于评分的生成模型用于设计结合肽骨架
约翰·D·布姆、马修·格林尼格、皮耶特罗·索尔曼尼、皮耶特罗·利奥
arXiv:2310.07051 • 代码

提升深度生成蛋白质设计的信心
郑天元、亚历山德罗·隆迪纳、皮耶特罗·利奥
arXiv:2411.18568 • 代码

3.8 自回归

基于多尺度结构生成的蛋白质自回归建模
瞿燕茹、谢承延、郑在祥、刘戈、顾全权
arXiv:2602.04883

4. 骨架到序列

根据给定的主链/骨架/模板约束确定氨基酸序列：包括扭转角(φ & ψ)、主链角度(θ和τ)、主链二面角(φ、ψ和ω)、主链原子(Cα、N、C和O)、Cα−Cα距离、Cα−Cα、Cα−N和Cα−C的单位方向向量等（即逆折叠）。参考自这里。此外，还包含基于能量的模型，用于恢复侧链构象（χ角或原子坐标）。

4.0 综述

基于深度学习的给定主链蛋白质序列设计
刘宇峰、刘海燕
Protein Engineering, Design and Selection, 2023

深度学习驱动的蛋白质序列设计方法的多指标比较评估
于金宇、穆俊熙、魏婷、陈海峰
Bioinformatics, 2024;, btae037

可控蛋白质序列设计的生成式AI：综述
朱一恒、孔子泰、吴嘉璐、刘伟泽、韩宇强、尹明泽、徐红霞、谢昌宇、侯廷军
arXiv:2402.10516

主链条件下的蛋白质序列设计
尤斯塔斯·道帕拉斯
Cold Spring Harbor Perspectives in Biology (2025)

通过逆折叠模型进行零样本蛋白质稳定性预测：自由能解释
杰斯·弗雷尔森、马赫尔·M·卡塞姆、托内·本格森、拉斯·奥尔森、克雷斯滕·林多夫-拉森、杰斯珀·费尔金霍夫-博格、沃特·布姆斯马
arXiv:2506.05596

4.1 基于MLP

氨基酸的3D表示——应用于蛋白质序列比较与分类
李洁和帕特里斯·科埃尔
Computational and Structural Biotechnology Journal 11.18 (2014) • 2014年

利用基于片段的局部特征和基于能量的非局部特征，通过神经网络直接预测与蛋白质结构相容的序列谱
李志秀、杨跃东、埃舍尔·法拉吉、詹健、周耀奇
Proteins: Structure, Function, and Bioinformatics 82.10 (2014) • 代码不可用

SPIN2：使用深度神经网络从蛋白质结构预测序列谱
詹姆斯·奥康奈尔、李志秀、杰克·汉森、瑞斯·赫弗南、詹姆斯·莱昂斯、库尔迪普·帕利瓦尔、阿卜杜拉·德赞吉、杨跃东、周耀奇
Proteins: Structure, Function, and Bioinformatics 86.6 (2018) • 代码不可用

利用深度学习神经网络进行蛋白质计算设计
王静雪、曹华莉、张志恒和齐义飞
Scientific Reports 8.1 (2018) • 代码不可用

利用蛋白质自身接触进行配体感知的蛋白质序列设计
乔迪·牟、本杰明·弗莱、姚春辰、尼古拉斯·波利齐
NeurIPS 2022

SeqPredNN：一种能够生成折叠成指定三级结构的蛋白质序列的神经网络
拉特甘、F·阿德里安、卡罗琳·施赖伯和休·G·帕特顿
BMC Bioinformatics 24.1 (2023) • 代码

4.2 基于VAE

利用变分自编码器设计金属蛋白和新型蛋白质折叠
格林纳、乔·G、刘易斯·莫法特和戴维·T·琼斯
Scientific Reports 8.1 (2018)

AlphaFold数据库去偏以实现稳健的逆折叠
程坦、曹振晓、高章阳、李思远、黄宇飞、李斯坦 Z
arXiv:2506.08365

DivPro：具有直接结构恢复指导的多样化蛋白质序列设计
周欣怡、沈贵宝、陈英聪、陈广勇、彭安恒
Bioinformatics (2025) • 代码

4.3 基于LSTM

通过残基间距离图的图像描述改进蛋白质序列谱预测
陈盛、孙哲、林丽华、刘子峰、刘勋、崇玉田、陆宇彤、赵慧英和杨跃东
Journal of Chemical Information and Modeling 60.1 (2019) • SPROF

蛋白质—蛋白质相互作用的深度学习蛋白质序列设计
瑟尔利巴耶娃、劳莉娅和伊娃-玛丽亚·施特劳赫
bioRxiv (2022)/Bioinformatics, 2022;, btac733 • 补充材料 • 代码

4.4 基于卷积神经网络

基于结构的蛋白质工程深度学习框架 拉加夫·什罗夫、奥斯汀·W·科尔、巴雷特·R·莫罗、丹尼尔·J·迪亚斯、艾萨克·多内尔、吉米·戈利哈尔、安德鲁·D·埃林顿、罗斯·泰耶 bioRxiv（2019）

ProDCoNN：利用卷积神经网络进行蛋白质设计 张源、陈洋、王晨然、罗春潮、刘秀文、吴伟、张金峰《蛋白质：结构、功能与生物信息学》88.7期（2020） • 代码不可用

基于学习势能的蛋白质序列设计 纳姆拉塔·阿南德、拉斐尔·江口、伊林潘·I·马修斯、卡拉·P·佩雷斯、亚历山大·德里、罗斯·B·奥特曼及黄博思《自然通讯》（2022） • 代码

TIMED-Design：利用卷积神经网络实现灵活且易用的蛋白质序列设计 莱昂纳多·V·卡斯托里纳、苏莱曼·梅尔特·于纳尔、卡尔蒂克·苏布尔、克里斯托弗·W·伍德《蛋白质工程、设计与选择》，2024年 • 代码 • 网站

基于生物传感器和机器学习的石蒜科酶工程改造 西蒙·德厄尔斯尼茨、丹尼尔·J·迪亚斯、金万泰、丹尼尔·J·阿科斯塔、泰勒·L·丹杰菲尔德、梅森·W·谢赫特、马修·B·米纳斯、詹姆斯·R·霍华德、汉娜·多、詹姆斯·M·洛伊、哈尔·S·阿尔珀、Y·杰西·张及安德鲁·D·埃林顿《自然通讯》15.1期（2024） • 代码1、代码2

OPUS-Design：基于主链结构，结合3D卷积神经网络与蛋白质语言模型进行蛋白质序列设计 许刚、杨雨露、张一秋、王庆华、马建鹏 bioRxiv 2024.08.20.608889 • 代码

ProBID-Net：用于蛋白质—蛋白质结合界面设计的深度学习模型 陈志航、季梦琳、齐洁娜、张哲、张向英、高浩天、王浩杰、王仁晓、齐一飞《化学科学》（2024） • 代码

4.5 基于图神经网络

利用几何向量感知器从蛋白质结构中学习 景博文、施特凡·艾斯曼、帕特里夏·苏里亚纳、拉斐尔·J.L. 汤申德、罗恩·德罗尔 arXiv预印本 arXiv:2009.01411（2020）/ICLR（2021） • GVP

利用深度图神经网络实现快速灵活的蛋白质设计 阿列克谢·斯特罗卡奇、大卫·贝塞拉、卡莱斯·科尔比-韦尔赫、阿尔伯特·佩雷斯-里瓦、菲利普·M·金《细胞系统》（2020） • 代码：ProteinSolver

拟态神经网络：蛋白质设计与折叠的统一框架 摩西·埃利亚索夫、图·博森、埃尔达德·哈伯、陈·凯萨尔、埃兰·特赖斯特 arXiv:2102.03881/Front. Bioinform. 2:715006

TERMinator：基于三级重复基序的结构导向型神经网络蛋白质设计框架 亚历克斯·J·李、维克拉姆·桑达尔、格沃格·格里戈里扬、艾米·E·基廷 NeurIPS 2021 / arXiv（2022）

一种基于神经网络的模型，用于根据蛋白质主链结构预测氨基酸概率 南美新太郎、佐久间耕也、小林直也尚未发表（2021年6月）• GCNdesgin

XENet：利用新型图卷积加速量子计算机上的蛋白质设计进程 杰克·B·麦圭尔、达尼埃莱·格拉塔罗拉、维克拉姆·希普尔·穆利根、尤金·克利什科、汉斯·梅洛《PLoS计算生物学》17.9期（2021）

AlphaDesign：一种基于图的蛋白质设计方法，并在AlphaFoldDB上进行基准测试 高、张阳、程坦和斯坦·李 arXiv预印本 arXiv:2202.01079（2022） • 代码

具有全局上下文的生成式从头蛋白质设计 程坦、张耀高、夏俊和斯坦·Z·李 arXiv • 2022年4月 • 代码

利用序列迁移进行掩码反折叠以实现蛋白质表示学习 凯文·K·杨、休·叶、尼科洛·扎尼凯利 bioRxiv 2022.05.25.493516/《蛋白质工程、设计与选择》36期（2023） • 代码 • 模型

利用ProteinMPNN实现稳健的基于深度学习的蛋白质序列设计 尤斯塔斯·道帕拉斯、伊万·阿尼申科、纳撒尼尔·贝内特、白华、罗伯特·J·拉戈特、卢卡斯·F·米勒斯、巴西勒·I·M·威基、阿莱克西斯·库尔贝、罗伯特·J·德哈斯、内维尔·贝塞尔、菲利普·J·Y·梁、蒂莫西·F·哈迪、萨姆·佩洛克、道格·提舍尔、弗雷德里克·陈、布赖恩·科普尼克、汉娜·阮、亚历克斯·康、巴努马蒂·桑卡兰、阿西姆·贝拉、尼尔·P·金、大卫·贝克 bioRxiv 2022.06.03.494563/《科学》（2022） • 代码 • Hugging Face • 讲座 • Colab（in_jax） • ProteinMPNN+ESMFold

通过层次化等变精炼进行抗体—抗原对接与设计 金、温功、雷吉娜·巴尔齐莱以及汤米·雅各拉 arXiv预印本 arXiv:2207.06616（2022）/国际机器学习大会。PMLR，2022年 • 代码 • 海报

基于骨架原子坐标和三级基序的结构导向蛋白质设计的神经网络衍生Potts模型 Alex J. Li、Mindren Lu、Israel Desta、Vikram Sundar、Gevorg Grigoryan 和 Amy E. Keating bioRxiv 2022.08.02.501736/Protein Science, 32(2)

作为基于能量模型的SE(3)等变图注意力网络用于蛋白质侧链构象 Deqin Liu、Sheng Chen、Shuangjia Zheng、Sen Zhang、Yuedong Yang bioRxiv 2022.09.05.506704 • 代码

PiFold：迈向高效且有效的蛋白质逆折叠 Zhangyang Gao、Cheng Tan、Stan Z. Li arXiv:2209.12643v2/ICLR 2023 • github

基于熵的迭代优化的蛋白质序列设计 Xinyi Zhou、Guangyong Chen、Junjie Ye、Ercheng Wang、Jun Zhang、Cong Mao、Zhanwei Li、Jianye Hao、Xingxu Huang、Jin Tang、Pheng Ann Heng bioRxiv 2023.02.04.527099

轻量级对比学习的蛋白质结构-序列转换 Jiangbin Zheng、Ge Wang、Yufei Huang、Bozhen Hu、Siyuan Li、Cheng Tan、Xinwen Fan、Stan Z. Li arXiv:2303.11783

利用几何向量场网络建模蛋白质结构 Weian Mao、Muzhi Zhu、Hao Chen、Chunhua Shen bioRxiv 2023.05.07.539736

知识设计：通过知识精炼突破蛋白质设计的极限 Zhangyang Gao、Cheng Tan、Stan Z. Li arXiv:2305.15151/ICLR • 代码

SPIN-CGNN：基于接触图构建与接触图神经网络的固定骨架蛋白质设计改进 Xing Zhang、Hongmei Yin、Fei Ling、Jian Zhan、Yaoqi Zhou bioRxiv 2023.07.07.548080/PLOS Computational Biology • 代码

ZetaDesign：一种端到端的深度学习方法，用于蛋白质序列设计和侧链填充 Junyu Yan 等人 Briefings in Bioinformatics, 2023 • 代码

来自等变图变换器的上下文蛋白编码 Sai Pooja Mahajan、Jeffrey A. Ruffolo、Jeffrey J. Gray bioRxiv 2023.07.15.549154 • 代码

使用机器学习工具ProteinMPNN稳健设计Rsp5 E3连接酶的有效别构激活剂 Hsi-Wen Kao、Wei-Lin Lu、Meng-Ru Ho、Yu-Fong Lin、Yun-Jung Hsieh、Tzu-Ping Ko、Shang-Te Danny Hsu 和 Kuen-Phon Wu ACS Synthetic Biology (2023) • 补充材料

使用ProteinMPNN快速自动化设计双组分蛋白质纳米材料 Robbert J. de Haas、Natalie Brunette、Alex Goodson、Justas Dauparas、Sue Y. Yi、Erin C. Yang、Quinton Dowling、Hannah Nguyen、Alex Kang、Asim K. Bera、Banumathi Sankaran、Renko de Vries、David Baker、Neil P. King bioRxiv 2023.08.04.551935/美国国家科学院院刊 121.(13) • 补充材料 • 数据

理性种子引导的计算蛋白质设计 Katherine I. Albanese、Rokas Petrenas、Fabio Pirro、Elise A. Naudin、Ufuk Borucu、William M. Dawson、D. Arne Scott、Graham J. Leggett、Orion D. Weiner、Thomas A. A. Oliver、Derek N. Woolfson bioRxiv 2023.08.25.554789 • 代码

序列特异性DNA结合蛋白的计算设计 Cameron J Glasscock、Robert Pecoraro、Ryan McHugh、Lindsey A. Doyle、Wei Chen、Olivier Boivin、Beau Lonnquist、Emily Na、Yuliya Politanska、Hugh K Haddox、David Cox、Christoffer Norn、Brian Coventry、Inna Goreshnik、Dionne Vafeados、Gyu Rie Lee、Raluca Gordan、Barry L Stoddard、Frank DiMaio、David Baker bioRxiv 2023.09.20.558720/Nat Struct Mol Biol (2025) • 代码 • 补充材料

利用ProteinMPNN提升蛋白质表达、稳定性和功能 Kiera H. Sumida、Reyes Núñez Franco、Indrek Kalvet、Samuel J. Pellock、Basile I. M. Wicky、Lukas F. Milles、Justas Dauparas、Jue Wang、Yakov Kipnis、Noel Jameson、Alex Kang、Joshmyn De La Cruz、Banumathi Sankaran、Asim K Bera、Gonzalo Jimenez Oses、David Baker bioRxiv 2023.10.03.560713/J. Am. Chem. Soc. 2024 • 补充材料

基于机器学习算法和蛋白质片段化协议的设计蛋白笼系列 Kyle Meador、Roger Castells-Graells、Roman Aguirre、Michael R. Sawaya、Mark A. Arbing、Trent Sherman、Chethaka Senarathne、Todd O. Yeates bioRxiv 2023.10.09.561468 • 代码 • colab

基于序列profile的超快速形状识别蛋白质设计师 匿名 ICLR 2024

利用深度学习进行抗体序列设计的逆折叠 Frédéric A. Dreyer、Daniel Cutting、Constantin Schneider、Henry Kenlay、Charlotte M. Deane arXiv:2310.19513

别构可切换蛋白质组装体的从头设计 Arvind Pillai、Abbas Idris、Annika Philomin、Connor Weidle、Rebecca Skotheim、Philip J. Y. Leung、Adam Broerman、Cullen Demakis、Andrew J. Borst、Florian Praetorius、David Baker bioRxiv 2023.11.01.565167/Nature (2024) • 代码 • 数据

ProRefiner：基于熵的精炼策略，用于具有全局图注意力机制的反向蛋白质折叠 Xinyi Zhou、Guangyong Chen、Junjie Ye、Ercheng Wang、Jun Zhang、Cong Mao、Zhanwei Li、Jianye Hao、Xingxu Huang、Jin Tang、Pheng Ann Heng Nature Communications • 补充材料 • 代码

工程化免疫原以诱导针对保守冠状病毒表位的抗体 A. Brenda Kapingidza、Daniel J. Marston、Caitlin Harris、Daniel Wrapp、Kaitlyn Winters、Dieter Mielke、Lu Xiaozhi、Qi Yin、Andrew Foulger、Rob Parks、Maggie Barr、Amanda Newman、Alexandra Schäfer、Amanda Eaton、Justine Mae Flores、Austin Harner、Nicholas J. Catanzaro Jr.、Michael L. Mallory、Melissa D. Mattocks、Christopher Beverly、Brianna Rhodes、Katayoun Mansouri、Elizabeth Van Itallie、Pranay Vure、Brooke Dunn、Taylor Keyes、Sherry Stanfield-Oakley、Christopher W. Woods、Elizabeth A. Petzold、Emmanuel B. Walter、Kevin Wiehe、Robert J. Edwards、David C. Montefiori、Guido Ferrari、Ralph Baric、Derek W. Cain、Kevin O. Saunders、Barton F. Haynes 和 Mihai L. Azoitei Nat Commun 14, 7897 (2023) • 代码

DNDesign：通过去噪增强对蛋白质逆折叠模型物理理解的方法 Youhan Lee、Jaehoon Kim bioRxiv 2023.12.05.570298

利用生成式逆折叠技术设计出经体外验证的针对多种治疗性抗原的抗体 Amir Shanehsazzadeh、Julian Alverio、George Kasun、Simon Levine、Jibran A Khan、Chelsea Chung、Nicolas Diaz、Breanna K Luton、Ysis Tarter、Cailen McCloskey、Katherine B Bateman、Hayley Carter、Dalton Chapman、Rebecca Consbruck、Alec Jaeger、Christa Kohnert、Gaelin Kopec-Belliveau、John M Sutton、Zheyuan Guo、Gustavo Canales、Kai Ejan、Emily Marsh、Alyssa Ruelos、Rylee Ripley、Brooke Stoddard、Rodante Caguiat、Kyra Chapman、Matthew Saunders、Jared Sharp、Douglas Ganini da Silva、Audree Feltner、Jake Ripley、Megan E Bryant、Danni Castillo、Joshua Meier、Christian M Stegmann、Katherine Moran、Christine Lemke、Shaheed Abdulhaqq、Lillian R Klug、Sharrol Bachas bioRxiv 2023.12.08.570889

SPDesign：基于结构序列 profile 的超快速形状识别蛋白质序列设计工具 Hui Wang、Dong Liu、Kailong Zhao、Yajun Wang、Guijun Zhang bioRxiv 2023.12.14.571651/Briefings in Bioinformatics 25.3 (2024): bbae146 • 网站

利用形状互补假环设计多样化的低分子量结合物和传感器 Linna An、Meerit Said、Long Tran、Sagardip Majumder、Inna Goreshnik、Gyu Rie Lee、David Juergens、Justas Dauparas、Ivan Anishchenko、Brian Coventry、Asim K Bera、Alex Kang、Paul M Levine、Valentina Alvarez、Arvindd Pillai、Christoffer Norn、David Feldman、Dmitri Zorine、Derrick R Hicks、Xinting Li、Mariana Garcia Sanchez、Dionne K Vafeados、Patrick J Salveson、Anastassia A Vorobieva、David Baker bioRxiv 2023.12.20.572602/Science385,276-282(2024) • 代码1、代码2、代码3

基于配体MPNN的原子上下文条件蛋白序列设计 Justas Dauparas、Gyu Rie Lee、Robert Pecoraro、Linna An、Ivan Anishchenko、Cameron Glasscock、D. Baker bioRxiv 2023.12.22.573103/Nat Methods (2025) • 代码

基于结构条件的掩码语言模型在蛋白质序列设计中的应用超越了天然序列空间 Deniz Akpinaroglu、Kosuke Seki、Amy Guo、Eleanor Zhu、Mark J. S. Kelly、Tanja Kortemme bioRxiv 2023.12.15.571823 • 代码

ProteinMPNN 恢复跨膜 β-桶蛋白的复杂序列特性 Marissa D Dolorfino、Anastassia A Vorobieva bioRxiv 2024.01.16.575764 • 代码

DIProT：基于深度学习的交互式工具包，用于高效且有效的蛋白质设计 He, Jieling、Wenxu Wu 和 Xiaowo Wang 合成与系统生物技术 (2024)

利用标准化蛋白质模块构建可扩展纳米材料蓝图 Timothy F. Huddy、Yang Hsia、Ryan D. Kibler、Jinwei Xu、Neville Bethel、Deepesh Nagarajan、Rachel Redler、Philip J. Y. Leung、Connor Weidle、Alexis Courbet、Erin C. Yang、Asim K. Bera、Nicolas Coudray、S. John Calise、Fatima A. Davila-Hernandez、Hannah L. Han、Kenneth D. Carr、Zhe Li、Ryan McHugh、Gabriella Reggiano、Alex Kang、Banumathi Sankaran、Miles S. Dickinson、Brian Coventry、T. J. Brunette、Yulai Liu、Justas Dauparas、Andrew J. Borst、Damian Ekiert、Justin M. Kollman、Gira Bhabha 和 David Baker Nature (2024) • RosettaScripts

基于几何深度学习的全原子蛋白质序列设计 Jiale Liu、Zheng Guo、Changsheng Zhang、Luhua Lai bioRxiv 2024.03.18.585651/Angew. Chem. Int. Ed. 2024 • 代码

Graphormer 监督式从头蛋白质设计方法及功能验证 穆俊熙、李正欣、张博、张琪、贾姆谢德·伊克巴尔、阿卜杜勒·瓦杜德、魏婷、冯燕、陈海峰 Briefings in Bioinformatics 25.3 (2024): bbae135 • 代码

达米埃塔服务器：综合性蛋白质设计工具包 伊万·格林、卡捷琳娜·马克西门科、托比亚斯·沃特韦因、穆罕默德·埃尔加马西 Nucleic Acids Research, 2024;, gkae297 • 网站 • 基于 ProteinMPNN • 新闻、新闻2

基于结构的深度学习方法在T细胞受体设计中的潜力探索 赫尔德·V·里贝罗-菲略、加布里埃尔·E·哈拉、若昂·V·S·格拉、梅丽莎·张、纳撒尼尔·R·费尔宾格、若泽·G·C·佩雷拉、布莱恩·G·皮尔斯、保罗·S·洛佩斯-德-奥利维拉 bioRxiv 2024.04.19.590222 • 代码、代码2

SurfPro：基于连续表面的功能性蛋白质设计 宋振乔、黄廷林、李磊、金文功 arXiv:2405.06693 • 基于 ProteinMPNN

基于肌红蛋白的卡宾转移酶用于单萜衍生物化的计算设计 孙一洋、唐义年、周静、郭炳辰、袁飞燕、姚波、余阳、李春 Biochemical and Biophysical Research Communications (2024) • 代码 • 基于 LigandMPNN

UniIF：统一分子逆折叠 高章阳、王珏、谭成、吴立荣、黄宇飞、李思远、叶志锐、李斯坦 Z. arXiv:2405.18968

将MHC I类抗原呈递可见性目标整合到 ProteinMPNN 蛋白质设计流程中 汉斯-克里斯托夫·加瑟、迭戈·A·奥亚尔苏恩、哈维尔·安东尼奥·阿尔法罗、阿吉塔·拉詹 bioRxiv 2024.06.04.597365

自上而下的设计方法用于开发靶向雄激素受体的肽类PROTAC药物，用于治疗雄激素性脱发 马博文、刘东华、王哲、张迪泽、简艳琳、张坤、周天阳、高艺博、范义增、马健、高扬、陈宇乐、陈思、刘静、李翔以及李磊 Journal of Medicinal Chemistry (2024)

无需额外训练或数据即可提升逆折叠模型在蛋白质稳定性预测方面的性能 奥利弗·达顿、桑德罗·博塔罗、米凯莱·英韦尔尼齐、伊什特万·雷德尔、阿尔伯特·钟、卡洛·菲西卡罗、法比奥·艾罗尔迪、斯特凡诺·鲁斯凯塔、路易·亨德森、本杰明·MJ·欧文斯、帕特里克·福尔奇、卡米尔·塔米奥拉 bioRxiv 2024.06.15.599145 • 基于 ProteinMPNN/ESMIF

基于核函数的条件型生物序列模型评估 皮埃尔·格拉瑟、施特法妮·保罗、阿莉萨·M·胡默、夏洛特·迪恩、黛博拉·苏珊·马克斯、艾伦·纳兹瓦德·阿敏第41届国际机器学习大会论文集，PMLR 235:15678–15705, 2024 • 基于 ProteinMPNN

内在无序区域结合蛋白的设计 吴可嘉、江翰伦、德里克·R·希克斯、刘凯旋、埃丁·穆拉特沙皮奇、特蕾莎·A·拉梅洛特、刘悦轩、克里·麦克纳利、塞巴斯蒂安·肯尼、安德烈·米胡特、阿米特·高尔、布莱恩·科文特里、陈伟、阿西姆·K·贝拉、亚历克斯·康、斯泰西·格尔本、米拉·雅兰·兰布、阿纳丽萨·默里、李欣婷、麦迪逊·A·肯尼迪、杨伟、宋子豪、古德伦·肖伯、斯图尔特·M·布赖利、约翰·奥尼尔、迈克尔·H·盖尔布、加埃塔诺·T·蒙特利奥内、埃马纽埃尔·德里维里、大卫·贝克 bioRxiv 2024.07.15.603480/Science389,eadr8063(2025)

深度学习指导下的动态蛋白质设计 艾米·B·郭、代尼兹·阿克皮纳罗格鲁、马克·J.S.凯利、坦雅·科尔特梅 bioRxiv 2024.07.17.603962/Science388,eadr7094(2025) • 代码 • 补充材料

CodonMPNN用于生物体特异性和密码子优化的逆折叠 汉内斯·斯塔克、乌梅什·帕迪亚、朱莉娅·巴拉、卡梅隆·迪奥、乔治·丘奇 arXiv:2409.17265 • 基于 ProteinMPNN • 代码

基于结构的深度学习方法在T细胞受体设计中的潜力探索 赫尔德·V·里贝罗-菲略、加布里埃尔·E·哈拉、若昂·V·S·格拉、梅丽莎·张、纳撒尼尔·R·费尔宾格、若泽·G·C·佩雷拉、布莱恩·G·皮尔斯、保罗·S·洛佩斯-德-奥利维拉 PLoS Comput Biol 20(9) • 基于 ProteinMPNN • 基于 ESM

ProteusAI：一个开源且用户友好的平台，用于机器学习指导下的蛋白质设计与工程 乔纳森·芬克、劳拉·马查多、塞缪尔·A·布拉德利、玛尔塔·纳皮奥尔科夫斯卡、罗德里戈·加列戈斯-德克斯特、柳博芙·帕什科娃、尼克拉斯·G·马德森、亨利·韦贝尔、帕特里克·维克托·法纽夫、蒂莫西·P·詹金斯、卡洛斯·G·阿塞韦多-罗查 Sr bioRxiv 2024.10.01.616114 • 基于 ProteinMPNN • 基于 ESM

通过多样性正则化的直接偏好优化改进用于肽设计的逆折叠 瑞安·帕克、达伦·J·许、C·布莱恩·罗兰、玛丽亚·科尔舒诺娃、陈·特斯勒、希耶·曼诺尔、奥利维亚·菲斯曼、布鲁诺·特伦蒂尼 arXiv:2410.19471

可开发治疗性抗体的计算设计：高效遍历结合物景观并挽救逃逸突变 弗雷德里克·A·德雷耶、康斯坦丁·施奈德、亚历山大·科瓦尔楚克、丹尼尔·卡ティング、马修·J·伯恩、丹尼尔·A·尼斯利、牛顿·瓦霍梅、亨利·肯莱、克莱尔·马克斯、大卫·埃林顿、理查德·J·吉尔迪亚、大卫·达默尔、佩德罗·蒂泽伊、维拉万·奔乔布波尔、约翰·F·达比、伊娃·德鲁利特、丹尼尔·L·赫迪斯、萨钦·苏拉德、道格拉斯·E·V·皮雷斯、夏洛特·M·迪恩 bioRxiv 2024.10.03.616038 • 代码 • 基于 AbMPNN

BC-Design：一种生物化学感知的逆向蛋白质设计框架 唐湘如、叶新武、吴芳、刘怡梦、安娜·苏、安东尼娅·帕内斯库、关璐、邵丹、徐东、马克·格斯坦 bioRxiv 2024.10.28.620755

针对G蛋白偶联受体的状态特异性肽设计 杨雪、李俊、王洪、胡建国、郑志、何景洲、龚焕章、李向群、张晓楠、方晓敏 bioRxiv 2024.11.27.625792/化学信息与建模杂志（2025） • 基于ProteinMPNN

计算机指导设计具有更强VEGF抑制能力的Z结构域肽 卡斯滕·盖斯特、阿比贝·乌塞尼、亚历山大·卡齐米尔、里奇·库姆佩尔、延斯·迈勒、克里斯蒂娜·拉默斯、施特凡·卡尔克霍夫、格奥尔格·昆策 bioRxiv 2024.11.29.626075 补充材料 • 基于ProteinMPNN

HyperMPNN——一种从超嗜热菌中学习而来的设计耐热蛋白质的通用策略 莫里茨·埃尔特尔、菲利普·施莱格尔、马克斯·贝宁、莱昂纳德·凯瑟、延斯·迈勒、克拉拉·T·舍德尔 bioRxiv 2024.11.26.625397 • 代码 • 补充材料

IgDesign：利用逆折叠技术设计针对多种治疗性抗原的体外验证抗体 阿米尔·沙内萨扎德、朱利安·阿尔韦里奥、乔治·卡孙、西蒙·莱文、伊多·卡尔曼、吉布兰·A·汗、切尔西·钟、尼古拉斯·迪亚斯、布雷安娜·K·卢顿、伊西斯·塔特尔、凯伦·麦克洛克西、凯瑟琳·B·贝特曼、海莉·卡特、达尔顿·查普曼、丽贝卡·康斯布鲁克、亚历克·贾格尔、克里斯塔·科恩特、盖林·科佩克-贝利沃、约翰·M·萨顿、郭哲远、古斯塔沃·卡纳莱斯、凯·埃扬、艾米丽·马什、阿莉莎·鲁埃洛斯、莱莉·里普利、布鲁克·斯托达德、罗丹特·卡圭亚特、凯拉·查普曼、马修·桑德斯、贾雷德·夏普、道格拉斯·加尼尼·达席尔瓦、奥德丽·费尔特纳、杰克·里普利、梅根·E·布莱恩特、丹妮·卡斯蒂略、乔舒亚·迈尔、克里斯蒂安·M·施泰格曼、凯瑟琳·莫兰、克里斯汀·莱姆克、沙希德·阿卜杜勒哈克、莉莲·R·克鲁格、沙罗尔·巴查斯 bioRxiv 2023.12.08.570889 • 代码

学习如何工程化蛋白质柔性 彼得·寇巴、琼·普拉纳斯-伊格莱西亚斯、季里·丹博尔斯基、季里·塞德拉尔、斯坦尼斯拉夫·马祖连科、约瑟夫·西维奇 arXiv:2412.18275 • 代码

AI.zymes——一个用于进化酶设计的模块化平台 卢卡斯·P·梅尔利切克、扬尼克·诺伊曼、艾比·利尔、维维安·德焦尔吉、摩尔·德瓦尔、图多尔-斯特凡·科特、阿德里安·J·穆尔霍兰、H·阿德里安·邦泽尔 bioRxiv 2025.01.18.633707 • 补充材料

人工智能辅助的蛋白质设计，可快速将抗体序列转化为靶向多种肽和组蛋白修饰的胞内抗体 加布里埃尔·加林多、前岛大辉、雅各布·德鲁、斯科特·R·伯林厄姆、格雷琴·菲克森、森崎达也、哈利·P·费布雷、瑞安·哈斯布鲁克、赵宁、索汉·戈什、E·汉德利·梅顿、克里斯托弗·D·斯诺、布莱恩·J·盖斯、大川靖之、佐藤裕子、木村浩史、蒂莫西·J·斯塔塞维奇 bioRxiv 2025.02.06.636921/Sci. Adv.12,eadx8352(2026) • 代码 • 补充材料 • 基于ProteinMPNN

使用FAMPNN进行全原子蛋白质序列设计的侧链条件化与建模 理查德·W·帅、塔拉勒·维达塔拉、黄柏苏、布莱恩·L·希 bioRxiv 2025.02.13.637498 • 代码

通过结构检索实现快速准确的抗体序列设计 张兴义、谢坤、黄宁巧、刘伟、赵培琳、王思博、赵康飞、姜标斌 arXiv:2502.19395

利用启发式优化和深度学习增强功能性蛋白质设计，用于抗炎和基因治疗应用 帕塔特、艾申努尔·索伊图尔克和厄兹坎·乌福克·纳尔班托格鲁蛋白质：结构、功能与生物信息学（2025） • 代码

ProDualNet：基于蛋白质语言模型和结构模型的双靶点蛋白质序列设计方法 刘成、魏婷、崔晓晨、陈海峰、于章生 bioRxiv 2025.02.28.640919/生物信息学简报，2025年7月，bbaf391 • 代码

CHIEF：一种基于注意力机制的集成学习框架，用于功能性蛋白质设计 耿子龙、王宇泽、刘婷婷、谭傲、吴硕、郭晓玲、李若谷、侯旭敏、孙坤、吴连平、崔庆华、戴林泰、马志远、李宏林、张兵 bioRxiv 2025.03.07.641005 • 基于ProteinMPNN • 基于ESM-IF • 基于Frame2seq • 基于PiFold

通过直接偏好优化调整ProteinMPNN，以降低蛋白质通过MHC I类分子的免疫可见性 汉斯-克里斯托夫·加瑟、迭戈·A·奥亚尔松、哈维尔·阿尔法罗、阿吉塔·拉詹蛋白质工程、设计与选择（2025） • 代码 • 基于ProteinMPNN

人工智能驱动的高效GLP-1RA从头设计，具有延长的半衰期和增强的疗效 魏婷、崔晓晨、林佳慧、郑卓琪、崔太英、刘成、林晓倩、朱俊杰、冉旭阳、洪晓勋、于章生、陈海峰 bioRxiv 2025.03.26.645438 • 基于ProteinMPNN

一种新的ProteinMPNN解码策略，用于设计具有更低MHC I类免疫可见性的蛋白质 汉斯-克里斯托夫·加瑟、阿吉塔·拉詹、哈维尔·A·阿尔法罗 bioRxiv 2025.04.14.648837 • 基于ProteinMPNN

通过神经选择-扩展实现药物结合蛋白的零样本设计 本杰明·弗莱、凯娅·斯劳、尼古拉斯·F·波利齐 bioRxiv 2025.04.22.649862 • 代码

构象特异性设计：一项新的基准与算法及其在工程组成型活性 MAP 激酶中的应用
雅各布·A·斯特恩、西巴·阿尔哈尔比、阿南德苏基尔蒂·桑多卢、施特凡·T·阿罗尔德、丹尼斯·德拉科尔特
bioRxiv 2025.04.23.650138 • 代码 • 数据集

AI. zymes——用于进化酶设计的模块化平台
卢卡斯·P·梅尔利切克、扬尼克·诺伊曼、艾比·利尔、维维安·德焦尔吉、穆尔·M·德瓦尔、图多尔-斯特凡·科泰特、阿德里安·J·穆尔霍兰、阿德里安·邦泽尔
《应用化学》国际版（2025） • 代码 • 基于 ProteinMPNN

利用蛋白质序列的深度生成模型设计重叠基因
卞君宇、马克·埃克斯波西特、大卫·贝克、格奥尔格·塞利格
bioRxiv 2025.05.06.652464 • 代码 • 基于 ProteinMPNN

从头设计含卟啉的蛋白质作为高效且具有立体选择性的催化剂
侯凯鹏、黄伟、齐淼、托马斯·H·塔格韦尔、图尔基·M·阿尔图赖菲、陈宇达、张兴杰、陆磊、塞缪尔·I·曼恩、刘鹏、杨洋以及威廉·F·德格拉多
《科学》388.6747（2025） • 基于 LigandMPNN

无需重新训练即可将 ProteinMPNN 用于抗体设计
迭戈·德尔阿拉莫、拉赫尔·弗里克、达芙妮·特鲁安、乔尔·D·卡皮亚克
bioRxiv 2025.05.09.653228

HighMPNN：一种基于图神经网络的结构约束环肽序列设计方法
徐文、张成云、商天峰、毛庆义、段洪亮
ChemRxiv. 2025

针对新兴合成阿片类药物的动态生物传感器的计算设计
艾莉森·C·莱昂纳德、蔡斯·莱内特-蒙杜、瑞秋·谢耶、塞缪尔·斯威夫特、扎卡里·T·鲍默、瑞安·德拉尼、阿尼卡·J·弗里德曼、尼古拉斯·R·罗伯逊、诺曼·塞德尔、乔丹·威尔斯、林赛·M·惠特莫尔、肖恩·R·卡特勒、迈克尔·R·希茨、伊恩·惠尔登、蒂莫西·A·怀特黑德
bioRxiv 2025.05.15.654300 • 基于 LigandMPNN

通过带原子-键建模的谐波 SDE 设计环肽
周翔鑫、李明宇、肖毅、李佳涵、薛东宇、郑再祥、马建竹、顾全全
arXiv:2505.21452

针对土伦热弗朗西斯菌毒力因子的高亲和力迷你蛋白结合物的从头设计
吉泽姆·戈克切-阿尔普基利奇、黄步伟、刘安迪、利瑟洛特·S.M. 克鲁克、王雅熙、维克多·阿德博米、延西·弗洛雷斯·布埃索、阿西姆·K·贝拉、康乐、斯泰西·R·格尔本、斯蒂芬·雷蒂、狄俄涅·K·瓦菲阿多斯、妮可·鲁利耶、因娜·戈列什尼克、李欣婷、大卫·贝克、约书亚·J·伍德沃德、约瑟夫·D·莫古斯、高拉夫·巴德瓦杰
bioRxiv 2025.07.02.662053 • 补充材料 • 代码 • 基于 ProteinMPNN

基于结构指导的强大且具有选择性的激酶肽底物的计算工作流程
阿比布·A·耶肯、辛西娅·J·迈耶、梅丽莎·麦考伊、布鲁斯·波斯纳、肯尼思·D·韦斯托弗
bioRxiv 2025.07.04.663216 • 基于 ProteinMPNN

使用 ProteinMPNN 设计具有高度改变的结构核心和亚基界面的完全功能 AAV 病毒载体
蒋子宇、西里玛尔·劳辛瓦塔纳、保罗·A·达尔比
bioRxiv 2025.07.24.666527

双面蛋白质纳米材料的计算设计
萨内拉·兰科维奇、肯尼思·D·卡尔、贾斯汀·德卡罗、丽贝卡·斯科特海姆、瑞安·D·基布勒、塞巴斯蒂安·奥尔斯、李相珉、春正浩、马蒂·R·图利、尤斯塔斯·道帕拉斯、海伦·E·艾森纳赫、马蒂亚斯·格勒格尔、康纳·魏德尔、安德鲁·J·博斯特、大卫·贝克及尼尔·P·金
Nat. Mater.（2025）

利用 DynamicMPNN 进行多状态蛋白质设计
亚历克斯·阿布鲁丹、塞巴斯蒂安·普哈尔特·奥赫达、柴坦亚·K·乔希、马修·格林尼格、费利佩·恩格尔贝格、阿廖娜·赫梅林斯卡娅、延斯·迈勒、米歇莱·文德鲁斯科洛、图奥马斯·P·J·诺尔斯
arXiv:2507.21938 • 代码

高性能皮质醇发光生物传感器的从头设计
朱莉·易萱·陈、彭雪、奚成刚、李奎丽、大卫·贝克、叶宪伟·安迪
J. Am. Chem. Soc

通过扩大实验表征规模加速蛋白质设计
贾森·钱、卢卡斯·F·米勒斯、巴西勒·I·M·维基、阿米尔·莫特曼、李欣婷、瑞安·D·基布勒、兰斯·斯图尔特、大卫·贝克
bioRxiv 2025.08.05.668824 • 代码

人工智能驱动的超长效 GLP-1 受体激动剂的从头设计
丁薇、马嘉婷、崔晓晨、林佳慧、郑卓琪、刘成、崔泰英、林晓倩、朱俊杰、冉旭阳、洪晓坤、卢克·约翰斯顿、于章生、陈海峰
《先进科学》（德国巴登-符腾堡州魏恩海姆） • 基于 ProteinMPNN

从序列到支架：基于 AlphaFold2 预测构建块的蛋白质纳米颗粒疫苗的计算设计
赛勒斯·M·哈斯、纳文·贾斯蒂、安妮·多西、乔尔·D·艾伦、丽贝卡·吉莱斯皮、杰克逊·麦戈温、伊丽莎白·M·利夫、马克斯·克里斯平、科尔·A·德福雷斯特、真守金木、尼尔·P·金
bioRxiv 2025.08.20.671178/《美国国家科学院院刊》122.45（2025） • 补充材料

光响应性蛋白质-蛋白质相互作用的从头设计实现了蛋白质组装的可逆形成
于博文、刘娇、崔占元、王楚、陈培培、王辰通、张彦哲、朱星星、张泽、李世超、潘金恒、谢明启、沈怀宗及曹龙星
Nat. Chem.（2025） • 代码

针对设计结构相似但序列多样的蛋白质的多目标优化
良明秋叶、森胁义隆、石谷龙一郎、吉川成树
bioRxiv 2025.09.13.676063 • 基于 ProteinMPNN

基于Caliby的集合条件蛋白序列设计
理查德·W·帅、陆天宇、苏邦·巴蒂、彼得·库巴、黄博思
bioRxiv 2025.09.30.679633 • 代码

从头设计的电压门控阴离子通道可抑制神经元放电
周晨、李慧灿、王佳兴、钱成、熊辉、褚志林、邵启明、李轩、孙世锦、孙科、朱爱琴、王嘉伟、金雪芹、杨帆、塔梅尔·M·加马勒·埃尔丁、李波、黄静、吴坤、陆培龙
Cell(2025)

AI引导的稳健六螺旋束蛋白疏水核心设计
孟银英、唐国进、王瑞石、郑斌、刘元昊、张瀚田、郑鹏
ACS Nano .5c13783 • 基于ProteinMPNN

针对土拉弗朗西斯菌毒力因子的高亲和力迷你蛋白结合物的从头设计
吉泽姆·戈克切-阿尔普基利奇、黄步伟、刘安迪、莉瑟洛特·S.M. 克鲁克、王雅希、维克托·阿德博米、延西·弗洛雷斯·布埃索、阿西姆·K·贝拉、亚历克斯·康、斯泰西·R·格尔本、斯蒂芬·雷蒂、狄俄尼·K·瓦菲阿多斯、妮可·鲁耶、因娜·戈列什尼克、李欣婷、大卫·贝克、乔舒亚·J·伍德沃德、约瑟夫·D·莫古斯、高拉夫·巴德瓦杰
德国应用化学国际版(2025) • 基于ProteinMPNN

利用设计的T细胞受体和抗体靶向肽-MHC复合物
阿米尔·莫特曼、凯文·M·朱德、王楠、安娜斯塔西娅·米涅尔维娜、大卫·费尔德曼、毛里茨·A·利希滕斯坦、阿比谢伊·埃班尼泽、科林·科伦蒂、保罗·G·托马斯、K·克里斯托弗·加西亚、大卫·贝克、菲利普·布拉德利
bioRxiv 2025.11.19.689381 • 基于ProteinMPNN

用于呼吸道病毒鼻腔预防的干扰素-λ的计算设计与糖工程化
尹正源、杨承柱、权在赫、路易斯·费利佩·韦奇耶蒂、崔智贤、崔美罗、具根本、卢贤珠、金健度、车美英、郑贤贞、吴智恩、金浩敏
Advanced Science (2025) • 基于ProteinMPNN

小分子调控型蛋白质寡聚体的从头设计
金琪涵、王雨凯、陈大川、廖晋阳、崔展远、范宇轩、曾安平、谢明琦、曹隆兴
Science391,eady6017(2026) • 代码

双拓扑膜转运蛋白的从头设计
陈曦、周晓峰、周家伟、谢腾宇、李亚宁、燕宇轩、黄静、陈子博、马丹、陆培龙
浪涛沙预印本服务器

Origin-1：针对新型表位的从头抗体设计生成式AI平台
西蒙·莱文、乔纳森·爱德华·金、雅各布·斯特恩、戴维·格雷森、雷蒙德·王、尹睿、翁贝托·卢波、保利娜·库利特、瑞安·马修·布兰德、特里斯坦·贝尔坦、罗伯特·普芬格斯滕、约万·塞约维奇、切尔西·钟、布里安娜·K·卢顿、安德鲁·哈格曼、罗贝尔·海勒、埃利奥特·梅迪纳、潘卡杰·潘瓦尔、奥列克西·杜布罗夫斯基、蔡斯·拉孔布、扎赫拉·安德森、德里克·米尔德、斯科特·本杰明、乔·凯撒、约瑟夫·费伦、玛尔塔·萨里科、亚历山德拉·克什纳、阿普尔瓦·米什拉、凯·R·埃扬、艾米丽·K·马什、保罗·布林加斯、佩特萨迈·维莱恰克、凯拉·查普曼、雅各布·里普利、穆塔帕·高达、凯瑟琳·M·柯林斯、凯伦·M·麦克洛克西、杰里米亚·S·约瑟夫、赖莉·里普利、沙希德·A·阿卜杜勒哈克、奥德里·费尔特纳、迈克尔·盖林、杰弗里·戈比、杰西·亨德里克斯、丹妮尔·卡斯蒂略、肖恩·麦克莱恩、道格拉斯·加尼尼、德里克·施皮尔、詹姆斯·马特格科、埃德尔·克鲁兹·加西亚、马苏德·扎贝特-莫加达姆、约翰·M·萨顿、郭哲远、肖恩·M·韦斯特、贾纳尼·S·艾耶尔、阿米尔·沙内赫萨扎德
bioRxiv 2026.01.14.699389 • 代码

与从头设计的受体结合物融合的纳米白蛋白结合型紫杉醇表现出更强的肿瘤靶向性和治疗效果
钱元英、严伟康、徐凡、刘雅莉、陈法宝、吕悦、张子涵、顾傲、余若冰、方振、于洋、李茂兰、曹隆兴、刘英斌、何永宁
bioRxiv 2026.01.28.702218

CyclicMPNN：稳定环状肽序列生成
安德鲁·C·鲍尔斯、亚纳帕特·詹塔纳、帕丽莎·侯赛因扎德
bioRxiv 2026.01.31.702993 • 补充材料 • 代码

介观结构水增强ProteinMPNN设计的泛素折叠稳定性
陈璐怡、陆伟林、坦维·帕塔尼亚、楚宜萱、霍梦茹、庄伟辰、楼元超、洪太一、宫野井洋平、张嘉恩、吴坤 Phon
J. Am. Chem. Soc. 2026 • 基于ProteinMPNN

4.6 基于GAN的方法

利用引导式条件Wasserstein生成对抗网络进行新折叠的从头蛋白设计 穆斯塔法·卡里米、朱绍文、曹越、沈洋化学信息与建模杂志60.12(2020) • gcWGAN

HelixGAN：一种具有潜在空间搜索功能的双向生成对抗网络，用于约束条件下的生成 谢学志、金菲利普·M. NeurIPS 2021结构生物学机器学习研讨会/生物信息学，2023年，btad036 • 代码

4.7 基于Transformer的方法

用于基于图的蛋白设计的生成模型 约翰·英格拉汉、维卡斯·K·加格、雷吉娜·巴尔齐莱博士、汤米·雅科拉 NeurIPS 2019 • GraphTrans

Fold2Seq：一种基于联合序列（1D）-折叠（3D）嵌入的蛋白设计生成模型
曹越、达斯·帕耶尔、陈特哈马拉克尚·维吉尔、陈品宇、伊戈尔·梅尔尼克、沈洋
国际机器学习会议.PMLR，2021年

基于深度学习和自洽性的无旋转异构体蛋白质序列设计 刘宇峰、张璐、王伟伦、朱敏、王晨晨、李福东、张嘉海、李厚强、陈权&刘海燕自然科研（2022）/自然计算科学（2022） • 补充材料 • 评论 • 代码

用于学习反向蛋白质折叠的深度SE(3)等变模型 马修·麦克帕特隆、本·赖、徐金波 bioRxiv（2022）

从数百万预测结构中学习反向折叠 克洛伊·许、罗伯特·维尔库伊尔、杰森·刘、林泽明、布赖恩·希、汤姆·塞尔库、亚当·莱雷、亚历山大·里夫斯 bioRxiv（2022） • esm

借助能够理解与任何分子相互作用的新AI模型，突破蛋白质设计的界限 LucianoSphere Towards Data Science

通过学习残基的简洁局部环境实现准确高效的蛋白质序列设计 黄斌、范廷文、王凯越、张海沧、于春功、聂淑玉、齐阳朔、郑伟谋、韩健、范正、孙世伟、叶盛、杨怀义、卜东波 bioRxiv（2022）/生物信息学39.3（2023） • 补充材料 • 网站 • 代码

PeTriBERT：通过三维编码增强BERT，用于反向蛋白质折叠和设计 鲍德温·杜莫蒂耶、安托万·留特库斯、克莱芒·卡雷、加布里埃尔·克鲁克 bioRxiv 2022.08.10.503344

利用语言模型进行原子级蛋白质结构的进化规模预测 林泽明、哈利勒·阿金、罗尚·拉奥、布赖恩·希、朱仲凯、陆文婷、尼基塔·斯梅塔宁、罗伯特·维尔库伊尔、奥里·卡贝利、亚尼夫·舒梅利、艾伦·多斯桑托斯科斯塔、玛丽亚姆·法泽尔扎兰迪、汤姆·塞尔库、萨尔瓦托雷·坎迪多、亚历山大·里夫斯 bioRxiv 2022.07.20.500902 • 博客 • github

结构感知的语言模型即为蛋白质设计师 郑在祥、邓一凡、薛冬宇、周毅、叶飞、顾全全 arXiv:2302.01649 • 代码::ByProt

将预训练范式融入抗体序列-结构协同设计 高凯元、吴立军、朱金华、彭天博、夏英策、何亮、谢淑芳、秦涛、刘海光、何坤、刘铁严 arXiv:2211.08406 • 代码

一种文本引导的蛋白质设计框架 刘圣超、朱宇涛、陆佳睿、许钊、聂伟力、安东尼·吉特、肖超伟、唐健、郭洪宇、阿尼玛·阿南德库马尔 arXiv:2302.04611/自然机器智能（2025） • 代码

一种端到端的深度学习方法，用于蛋白质侧链堆积和反向折叠 麦克帕特隆、马修和徐金波美国国家科学院院刊120.23（2023） • 代码 • 补充材料

面向蛋白质序列设计的上下文感知几何深度学习 吕西安·克拉普、费尔南多·梅雷莱斯、卢西亚诺·阿布里亚塔、马泰奥·达尔·佩拉罗 bioRxiv 2023.06.19.545381/自然通讯，2024年 • 代码 • 新闻

仅凭序列从头生成并优先排序靶标结合肽基序 苏哈斯·巴特、卡良·帕莱普、维维安·尤迪斯特拉、劳伦·洪、文卡塔·斯里卡尔·卡维拉尤尼、陈天来、赵琳、王天、索菲娅·文科夫、普拉南·查特吉 bioRxiv 2023.06.26.546591 • 代码 • colab • 补充材料

ProstT5：蛋白质序列与结构的双语语言模型
迈克尔·海因辛格
康斯坦丁·魏森诺、华金·戈麦斯·桑切斯、阿德里安·亨克尔、马丁·施泰内格尔、布尔哈德·罗斯特
bioRxiv 2023.07.23.550085 • 补充材料 • 代码

基于深度学习的从头蛋白质序列设计及CalB水解酶上的验证 穆俊熙、李正新、张博、张琪、贾姆谢德·伊克巴尔、阿卜杜勒·瓦杜德、魏婷、冯艳、陈海峰
bioRxiv 2023.08.01.551444 • 代码

用于蛋白质侧链堆积和设计的不变点消息传递 尼古拉斯·Z·兰道夫、布赖恩·库尔曼
bioRxiv 2023.08.03.551328 • 代码

利用语言模型逐原子生成蛋白质及其他应用 丹尼尔·弗拉姆-谢泼德、凯文·朱、阿兰·阿斯普鲁-古齐克
arXiv:2308.09482

SaProt：具有结构感知词汇表的蛋白质语言建模 金素、韩晨晨、周宇洋、单俊杰、周锡彬、袁发杰
bioRxiv 2023.10.01.560349 • 代码

SaprotHub：让所有生物学家都能轻松进行蛋白质建模 Jin Su、Zhikai Li、Chenchen Han、Yuyang Zhou、Yan He、Junjie Shan、Xibin Zhou、Xing Chang、Shiyu Jiang、Dacheng Ma、The OPMC、Martin Steinegger、Sergey Ovchinnikov、Fajie Yuan bioRxiv 2024.05.24.595648 • 代码 • Colab

AntiFold：利用反向折叠改进抗体结构设计 Magnus Høie、Alissa Hummer、Tobias Olsen、Morten Nielsen、Charlotte Deane GenBio@NeurIPS2023 Spotlight/Bioinformatics Advances (2025) • 代码、GitHub • Colab、网站

MMDesign：用于生成式蛋白质设计的多模态迁移学习 Jiangbin Zheng、Siyuan Li、Yufei Huang、Zhangyang Gao、Cheng Tan、Bozhen Hu、Jun Xia、Ge Wang、Stan Z. Li arXiv预印本 arXiv:2312.06297 (2023)

ShapeProt：基于3D蛋白质形状生成模型的自顶向下蛋白质设计 Lee、Youhan 和 Jaehoon Kim bioRxiv (2023)：2023-12

X-LoRA：低秩适配器专家混合体，一种适用于大型语言模型的灵活框架，可用于蛋白质力学与设计 Eric L. Buehler、Markus J. Buehler arXiv:2402.07148 • 代码 • 模型及权重

AntiFold：利用反向折叠改进基于抗体结构的设计 Magnus Haraldson Høie、Alissa Hummer、Tobias H. Olsen、Broncio Aguilar-Sanjuan、Morten Nielsen、Charlotte M. Deane arXiv:2405.03370 • 代码 • 网站 • 基于ESM-IF

使用StructureGPT进行蛋白质设计：一种用于蛋白质结构到序列转换的深度学习模型 Nicanor Zalba Sr.、Pablo Ursua-Medrano Sr.、Humberto Bustince Sr. bioRxiv 2024.06.03.597105 • 代码 • 补充材料

将蛋白质语言模型调整为基于结构的设计 Jeffrey A Ruffolo、Aadyot Bhatnagar、Joel Beazer、Stephen Nayfach、Jordan Russ、Emily Hill、Riffat Hussain、Joseph Gallagher、Ali Madani bioRxiv 2024.08.03.606485 • 代码 • 补充材料 • 新闻 • 讲座

EMOCPD：基于注意力机制的高效计算蛋白质设计模型，利用氨基酸微环境 Xiaoqi Ling、Cheng Cai、Demin Kong、Zhisheng Wei、Jing Wu、Lei Wang、Zhaohong Deng arXiv:2410.21069/《化学信息与建模杂志》(2024) • 数据

专家混合体助力高效且有效的蛋白质理解与设计 Ning Sun、Shuxian Zou、Tianhua Tao、Sazan Mahbub、Dian Li、Yonghao Zhuang、Hongyi Wang、Xingyi Cheng、Le Song、Eric P. Xing bioRxiv 2024.11.29.625425 • 代码

通过对比偏好优化对ESM3进行微调，用于抗原特异性抗体设计 Anirudh Venkatraman、Gopinath Balaji、Veeresh Kande UIUC 2024年秋季CS582 MLCB • 代码

Protein CREATE实现从头合成蛋白结合剂的闭环设计 Alec Lourenço、Arjuna Subramanian、Ryan Spencer、Michael Anaya、Jiapei Miao、William Fu、Eric Chow、Matt Thomson bioRxiv 2024.12.20.629847 • 基于ESM-IF

DS-ProGen：用于功能型蛋白质设计的双结构深度语言模型
Yanting Li、Jiyue Jiang、Zikang Wang、Ziqian Lin、Dongchen He、Yuheng Shan、Yanruisheng Shao、Jiayi Li、Xiangyu Shi、Jiuming Wang、Yanyu Chen、Yimin Fan、Han Li、Yu Li
arXiv:2505.12511

基于结构的抗体设计，结合亲和力优化的反向折叠
Xinyan Zhao、Yi-Ching Tang、Rivaaj Monsia、Victor J. Cantu、Ashwin Kumar Ramesh、Xiaozhong Liu、Zhiqiang An、Xiaoqian Jiang、Yejin Kim
arXiv:2512.17815 • 基于ESM-IF

4.8 基于ResNet的方法

DenseCPD：利用DenseNet提升基于神经网络的计算蛋白质序列设计精度 Qi、Yifei 和 John ZH Zhang 《化学信息与建模杂志》60.3期 (2020) • 代码不可用

DeepUSPS：深度学习赋能的无约束结构蛋白质序列设计
Zhichong Ma、Jiawen Yang
《蛋白质：结构、功能与生物信息学》(2025) • 代码 • 数据

4.9 基于扩散的方法

基于带有结构先验和对抗训练的扩散模型的从头蛋白质骨架生成
刘宇峰、陈凌辉、刘海燕
bioRxiv 2022.12.17.520847/Nat Methods (2024) • 代码

基于注意力机制扩散模型，结合二级结构约束的从头蛋白质生成设计
倪博、大卫·L·卡普兰、马库斯·J·布勒尔
Chem,(2023) • 代码 • 新闻

用于反向蛋白质折叠的图去噪扩散模型
易凯、周冰欣、沈一清、皮耶特罗·利奥、王昱光
arXiv:2306.16819/NeurIPS 2023 • 代码

条件蛋白去噪扩散模型生成可编程内切核酸酶
周冰欣、郑丽蓉、吴邦浩、易凯、钟博子涛、皮耶特罗·利奥、洪亮
bioRxiv 2023.08.10.552783

在量化向量空间中的扩散生成非理想化的蛋白质结构并预测构象分布
刘海燕、刘宇峰、陈凌辉
bioRxiv 2023.11.18.567666

基于离散扩散的快速非自回归反向折叠
杨约翰、Jason Yim、雷吉娜·巴尔齐莱、汤米·雅科拉
arXiv:2312.02447 • 代码

扩散语言模型是多功能的蛋白质学习者
王新友、郑在祥、叶飞、薛东宇、黄树坚、顾全全
arXiv:2402.18567

LéxFusion
莱文塔尔
论文未公开 • 新闻 • 商业化

条件蛋白扩散模型生成具有增强活性的人工可编程内切核酸酶序列
周冰欣、郑丽蓉、吴邦浩、易凯、钟博子涛、谭阳、刘倩、皮耶特罗·利奥、洪亮
bioRxiv 2023.08.10.552783/Cell Discovery 10.1 (2024) • 代码

LaGDif：用于高效自集成式蛋白质反向折叠的潜在图扩散模型
吴涛宇、王昱光、沈一清
arXiv:2411.01737 • 代码

Bridge-IF：利用马尔可夫桥学习反向蛋白质折叠
朱一恒、吴嘉璐、李秋怡、严家欢、尹明泽、吴伟、李明阳、叶杰平、王正、吴健
arXiv:2411.02120 • 代码

掩码先验引导的去噪扩散改进反向蛋白质折叠
白培珍、菲利普·米利科维奇、刘宪元、莱昂纳多·德·玛利亚、丽贝卡·克罗斯代尔-伍德、欧文·拉坎、陆海平
arXiv:2412.07815/Nature Machine Intelligence (2025) • 代码

使用语言扩散模型进行端到端的定制动力学从头蛋白质设计
倪博、马库斯·J·布勒尔
arXiv预印本 arXiv:2502.10173 (2025) • 代码，模型

利用离散扩散模型进行全原子蛋白质序列设计
阿梅莉亚·比列加斯-莫尔西略、吉斯·J·阿德米拉尔、马塞尔·J.T. 雷因德斯、雅娜·M. 韦伯
bioRxiv 2025.06.13.659451 • 代码

通过ABACUS-T多模态反向折叠提升功能性蛋白质性能
刘宇峰、吴睿、王鑫宇、王晟、陈凌辉、李福东、陈权与刘海燕
Nat Commun 16, 10177 (2025) • 代码

4.10 基于贝叶斯的方法

利用深度贝叶斯优化进行反向蛋白质折叠
娜塔莉·莫斯、曾益萌、丹尼尔·艾伦·安德森、菲利普·马费托内、亚伦·所罗门、佩顿·格林赛德、奥斯伯特·巴斯塔尼、雅各布·R·加德纳
arXiv:2305.18089 • 代码

设计具有精确调控动力学性质的蛋白质序列
Z. 费伊登·布罗察基斯、米歇莱·文德鲁斯科洛、乔治奥斯·斯克雷塔斯
bioRxiv 2025.02.13.638027

IgCraft：用于抗体发现与工程的多功能序列生成框架
马修·格林尼格、赵浩文、弗拉基米尔·拉登科维奇、奥宾·拉蒙、皮耶特罗·索尔曼尼
arXiv:2503.19821 • 代码

4.11 基于流的方法

用于多配体对接和结合位点设计的谐波自条件流匹配
汉内斯·施塔克、景博文、雷吉娜·巴尔齐莱、汤米·雅科拉
arXiv:2310.05764 • 代码

4.12 基于强化学习的方法

通过奖励优化微调离散扩散模型及其在DNA和蛋白质设计中的应用
王晨宇、上原昌俊、何一春、王艾米、汤马索·比安卡拉尼、阿万蒂卡·拉尔、汤米·雅科拉、谢尔盖·列维、王汉臣、阿维夫·雷格夫
arXiv:2410.13643 • 代码

基于结构条件的分类扩散模型上的强化学习应用于反向蛋白质折叠
雅沙·埃克特法耶、奥利维娅·维斯曼、西达尔特·纳拉亚南、德鲁·德雷斯尔、金J·马克、阿尔缅·姆克尔奇扬
arXiv:2410.17173 • 代码

ProtInvTree：基于奖励引导的树搜索进行审慎的反向蛋白质折叠
刘梦迪、程晓雪、高张洋、常宏、谭成、单世光、陈希林
arXiv:2506.00925

ProteinZero：通过在线强化学习实现自我改进的蛋白质生成
王梓文、范佳俊、郭瑞涵、阮氏桃、季恒、刘戈
arXiv:2506.07459

ProDCARL：与强化学习对齐的扩散模型用于从头抗菌肽设计
盛芳、穆罕默德·诺埃恩、扎赫拉·沙克里
arXiv:2602.00157

4.13 训练方法

基于结构反馈的蛋白质逆折叠
徐俊德、高子俊、周欣怡、胡杰、程星毅、宋乐、陈广勇、彭安恒、邱洁中
arXiv:2506.03028

通过可设计性偏好优化改进蛋白质序列设计
薛方雷、安德鲁·库巴内、郭志春、约瑟夫·K·闵、刘戈、杨毅、戴维·贝克
arXiv:2506.00297 • 基于LigandMPNN

EnerBridge-DPO：利用马尔可夫桥与直接偏好优化的能量引导型蛋白质逆折叠
荣鼎毅、陆浩天、郑文卓、张帆、郑双嘉、刘宁
arXiv:2506.09496 • 代码

针对深度生成序列模型的归因分配，可在仅使用正样本数据的情况下实现可解释性分析
罗伯特·弗兰克、迈克尔·维德里希、拉赫马德·阿克巴尔、君特·克拉姆鲍尔、盖尔·凯蒂尔·桑德韦、菲利普·A·罗伯特、维克多·格莱夫
arXiv:2506.23182

自适应蛋白质设计协议与中间件
艾曼·阿尔萨迪、乔纳森·阿什、米哈伊尔·季托夫、马泰奥·图里利、安德烈·梅尔茨基、尚滕努·贾、萨加尔·卡雷
arXiv:2510.06396

解析蛋白质设计模型中分类学偏好背后的物理化学基础
劳拉·B·迪伦、奥利弗·克鲁克、亚伦·迈瓦尔德
bioRxiv 2025.10.21.683350 • 补充材料

5. 从功能到序列

这些模型可根据预期的功能生成序列。

5.1 基于CNN的方法

利用高容量机器学习设计抗体互补决定区
刘戈、曾浩洋、乔纳斯·穆勒、布兰登·卡特、王子恒、乔纳斯·希尔茨、杰拉尔丁·霍尼、迈克尔·E·伯恩鲍姆、斯特凡·埃韦特、大卫·K·吉福德
Bioinformatics 36.7 (2020): 2126–2133 • 代码

利用自回归生成模型进行蛋白质设计与变异预测
申贞恩、亚当·J·里塞尔曼、亚伦·W·科拉斯奇、康纳·麦克马洪、伊莱娜·西蒙、克里斯·桑德、阿希什·曼格利克、安德鲁·C·克鲁斯及黛博拉·S·马克斯
Nature Communications 12.1 (2021) • 代码：SeqDesign • 突变效应预测 • 序列生成 • 2021年4月

通过深度学习从抗体序列预测抗原特异性以优化治疗性抗体
德里克·M·梅森、西蒙·弗里登索恩、塞德里克·R·韦伯、克里斯蒂安·约尔迪、巴斯蒂安·瓦格纳、西蒙·M·门格、罗伊·A·埃林、露西亚·博纳蒂、扬·达欣登、巴勃罗·盖因萨、布鲁诺·E·科雷亚及赛·T·雷迪
Nature Biomedical Engineering 5.6 (2021) • 代码

通过混合仿生—从头预测分子设计加速ELP基材料的工程化
蒂莫·拉科、安蒂·科尔凯阿拉克索、布尔楚·菲拉特利吉尔·耶尔迪里尔、皮奥特尔·巴蒂斯、维勒·利利斯特伦、阿里·霍卡宁、诺纳帕、梅尔雅·彭蒂拉、安西·劳卡宁、阿里·米塞雷斯、卡伊·索德加德、佩日曼·穆罕默迪
Advanced Materials (2024)

5.2 基于VAE的方法

机器学习辅助设计与筛选合成细胞中的新兴蛋白质功能
小山俊史、贝拉·P·弗罗恩、莱昂·巴布尔及佩特拉·施维勒
Nature Communications 15, 2010 (2024) • 代码

蛋白质序列的变分自编码
萨姆·西奈、埃里克·凯尔西克、乔治·M·丘奇、马丁·A·诺瓦克
arXiv预印本 arXiv:1712.03346 (2017)

基于适应性采样的设计
布鲁克斯、大卫·H·和詹妮弗·利斯特加滕
arXiv预印本 arXiv:1810.03714 (2018)

Pepcvae：半监督定向设计抗菌肽序列
帕耶尔·达斯、卡希尼·瓦达万、奥斯卡·张、汤姆·塞尔库、西塞罗·多斯桑托斯、马修·里默、维吉尔·琴塔马拉克尚、英基特·帕迪、亚历山德拉·莫伊西洛维奇
arXiv预印本 arXiv:1810.07743 (2018)

用于T细胞受体蛋白序列的深度生成模型
克里斯蒂安·戴维森、布兰登·J·奥尔森、威廉·S·德威特三世、让·冯、伊利亚斯·哈金斯、菲利普·布拉德利、弗雷德里克·A·马森四世
Elife 8 (2019)

如何“幻觉”出功能性蛋白质
科斯特洛、扎克及埃克托·加西亚·马丁
arXiv预印本 arXiv:1903.00458 (2019)

深度学习揭示抗体库中的趋同选择
西蒙·弗里登索恩、丹尼尔·诺伊迈尔、塔里克·A·汗、露西亚·切普雷吉、克里斯蒂娜·帕罗拉、阿瑟·R·戈尔特尔·德·弗里斯、莉娜·埃尔拉赫、德里克·M·梅森、赛·T·雷迪
BioRxiv (2020) • 补充材料 • 文章发表后提供代码

用于生成抗菌肽的变分自编码器
迪恩、斯科特·N·和斯科特·A·沃尔珀
ACS omega 5.33 (2020)

利用变分自编码器生成功能性蛋白质变体
亚历克斯·霍金斯-胡克尔、弗洛伦斯·德帕迪厄、塞巴斯蒂安·鲍尔、纪尧姆·库瓦隆、阿瑟·陈、戴维·比卡尔
PLoS computational biology 17.2 (2021)

通过深度生成模型与分子动力学模拟加速抗菌药物发现
帕耶尔·达斯、汤姆·塞尔库、卡希尼·瓦达万、英基特·帕迪、塞巴斯蒂安·格尔曼、弗拉维乌·齐普西甘、维吉尔·琴塔马拉克尚、亨德里克·斯特罗贝尔、西塞罗·多斯桑托斯、品宇·陈、严毅杨、杰里米·P·K·谭、詹姆斯·海德里克、杰森·克雷恩及亚历山德拉·莫伊西洛维奇
Nature Biomedical Engineering 5.6 (2021)

深度生成模型创造新颖且多样的蛋白质结构
泽明、汤姆、扬及亚历山大
NeurIPS 2021

PepVAE：用于抗菌肽生成与活性预测的变分自编码框架
斯科特·N·迪恩、杰罗姆·安东尼·E·阿尔瓦雷斯、丹·扎贝塔基斯、斯科特·A·沃尔珀及安东尼·P·马拉诺斯基
Frontiers in microbiology 12 (2021) • 代码 • 补充材料

HydrAMP：用于抗菌肽发现的深度生成模型 保利娜·西姆扎克、马尔钦·莫热伊科、托马什·格热戈热克、玛尔塔·鲍尔、达米安·诺伊鲍尔、米哈尔·米哈尔斯基、雅切克·斯罗卡、皮奥特尔·塞特尼、沃伊切赫·卡米什、埃娃·什丘雷克 bioRxiv（2022） • 代码

利用生成式神经网络进行治疗性酶工程 安德鲁·吉塞尔、阿塔纳西奥斯·杜西斯、坎查纳·拉维昌德兰、凯文·史密斯、斯雷约希·苏尔、伊恩·麦克法登、魏征和斯图尔特·利希特《科学报告》12.1（2022）

GM-Pep：从头设计功能性肽序列的高效策略 陈曲硕、杨昌彦、谢一浩、王宇强、李晓旭、王凯荣、黄锦奇和颜文进《化学信息与建模杂志》（2022） • 代码

蛋白质序列生成模型的平均维度 克里斯托夫·费瑙尔、埃马努埃莱·博尔戈诺沃 bioRxiv 2022.12.12.520028 • 代码

利用生成式深度学习预测用于DNA编辑的定制重组酶 卢卡斯·西奥·施密特、马切伊·帕什科夫斯基-罗加茨、弗洛里安·尤格和弗兰克·布赫霍尔茨 Nat Commun 13, 7966（2022） • 代码 • 补充材料

ProT-VAE：用于功能蛋白设计的蛋白质Transformer变分自编码器 埃姆雷·塞夫根、乔舒亚·莫勒、艾德里安·朗格、约翰·帕克、肖恩·奎格利、杰夫·梅耶、普纳姆·斯里瓦斯塔瓦、西塔拉姆·盖亚特里、大卫·霍斯菲尔德、玛丽亚·科尔舒诺娃、米哈·利夫内、米歇尔·吉尔、拉马·兰加纳坦、安东尼·B·科斯塔、安德鲁·L·弗格森 bioRxiv 2023.01.23.525232/美国国家科学院院刊122（41）e2408737122

利用潜在空间近似轨迹收集器进行靶向肽设计 林彤、陈思杰、鲁奇拉·巴苏、裴德虎、程晓林、莱文特·布拉克·卡拉 arXiv:2302.01435

深度学习生成模型助力信号蛋白合成同源物的设计 连欣然、尼克萨·普拉利亚克、安德鲁·L·弗格森、拉马·兰加纳坦《生物物理杂志》122.3（2023）：311a

通过体外、体内及计算筛选相结合设计具有新功能的蛋白质 小山俊史、贝拉·保罗·弗罗恩、莱昂·巴布尔、佩特拉·施维勒 bioRxiv 2023.02.16.528840 • 补充材料

ProteinVAE：用于转化型蛋白质设计的变分自编码器 吕素月、沙欣·索瓦拉蒂-哈什金、迈克尔·加顿 bioRxiv 2023.03.04.531110/《自然机器智能》（2024） • 补充材料 • 代码

ProtWave-VAE：将自回归采样与基于潜在空间的推理相结合，实现数据驱动的蛋白质设计 尼克萨·普拉利亚克、连欣然、拉马·兰加纳坦、安德鲁·弗格森 bioRxiv 2023.04.23.537971 • 补充材料 • 代码

利用深度生成模型设计T细胞受体序列有意义的连续表征 艾伦·Y·利里、达里乌斯·斯科特、纳米塔·T·古普塔、贾内尔·C·韦特、迪米特里斯·斯科科斯、古林德·S·阿特瓦尔、彼得·G·霍金斯 bioRxiv 2023.06.17.545423 • 代码

语言模型与基于物理的方法在修饰MHC I类免疫可见性以用于疫苗和治疗药物设计中的应用 汉斯-克里斯托夫·加瑟、迭戈·奥亚尔孙、阿吉塔·拉詹、哈维尔·阿尔法罗 bioRxiv 2023.07.10.548300

无细胞生物合成结合深度学习加速抗菌肽的从头开发 阿米尔·潘迪、戴维·亚当、阿米尔·扎雷、范端郑、斯特凡·L·谢弗、玛丽·伯特、比约恩·克拉本德、叶丽莎维塔·波布科娃、马尼什·库什瓦哈、耶加内·福鲁吉贾巴里、彼得·布劳恩、克里斯托夫·施潘、克里斯蒂安·普罗伊瑟、埃尔克·波格·冯·施特兰德曼、赫尔格·B·博德、海纳·冯·布特拉尔、威廉·贝尔特拉姆、安娜·莉娜·容格、弗兰克·阿本德罗特、伯恩德·施梅克、格哈德·胡默、奥拉娅·巴斯克斯和托比亚斯·J·埃尔布《自然通讯》14.1（2023） • 代码

利用生成式深度学习和分子动力学模拟设计靶向肽抑制剂 陈思杰、林彤、鲁奇拉·巴苏、杰里米·里奇、沈旺、易川罗、邢灿李、德华裴、莱文特·布拉克·卡拉和程晓林 Nat Commun 15, 1611（2024） • 代码

基于深度学习设计SH3信号结构域的合成同源物 连欣然、尼克萨·普拉利亚克、苏布·K·苏布拉马尼扬、莎拉·瓦辛格、拉马·兰加纳坦、安德鲁·L·弗格森《细胞系统》（2024）

CMADiff：跨模态对齐扩散用于可控蛋白质生成 周长健、邱悦熙、凌通通、李嘉峰、刘双河、王湘京、宋佳、向文胜 arXiv:2503.21450 • 代码

HER3高效Affilin®蛋白结合剂的设计 安娜·玛丽亚·迪亚斯-罗维拉、乔纳森·洛策、格雷戈尔·霍夫曼、基亚拉·帕拉拉、亚历克西斯·莫利纳、伊娜·科堡尔、曼雅·格洛泽-布赖尼格、马伦·迈辛、马德伦·茨瓦格、露西娅·迪亚斯、维克多·瓜亚尔、伊娃·博瑟-多恩克、塞尔吉·罗达 bioRxiv 2025.04.02.646551 • 代码 • 补充材料

一种结构感知的生成框架，用于探索蛋白质序列与功能空间
迪万舒·舒克拉、乔纳森·马丁、法鲁克·莫尔科斯、达维特·A·波托扬
bioRxiv 2025.09.18.676787

基于多模态深度学习的从头多机制抗菌肽设计
李晓娟、龚海帆、王岳、赵一诺、李立祥、包佩静、孔庆洲、付佳璐、万博尧、张雨萌、张景辉、倪杰坤、韩中雪、南学平、鞠坤平、孙龙飞、马跃睿、常慧君、郑梦琪、于彦波、杨晓云、左秀丽、王海娜、李艳青
Advanced Science • 代码

5.3 基于GAN的方法

用于优化蛋白质功能的反馈式生成对抗网络 古普塔，安维塔，和詹姆斯·邹
Nature Machine Intelligence 1.2 (2019) • 代码

利用生成对抗网络从抗生素耐药基因数据生成蛋白质序列 奇巴尔，普拉巴尔，和阿尔皮特·乔希
arXiv预印本 arXiv:1904.13240 (2019)

ProGAN：用于深度神经网络框架中数据增强的蛋白质溶解度生成对抗网络 韩曦、张立恒、周康、王晓楠
Computers & Chemical Engineering 131 (2019)

GANDALF：使用序列和结构生成对抗网络进行药物设计的肽生成 罗塞托，艾莉森，和周文进
第11届ACM国际生物信息学、计算生物学与健康信息学会议论文集，2020年

利用生成对抗网络设计特征可控的人源化抗体发现库 蒂莱利·阿米穆尔、杰里米·M·谢弗、兰达尔·R·凯切姆、J·亚历克斯·泰勒、鲁提利奥·H·克拉克、乔什·史密斯、丹妮尔·范·西特斯、克里斯汀·C·西斯卡、保琳·施密特、梅根·斯普拉格、布鲁斯·A·克尔温、迪恩·佩蒂特
BioRxiv (2020)

利用活性感知生成对抗网络生成具有氨苄西林水平活性的抗菌肽 安德烈斯·图茨、杜伊·福克·陈、秋子弓元、伊藤义弘、宇泽隆则和津田浩二
ACS Omega 5.36 (2020) • 代码

用于具有层次功能的从头蛋白质设计的条件生成模型
库切拉，蒂姆、马泰奥·托尼纳利和莱蒂西亚·门格-帕帕桑托斯
bioRxiv (2021)/Bioinformatics 38.13 (2022) • 代码

利用生成对抗网络扩展功能性蛋白质序列空间
多纳塔斯·雷佩卡、维金塔斯·扬尼斯基斯、劳里纳斯·卡尔普斯、埃尔日别塔·伦贝扎、伊尔曼塔斯·罗凯蒂斯、扬·兹里梅茨、西莫娜·波维洛涅内、奥德里乌斯·劳里纳纳斯、桑德拉·维克南德尔、维萨姆·阿布阿吉瓦、奥托·萨沃莱宁、罗兰达斯·梅斯基斯、马丁·K·M·英奎斯特以及阿列克谢·泽列兹尼亚克
Nature Machine Intelligence 3.4 (2021) • 代码

精准抗菌肽设计的生成方法。
乔纳森·B·费雷尔、雅各布·M·雷明顿、科林·M·范·奥特、莫娜·沙拉菲、瑞姆·阿布舒沙、伊冯娜·扬森-海宁格、塞维林·T·施内贝利、马修·J·瓦戈、萨夫万·瓦沙、贾宁·李
BioRxiv (2021) • 代码

AMPGAN v2：机器学习指导下的抗菌肽设计
科林·M·范·奥特、乔纳森·B·费雷尔、雅各布·M·雷明顿、萨夫万·瓦沙和贾宁·李
Journal of Chemical Information and Modeling 61.5 (2021)

DeepImmuno：基于深度学习的免疫原性肽预测与生成，用于T细胞免疫
李广远、巴拉吉·艾耶尔、V B 苏里亚·普拉萨特、倪一兆、内森·萨洛莫尼斯
Briefings in Bioinformatics 22.6 (2021) • 代码 • 网站

PandoraGAN：利用生成对抗网络生成抗病毒肽
施拉达·苏拉纳、普贾·阿罗拉、迪维·辛格、迪普蒂·萨哈斯拉布德、贾亚拉曼·瓦拉迪
bioRxiv (2021)

Feedback-AVPGAN：反馈引导的生成对抗网络，用于生成抗病毒肽
加野长谷川、吉隆真若、照丸寺田、曹伟和清水健太郎
Journal of Bioinformatics and Computational Biology (2022) • 代码

利用深度学习和分子动力学模拟设计抗菌肽
曹秋实、葛成、王雪洁、佩塔·J·哈维、张子轩、马源、王向红、贾欣颖、梅赫迪·莫布利、大卫·J·克雷克、蒋涛、杨金波、魏志强、王燕、常山、余利利
Briefings in Bioinformatics (2023)

基于残基理化性质景观的β-转角生成设计
瓦尔丹·萨塔尔卡尔、盖梅奇斯·D·德加加、李伟、潘玉婷、安德鲁·C·麦克尚、詹姆斯·C·冈巴特、朱莉·C·米切尔和马修·P·托雷斯
Biophysical Journal(2024) • 代码

基于反馈式生成对抗网络的从头抗菌肽设计
米凯拉·阿雷蒂·泽尔武、埃夫罗西尼·杜特西、扬尼斯·潘塔齐斯、帕纳约蒂斯·察卡利德斯
International Journal of Molecular Sciences 25.10 (2024) • 代码

二元判别器促进基于GPT的蛋白质设计
曾子硕、徐如芳、郭晋、罗小舟
bioRxiv 2023.11.20.567789 • 代码 • 补充材料

基于蛋白质语言模型引导的生成对抗网络的多种微塑料结合肽从头设计
王思远、迈克尔·T·伯格曼、卡罗尔·K·霍尔、杨峰奇
Journal of Chemical Information and Modeling 65.16 (2025)

人工智能驱动的子宫内膜癌肽类药物发现：大数据时代下的深度生成建模与分子模拟
伊斯拉尔·法蒂玛、阿卜杜尔·雷赫曼、王志博、哈菲兹·乌尔·雷赫曼、穆罕默德·阿尔达乌、达伍德·艾哈迈德·瓦赖奇、孟宇轩、李燕和廖明志
J Comput Aided Mol Des 40, 47 (2026)

5.4 基于 Transformer 的方法

包括蛋白质大型语言模型（pLLM）和自回归语言模型。

Progen：用于蛋白质生成的语言建模 / 大型语言模型可在不同家族中生成功能性蛋白质序列 阿里·马达尼、布莱恩·麦肯、尼基尔·奈克、尼提什·希里什·凯斯卡、纳姆拉塔·阿南德、拉斐尔·R·江口、普苏·黄、理查德·索彻 arXiv 预印本 arXiv:2004.03497 (2020)/Nat Biotechnol (2023) • ProGen, CTRL

基于注意力机制的神经网络生成信号肽 扎卡里·吴、凯文·K·杨、迈克尔·J·利斯卡、艾丽西亚·李、阿丽娜·巴齐拉、大卫·韦尼克、大卫·P·韦纳以及弗朗西丝·H·阿诺德 ACS Synthetic Biology 9.8 (2020)

ProtTrans：通过自监督深度学习和高性能计算破解生命密码的语言 艾哈迈德·埃尔纳加尔、迈克尔·海因辛格、克里斯蒂安·达拉戈、加利亚·雷哈维、王宇、利昂·琼斯、汤姆·吉布斯、塔马斯·费赫尔、克里斯托夫·安格勒、马丁·施泰内格尔、德布辛杜·鲍米克以及布尔克哈德·罗斯特 arXiv 预印本 arXiv:2007.06225 (2020) • 代码

用于抗体设计的生成式语言建模 Shuai, Richard W., 杰弗里·A·鲁弗洛以及杰弗里·J·格雷 bioRxiv (2021)/Cell Systems • 补充材料 • 代码

深度神经网络语言建模实现跨家族的功能性蛋白质生成 阿里·马达尼、本·克劳斯、埃里克·R·格林、苏布·苏布拉马尼安、本杰明·P·莫尔、詹姆斯·M·霍尔顿、何塞·路易斯·奥尔莫斯二世、蔡明雄、扎卡里·Z·孙、理查德·索彻、詹姆斯·S·弗雷泽、尼基尔·奈克 bioRxiv (2021)

基于结构数据的蛋白质序列采样与预测 加布里埃尔·A·奥雷利亚纳、哈维尔·卡塞雷斯-德尔皮亚诺、罗伯托·伊巴涅斯、迈克尔·P·邓恩、莱昂纳多·阿尔瓦雷斯 bioRxiv 2021.09.06.459171

基于 Transformer 的蛋白质生成，结合正则化潜在空间优化 埃格伯特·卡斯特罗、阿比纳夫·戈达瓦尔蒂、朱利安·鲁宾菲恩、凯文·吉维奇安、丹纳贾伊·巴斯卡尔以及史密塔·克里希纳斯瓦米 Nat Mach Intell (2022)/arXiv:2201.09948 • 代码

BioPhi：基于天然抗体库和深度学习的抗体设计、人源化及人源性评估平台 大卫·普里霍达、贾德·马马里、安德鲁·韦特、维罗妮卡·胡安、劳伦斯·法亚达特-迪尔曼、丹尼尔·斯沃齐尔、丹尼·A·比特顿 mAbs. 第14卷第1期. 泰勒与弗朗西斯，2022年

利用正则化 Transformer 进行引导式蛋白质生成设计 埃格伯特·卡斯特罗、阿比纳夫·戈达瓦尔蒂、朱利安·鲁宾菲恩、凯文·B·吉维奇安、丹纳贾伊·巴斯卡尔以及史密塔·克里希纳斯瓦米 arXiv 预印本 arXiv:2201.09948 (2022)

利用条件 Transformer 实现可控蛋白质设计 诺埃利亚·费鲁兹、比尔特·霍克尔 arXiv 预印本 arXiv:2201.07338 (2022)/Nature Machine Intelligence (2022) • 对第5.4节的综述

ProteinBERT：一种通用的蛋白质序列与功能深度学习模型 纳达夫·布兰德斯、丹·奥弗、雅姆·佩莱格、纳达夫·拉波波特、米哈尔·利尼亚尔 Bioinformatics，2022年3月 • 代码

ProtGPT2 是一种用于蛋白质设计的深度无监督语言模型 诺埃利亚·费鲁兹、施特芬·施密特、比尔特·霍克尔 bioRxiv/Nature Communications • 模型：huggingface 数据集：huggingface • 讲座 • 研究亮点 • 新闻

少量样本蛋白质生成 拉姆、苏米娅以及特里斯坦·贝普勒 arXiv 预印本 arXiv:2204.01168 (2022)

RITA：关于扩展生成式蛋白质序列模型的研究 丹尼尔·赫斯洛、尼科洛·扎尼凯利、帕斯卡尔·诺坦、雅科波·波利、黛博拉·马克斯 arXiv 预印本 arXiv:2205.05789 (2022) • 代码

ProGen2：探索蛋白质语言模型的边界 埃里克·尼扬克、杰弗里·鲁弗洛、伊莱·N·温斯坦、尼基尔·奈克、阿里·马达尼 arXiv:2206.13517 • 代码 • 指南

AbLang：用于完成抗体序列的抗体语言模型 托比亚斯·H·奥尔森、伊恩·H·莫尔、夏洛特·M·迪恩 Bioinformatics Advances，第2卷第1期，2022年，vbac046

重新编程预训练语言模型以进行抗体序列补全 伊戈尔·梅尔尼克、维吉尔·琴塔马拉克尚、陈品宇、帕耶尔·达斯、阿米特·杜兰达尔、英基特·帕迪以及黛芙琳娜·达斯 arXiv:2210.07144 • 代码

AbBERT：通过掩码语言建模学习抗体的人源性 丹尼斯·瓦申科、萨姆·阮、安德烈·贡卡尔维斯、费利佩·莱诺·达席尔瓦、布伦登·彼得森、托马斯·德索特尔斯以及丹尼尔·费索尔 bioRxiv 2022.08.02.502236

利用主动学习加速抗体设计 徐承佑、郭敏宇、姜恩智、金彩恩、朴恩英、姜泰贤以及金振汉 bioRxiv 2022.09.12.507690

重新编程大型预训练语言模型以进行抗体序列补全 伊戈尔·梅尔尼克、维吉尔·琴塔马拉克尚、陈品宇、帕耶尔·达斯、阿米特·杜兰达尔、英基特·帕迪以及黛芙琳娜·达斯 ICLR 2023/arXiv:2210.07144

机器学习优化候选抗体，生成高度多样化的亚纳摩尔级亲和力抗体文库 林莉、埃丝特·古普塔、约翰·斯佩思、莱斯利·辛格、拉斐尔·海梅斯、拉蒙达·苏洛·卡塞雷斯、特里斯坦·贝普勒、马修·E·沃尔什 bioRxiv 2022.10.07.502662 • 补充材料 • 代码即将公开

ZymCTRL：用于可控生成人工酶的条件语言模型 诺埃利亚·费鲁兹 NeurIPS 2022/bioRxiv 2024.05.03.592223 • Hugging Face • 海报

通过编码器-解码器语言模型进行互补链配对序列的生成式抗体设计 朱、西蒙和凯茜·魏 NeurIPS 2023 生成式人工智能与生物学（GenBio）研讨会，2023年/arXiv:2301.02748

利用生成式人工智能解锁从头设计抗体 阿米尔·沙内萨扎德、马特·麦克帕特隆、乔治·卡孙、安德烈娅·K·施泰格、约翰·M·萨顿、埃德里斯·亚辛、凯伦·麦克斯洛基、罗贝尔·海尔、理查德·帅、朱利安·阿尔韦里奥、戈兰·拉科切维奇、西蒙·莱文、约万·切约维奇、贾希尔·M·古铁雷斯、亚历克斯·莫雷黑德、奥列克谢·杜布罗夫斯基、切尔西·钟、布雷安娜·K·卢顿、尼古拉斯·迪亚斯、克里斯塔·科恩内特、丽贝卡·康斯布鲁克、海莉·卡特、蔡斯·拉孔布、伊蒂·比斯特、佩特萨迈·维莱恰克、扎赫拉·安德森、李晨秀、保罗·布林加斯、金伯利·阿拉尔孔、贝利·奈特、梅西·拉达奇、凯瑟琳·巴特曼、盖琳·科佩克-贝利沃、达尔顿·查普曼、乔舒亚·本内特、阿比盖尔·B·文图拉、古斯塔沃·M·卡纳莱斯、穆塔帕·高瓦、克里安妮·A·杰克逊、罗丹特·卡圭亚特、安珀·布朗、道格拉斯·加尼尼·达席尔瓦、哲远·郭、沙希德·阿卜杜勒哈克、莉莲·R·克鲁格、迈尔斯·甘德尔、恩京·亚皮奇、乔舒亚·迈尔、莎罗尔·巴查斯 bioRxiv（2023）：2023-01 • 数据 • 新闻 • 博客 • 商业化

一种用于锌指蛋白设计的通用深度学习模型，可实现转录因子重编程 大卫·M·伊奇川、奥萨马·阿卜丁、纳德尔·阿莱拉苏尔、曼朱纳塔·科根努鲁、艾普丽尔·L·穆勒、韩文、大卫·O·吉甘蒂、格雷戈里·W·戈德堡、萨曼莎·亚当斯、杰弗里·M·斯宾塞、罗齐塔·拉扎维、萨特拉·尼姆、洪正、考特妮·吉翁科、芬尼根·T·克拉克、阿列克谢·斯特罗卡奇、蒂莫西·R·休斯、蒂莫泰·利奥内、米科·泰帕莱、菲利普·M·金和马库斯·B·诺耶斯 Nat Biotechnol（2023）

XuperNovo®/ProteinGPT XtalPi 新闻 • 新闻2 • 官网 • 商业化

评估提示调优在条件蛋白序列生成中的应用 安德烈娅·纳坦森、凯文·克莱因、伯恩哈德·Y·雷纳德、梅拉尼亚·诺维茨卡、雅库布·M·巴托舍维奇 bioRxiv 2023.02.28.530492 • 代码

AB-Gen：基于生成式预训练Transformer和深度强化学习的抗体文库设计 肖鹏·徐、天田·徐、觉晓·周、星宇·廖、若驰·张、宇·王、陆·张、欣·高 bioRxiv 2023.03.17.533102 • 代码 • 补充材料 • 数据

基于深度学习和对抗性注意力神经网络的无监督跨域翻译及其在音乐启发的蛋白质设计中的应用 布勒，马库斯·J Patterns 4.3（2023） • 代码

ProtFIM：基于蛋白质语言模型的中间填充式蛋白序列设计 李、尤翰和哈孙·于 arXiv预印本 arXiv:2303.16452（2023）/ICLR 2023

REXzyme：用于生成自然界中不存在的新酶的翻译机器 塞巴斯蒂安·林德纳、迈克尔·海因辛格、诺埃利亚·费鲁兹论文即将发表 • Hugging Face

一种通用的蛋白质设计机器学习模型，可生成功能性的从头设计蛋白质 蒂莫西·P·赖利、普里亚·卡兰塔里、伊斯梅尔·纳德里、库希亚尔·阿齐米安、凯茜·Y·魏、奥列格·马图索夫斯基、穆罕默德·S·帕尔萨 bioRxiv 2025.03.21.644400 • 新闻 • 仓库 • 商业化

利用对比语言建模为构象多样的靶标设计从头合成的肽类结合剂 苏哈斯·巴特、卡良·帕莱普、劳伦·洪、乔伊·毛、田正·叶、蕾玛·艾耶尔、林·赵、天来·陈、索菲娅·文科夫、里奥·沃森、田王、迪维亚·斯里贾伊、文卡塔·斯里卡尔·卡维拉尤尼、克谢尼娅·霍利娜、施雷·戈埃尔、普拉纳伊·武雷、阿尼鲁达·H·德什潘德、斯科特·索德林、马修·德丽莎、普拉南·查特吉 bioRxiv 2023.06.26.546591 • 代码 • 补充材料

xTrimoPGLM：统一的1000亿参数规模预训练Transformer，用于破译蛋白质的语言 博·陈、兴义·程、李傲·耿阳、申·李、新·曾、博彦·王、龚·景、迟明·刘、奥汉·曾、宇晓·董、杰·唐、乐·宋 bioRxiv 2023.07.05.547496/Nat Methods（2025） • 新闻 • 官网 • 代码 • 模型 • 商业化

TULIP——一种基于Transformer的无监督语言模型，用于相互作用的肽和T细胞受体，可泛化至未见表位 巴特勒米·梅纳尔-皮加诺、克里斯托夫·费瑙尔、马丁·魏格特、亚历山德拉·M·瓦尔察克、蒂埃里·莫拉 bioRxiv 2023.07.19.549669 • 代码

利用小型蛋白质语言模型高效准确地生成序列 雅伊萨·塞拉诺、塞尔吉·罗达、维克托·瓜利亚尔、阿莱克西斯·莫利纳 bioRxiv 2023.08.04.551626

利用实验室数据结合语言模型指导设计提升抗体亲和力 本·克劳斯、苏布·苏布拉马尼安、汤姆·袁、玛丽莎·杨、亚伦·萨托、尼基尔·奈克 bioRxiv 2023.09.13.557505

NL2ProGPT：驯服大型语言模型以实现对话式蛋白质设计 匿名 ICLR 2024

PepMLM：通过掩码语言模型进行靶向序列条件下的肽结合物生成 陈天来、萨拉·佩尔采姆利迪斯、里奥·沃森、文卡塔·斯里卡尔·卡维拉尤尼、艾什莉·许、普拉纳伊·武雷、里沙布·普卢古尔塔、索菲娅·文科夫、劳伦·洪、王天、维维安·尤迪斯特拉、埃琳娜·哈雷尔、赵琳、普拉南·查特吉 arXiv:2310.03842 • 代码

利用预训练生成式大型语言模型从头设计抗体CDRH3 何浩怀、何兵、关磊、赵宇、陈冠兴、朱庆戈、陈育谦、李婷、姚建华 bioRxiv 2023.10.17.562827/Nature Communications 15.1 (2024) • 代码 • 数据

SaLT&PepPr是一种界面预测型语言模型，用于设计肽引导的蛋白质降解剂 加里克·布里希、叶天正、劳伦·洪、王天、康纳·蒙蒂切洛、娜塔莉亚·洛佩斯-巴博萨、索菲娅·文科夫、维维安·尤迪斯特拉、赵琳、埃琳娜·哈雷尔、陈天来、萨拉·佩尔采姆利迪斯、卡良·帕莱普、苏哈斯·巴特、贾亚尼·克里斯托弗、李欣宁、刘彤、张苏、莉莲·彼得森、马修·P·德丽莎以及普拉南·查特吉 Commun Biol 6, 1081 (2023) • 代码

ProteinNPT：利用非参数化Transformer改进蛋白质性质预测与设计 帕斯卡尔·诺丁、鲁本·魏茨曼、黛博拉·S·马克斯、亚林·加尔 bioRxiv 2023.12.06.570473 • 代码

大型语言模型在蛋白质设计与建模中的前景 乔治欧·瓦伦蒂尼、达里奥·马尔基奥迪、杰西卡·格利奥佐、马尔科·梅西蒂、毛里西奥·索托-戈麦斯、阿尔贝托·卡布里、贾斯汀·里斯、埃莱娜·卡西拉吉以及彼得·N·罗宾逊 Frontiers in Bioinformatics 3 (2023)

基于检索与领域反馈的对话式药物编辑 刘盛超、王炯晓、杨一金、王成鹏、刘玲、郭宏宇、肖朝伟 ICLR (2024) • 代码 • 网站

ProtAgents：结合物理学与机器学习的大型语言模型多智能体协作进行蛋白质发现 阿里雷扎·加法罗拉希、马库斯·J·布勒 arXiv:2402.04268 • 代码

利用语言模型设计蛋白质 鲁弗洛，J.A.，马达尼，A Nat Biotechnol 42, 200–202 (2024) • 综述

ProLLaMA：用于多任务蛋白质语言处理的蛋白质大型语言模型 吕志浩、林宗英、李浩、刘宇阳、崔嘉熙、陈育谦、袁立、田永红 arXiv:2402.16445 • 代码

将机器学习与基于结构的蛋白质设计相结合，以预测和工程化蛋白质的翻译后修饰 莫里茨·埃尔特尔、维克拉姆·希普尔·穆利根、杰克·B·麦圭尔、谢尔盖·雷斯科夫、罗科·莫雷蒂、托本·席夫纳、延斯·迈勒、克拉拉·T·舍德尔 PLOS Computational Biology 20(3): e1011939 • 代码

以进化规模模型（ESM）为约束，结合Rosetta序列设计与蛋白质语言模型预测 莫里茨·埃尔特尔、延斯·迈勒以及克拉拉·T·舍德尔 ACS Synth. Biol. 2024 • 代码

利用AI和胚系模板设计抗原特异性抗体CDRH3序列 托马·M·马里诺夫、亚历山德拉·A·阿布-什迈斯、亚历克西斯·K·扬克、伊韦林·S·格奥尔基耶夫 bioRxiv 2024.03.22.586241

通过建模CRISPR-Cas序列宇宙设计高功能基因组编辑工具 杰弗里·A·鲁弗洛、斯蒂芬·奈法奇、约瑟夫·加拉格尔、阿迪约特·巴特纳加尔、乔尔·比泽尔、里法特·侯赛因、乔丹·罗斯、珍妮弗·叶普、艾米丽·希尔、马丁·佩塞萨、亚历山大·J·米斯克、彼得·卡梅隆、阿里·马达尼 bioRxiv 2024.04.22.590591 • 代码

基于局部域对齐的功能性蛋白质设计 袁超浩、李松友、叶格彦、张义坤、黄龙凯、黄文兵、刘伟、姚建华、荣宇 arXiv:2404.16866

蛋白质结构的连续语言 卢卡斯·比列拉、安东·奥雷斯坦、阿隆·斯塔尔马克、佐藤健太、马特乌什·卡杜克、本·默雷尔 bioRxiv 2024.05.11.593685 • 代码

由功能重要位点和小分子底物引导的生成式酶设计 宋振桥、赵云龙、石文贤、金文功、杨洋、李磊 arXiv:2405.08205/ICML 2024 • 代码

用于抗体序列理解的生成式基础模型 贾斯汀·巴顿、阿雷塔斯·加斯帕里乌纳斯、大卫·A·亚丁、豪尔赫·迪亚斯、弗朗西斯卡·L·奈斯、丹妮尔·H·明斯、奥利维亚·斯纳登、切尔西·波瓦尔、萨拉·瓦列·托马斯、哈里·多布森、詹姆斯·HR·法默里、李镇宇、雅各布·D·加尔森 bioRxiv 2024.05.22.594943 • huggingface

用于现实抗体设计的解耦序列与结构生成 金娜英、金珉洙、安成洙、朴晋九 arXiv:2402.05982/正在TMLR审稿中 • 代码

解决抗体胚系偏倚及其对语言模型的影响，以改进抗体设计 托比亚斯·H·奥尔森、伊恩·H·莫尔、夏洛特·M·迪恩 bioRxiv 2024.02.02.578678/Bioinformatics (2024): btae618 • 代码

MoFormer：基于条件Transformer联合多模态融合描述符的多目标抗菌肽生成 王丽、付向征、杨嘉豪、张欣怡、叶秀才、刘一平、樱井哲也、曾祥祥 arXiv:2406.00735

HELM-GPT：利用生成式预训练Transformer进行从头宏环肽设计 许晓鹏、许晨程、何文佳、魏乐松、李浩洋、周珏骁、张若驰、王宇、熊元鹏、高鑫 Bioinformatics (2024): btae364 • 代码

统一序列、结构与描述，实现任意蛋白质生成——基于大型多模态模型HelixProtX 陈志远、陈天昊、谢成刚、薛阳、张晓楠、周景波、方小敏 arXiv:2407.09274 • 代码

人工智能驱动科学发现时代下，以基础模型方法指导抗菌肽设计 王继科、冯建文、康宇、潘培臣、葛静轩、王燕、王明阳、吴振兴、张星彩、于佳萌、张旭君、王天悦、温利荣、严广宁、邓亚峰、史辉、谢昌宇、蒋志辉、侯廷军 arXiv:2407.12296 • 代码

条件序列—结构整合：一种用于精准抗体工程与亲和力优化的新方法 贝尼亚明·贾米阿拉赫马迪、马赫穆德·查曼卡赫、穆罕默德·科汉德尔、阿里·戈德西 bioRxiv 2024.07.16.603820 • 博客

moPPIt：利用蛋白质语言模型从头生成基序特异性结合体 陈彤、张依诺、普拉南·查特吉 bioRxiv 2024.07.31.606098 • 代码

迈向基于自然语言的从头蛋白质设计 戴丰源、范玉良、苏瑾、王晨桐、韩晨晨、周锡彬、刘建明、钱慧、王顺志、曾安平、王雅洁、袁发杰 bioRxiv 2024.08.01.606258 • 代码 • 演示

利用大型语言模型设计蛋白质：改进与比较分析 卡米亚尔·泽纳利普尔、内达·詹希迪、莫妮卡·比安奇尼、马可·马吉尼、马可·戈里 arXiv:2408.06396 • 代码

使用Raygun微型化、改造并增强天然蛋白质 卡皮尔·德夫科塔、庄内大智、毛乔伊、斯科特·H·索德林、罗希特·辛格 bioRxiv 2024.08.13.607858 • 代码

TourSynbio：多模态大模型与智能体框架，用于连接文本与蛋白质序列以进行蛋白质工程 沈毅青、陈赞、米哈伊尔·马马拉基斯、刘云耕、李天斌、苏延州、何俊俊、皮耶特罗·利奥、王宇光 arXiv:2408.15299 • 代码 • 模型 • 网站 • 新闻 • 商业化

AbGPT：通过生成式语言建模进行从头抗体设计 德斯蒙德·关、阿米尔·巴拉蒂·法里马尼 arXiv:2409.06090 • 代码

PepINVENT：超越天然氨基酸的生成式肽设计 格克切·盖兰、琼·保罗·珍妮特、亚历山德罗·蒂博、何佳真、阿塔纳斯·帕特罗诺夫、米哈伊尔·卡别绍夫、弗洛里安·大卫、维尔加德·切希茨基、奥拉·恩格奎斯特、莱昂纳多·德·玛利亚 arXiv:2409.14040

利用带有适配器的蛋白质语言模型进行条件酶生成 杰森·杨、阿迪约特·巴特纳加尔、杰弗里·A·鲁弗洛、阿里·马达尼 arXiv:2410.03634 • 代码

重新审视机器学习的成功指标：从公平性与可解释性到蛋白质设计 弗朗西斯·丁加州大学伯克利分校2024年博士论文 • 博士论文

利用TransformerBeta计算设计靶向线性肽结合体 赵浩文、弗朗切斯科·A·阿普里莱、芭芭拉·布拉维 arXiv:2410.16302 • 代码

用于蛋白质构象生成的结构语言模型 陆嘉睿、陈晓音、卢思哲文、施辰策、郭洪宇、约书亚·本吉奥、唐健 arXiv:2410.18403 • 代码

Peptide-GPT：利用生成式预训练Transformer与生物信息学监督进行肽的生成式设计 阿尤什·沙阿、查克拉达尔·贡图博伊纳、阿米尔·巴拉蒂·法里马尼 arXiv:2410.19222 • 代码

一种自适应自回归扩散方法，用于设计活性人源化抗体与纳米抗体 马健、吴凡迪、徐挺扬、徐少勇、刘伟、迪文·颜、白启峰、姚建华 bioRxiv 2024.10.22.619416 • 代码

用于蛋白质设计的概念瓶颈语言模型 阿亚·阿卜杜勒萨拉姆·伊斯梅尔、图奥马斯·奥伊卡里宁、艾米·王、朱利叶斯·阿德巴约、塞缪尔·斯坦顿、泰勒·乔伦、约瑟夫·克莱因亨茨、艾伦·古德曼、埃克托·科拉达·布拉沃、姜庆贤、内森·C·弗雷 arXiv:2411.06090

利用生成式语言模型从头设计三磷酸异构酶
塞尔吉奥·罗梅罗-罗梅罗、亚历山大·E·布劳恩、蒂莫·科森代、诺埃利亚·费鲁斯、施特芬·施密特、比尔特·霍克尔
bioRxiv 2024.11.10.622869

自然语言提示引导新型功能蛋白质序列的设计
尼克沙·普拉利亚克、休·叶、米兰达·摩尔、迈克尔·索科利奇、拉马·兰加纳坦、安德鲁·L·弗格森
bioRxiv 2024.11.11.622734

通过提示式语言模型实现多用途可控蛋白质生成
王泽远、陈彬彬、丁可言、曹嘉文、秦明、牛雅丹、庄翔、李晓彤、冯克华、徐通、张宁宇、于浩然、张强、陈华军
bioRxiv 2024.11.17.624051

抗病毒肽——生成式预训练变换器（AVP-GPT）：一种基于深度学习的抗病毒肽设计模型，具备高通量发现能力和卓越效力
赵华健、宋耿申
Viruses 16.11 (2024)

泛蛋白质设计学习实现低资源酶设计的任务自适应泛化能力
郑江斌、王戈、张翰、Stan Z. Li
arXiv:2411.17795

ProtDAT：一种基于任意蛋白质文本描述的统一蛋白质序列设计框架
郭小宇、李一凡、刘源、潘晓勇、沈洪斌
arXiv:2412.04069 • 代码

基于注释指导的蛋白质设计与多级结构域对齐
袁超浩、李松友、叶革彦、张益坤、黄龙凯、黄文兵、刘伟、姚建华、荣宇
arXiv:2404.16866

用于功能预测和蛋白质设计的开源蛋白质语言模型
希瓦桑卡兰·瓦纳贾·潘迪、巴拉特·拉姆孙达尔
arXiv:2412.13519

利用超活性转座酶的发现及语言模型引导设计
马克·居埃尔、季米特里耶·伊万契奇、亚历杭德罗·阿古德洛、乔纳森·林德斯特罗姆-沃特里、杰西卡·哈拉巴-华莱士、玛丽亚·加洛、亚历杭德罗·拉赫尔、伊蕾妮·伊格拉斯、费德里科·比列奇、玛尔塔·桑维森特、保罗·佩塔齐、诺埃利亚·费鲁斯、阿文西亚·桑切斯-梅希亚斯、拉维·达斯
预印本 • 代码 • 基于Progen2

利用大型语言模型生成抗原特异性重链-轻链配对抗体序列
佩里·T·瓦斯丁、妮可·V·约翰逊、亚历克西斯·K·扬克、索菲娅·赫尔德、托马·M·马里诺夫、格温·乔丹、莱娜·范登阿贝尔、法尼·潘图利、丽贝卡·A·吉莱斯皮、马修·J·武科维奇、克林顿·M·霍尔特、金正烈、格兰特·汉斯曼、珍妮弗·洛格、海伦·Y·楚、莎拉·F·安德鲁斯、真守兼喜、朱塞佩·A·索托、泰德·M·罗斯、丹尼尔·J·谢沃德、杰森·S·麦克莱伦、亚历山德拉·A·阿布-什迈斯、伊韦林·S·格奥尔基耶夫
bioRxiv 2024.12.20.629482 • 补充资料

基于LLM偏好优化的可控蛋白质序列生成
刘向宇、刘毅、陈思磊、胡伟
arXiv:2501.15007 • 代码

基于LLM基础模型发现具有显著抗菌效力的抗菌肽
王继科、冯建文、康宇、潘培晨、葛静萱、王燕、王明阳、吴振兴、张兴才、于佳萌、张旭俊、王天悦、文立荣、严广宁、邓亚峰、石慧、谢昌宇、蒋志辉以及侯廷军
Sci. Adv.11,eads8932(2025) • 代码

CasGen：一种具有分类与基于间隔优化的CRISPR Cas蛋白设计正则化生成模型
巴拉尼·南米、文迪·M·贾亚辛格-阿拉奇奇格、西塔·希里莎·马杜古拉、玛丽亚·阿蒂莱斯、夏琳·诺根·拉德勒、泰勒·范、刘津、王寿义
bioRxiv 2025.02.28.640911 • 代码

用于蛋白质设计的语言模型
李镇燮、奥斯马·阿卜丁和菲利普·M·金
Current Opinion in Structural Biology 92 (2025) • 综述

基于结构约束的生成式语言模型进行抗原特异性抗体的从头设计
贾雨然、何冰、吕天旭、杨晓、赵天一、姚建华
OpenReview

SOAPI：基于连体模型生成避免脱靶效应的蛋白质相互作用
索菲娅·文科夫、奥斯卡·戴维斯、亚历山大·汤、乔伊·博斯、普拉南·查特吉
OpenReview

Prot42：一类新型蛋白质语言模型，用于目标导向的蛋白质结合剂生成
穆罕默德·阿曼·赛义德、恩京·泰金、玛丽亚姆·纳迪姆、南希·A·埃尔纳克、阿汗·辛格、娜塔莉娅·瓦西里耶娃、布尔巴巴·本·阿莫尔
arXiv:2504.04453 • 模型

定制蜘蛛丝：基于机械性能条件的生成模型在蛋白质工程中的应用
尼鲁·杜贝、埃琳·卡尔松、米格尔·安赫尔·雷东多、约翰·雷梅加德、安娜·瑞辛、赫德维格·谢尔斯特伦
arXiv:2504.08437 • 基于ProtGPT2

用于可控蛋白质生成和表征学习的多模态基础模型
小提摩西·费伊·张二世、特里斯坦·贝普勒
博客 • 商业化

阐明多模态蛋白质语言模型的设计空间
谢承延、王新友、张岱恒、薛冬宇、叶飞、黄书坚、郑再祥、顾全全
arXiv:2504.11454

规模扩展解锁更广泛的蛋白质生成与更深层次的功能理解
阿迪约特·巴特纳加尔、萨尔塔克·贾因、乔尔·比泽尔、塞缪尔·C·库兰、亚历山大·M·霍夫纳格尔、凯尔·青、迈克尔·马尔廷、斯蒂芬·奈法奇、杰弗里·A·鲁弗洛、阿里·马达尼
bioRxiv 2025.04.15.649055 • 代码

Sparks：多智能体人工智能模型揭示蛋白质设计原则
阿里雷扎·加法罗拉希、马库斯·J·布勒
arXiv:2504.19017 • 代码

基于动态蛋白质词汇表的蛋白质设计
刘诺威、匡家豪、刘艳婷、孙长志、季涛、吴元彬、满兰
arXiv:2505.18966 • 代码

ProtMamba：一种兼顾同源性但无需比对的蛋白质状态空间模型
达米亚诺·斯加博萨、西里尔·马尔布朗克、安妮-弗洛伦斯·比特博尔
bioRxiv 2024.05.24.595730 • 代码

自然语言引导的配体结合蛋白设计
宋振乔、拉米思·赫蒂亚拉奇、李川、谢建文、李磊
arXiv:2506.09332

面向序列设计的蛋白质语言模型可解释性研究
安德烈娅·洪克林格、诺埃利亚·费鲁兹
arXiv:2506.19532

Metalorian：基于分类器引导扩散采样的重金属性结合肽从头生成
张一诺、迪维娅·斯里贾伊、扎卡里·奎因、普拉南·查特吉
bioRxiv 2025.07.10.664242 • 基于ESM2

ProteinReasoner：具有思维链推理能力的多模态蛋白质语言模型，用于高效蛋白质设计
刘超中、曹琳琳、季绍敏、王浩、蒋涛睿、高章阳、郭宇成、杨明、张晓明
bioRxiv 2025.07.21.665832

戴霍夫图谱：扩展序列多样性以提升蛋白质生成质量
凯文·K·杨、萨拉·阿拉姆达里、亚历克斯·J·李、凯莉·凯马克-洛夫莱斯、萨米尔·查尔、加里克·布里克西、卡尔莱斯·多明戈-恩里奇、王晨彤、吕苏悦、尼科洛·富西、尼尔·滕亨霍尔茨、艾娃·P·阿米尼
bioRxiv 2025.07.21.665991 • 代码 • 数据集

AI智能体虚拟实验室设计出新型SARS-CoV-2纳米抗体
凯尔·斯旺森、韦斯利·吴、纳什·L·布拉昂、约翰·E·帕克及詹姆斯·邹
Nature (2025)

通过知识偏好优化提升蛋白质生成的安全性和可控性
王宇豪、丁可然、冯克华、王泽远、秦明、李晓彤、张强、陈华俊
arXiv:2507.10923 • 代码

基于掩码语言模型的目标序列条件化肽类结合物设计
陈天来、扎卡里·奎因、玛德琳·杜马斯、彭克里斯蒂娜、洪劳伦、洛佩斯-冈萨雷斯·莫伊塞斯、梅斯特雷·亚历山大、沃森·里奥、文科夫·索菲娅、赵琳、吴建利、斯塔夫兰德·奥黛丽、谢珀斯-丘·真弓、王天子、斯里贾伊·迪维娅、蒙蒂切洛·康纳、普拉奈·武雷、普卢古尔塔·里沙布、佩尔采姆利迪斯·萨拉、霍利娜·克谢尼娅、戈埃尔·施雷伊、德丽莎·马修·P、阿什利·齐·詹-坦、特鲁安·雷伊、阿吉拉尔·赫克托·C及查特吉·普拉南
Nat Biotechnol (2025) • 代码 • 模型

ICEPIC：从序列中发现冰结合蛋白的工具包
张吉米、苏布拉克什米·苏雷什、施穆埃尔·格莱泽、索菲娅·尤文斯、阿亚里亚·文卡特、瓦伦丁·祖尔科韦尔、托马斯·比尔纳基、温丹尼尔、李凯瑟琳、埃斯拉米·穆罕默德、巴克豪特-怀特·苏珊
bioRxiv 2025.08.08.669420 • 补充材料 • 代码

基于EiRA的改进型多模态蛋白质语言模型驱动的通用生物分子结合蛋白设计
曾文武、邹海涛、李晓宇、王小琪、彭绍亮
bioRxiv 2025.09.02.673615 • 代码

LSMTCR：用于表位特异性T细胞受体从头设计的可扩展多架构模型
张瑞豪、刘晓
arXiv:2509.07627

PRIME：用于协调蛋白质工程中动态计算工作流的多智能体环境
周宇洋、苏瑾、张嘉伟、胡万阳、陶天立、李冠琦、周锡彬、范力、袁发杰
bioRxiv 2025.09.22.677756

使用Agent Rosetta进行蛋白质设计：专用科学智能体的案例研究
雅各波·特内吉、塔尼亚·马尔瓦、阿尔贝托·比埃蒂、P·道格拉斯·伦弗鲁、维克拉姆·希普尔·穆利根、西亚瓦什·戈尔卡尔
NeurIPS 2025海报

超活性转座酶的发现及其蛋白质语言模型指导下的设计
季米特里耶·伊万契奇、亚历杭德罗·阿古德洛、乔纳森·林德斯特罗姆-沃特兰、杰西卡·哈拉巴-华莱士、玛丽亚·加洛、拉维·达斯、亚历杭德罗·拉格尔、豪尔赫·埃雷罗-维森特、伊蕾妮·伊格拉斯、费德里科·比列奇、玛尔塔·桑维森特-加西亚、保罗·佩塔齐、诺埃利亚·费鲁兹、阿文西亚·桑切斯-梅希亚斯及马克·圭尔
Nat Biotechnol (2025) • 代码 • 基于Progen2

通过合成与可编程的功能特征进行抗体Fc变体的生成式设计
爱德华·B·欧文、托马斯·比基亚斯、埃万格洛斯·斯坦科普洛斯、莱斯特·弗雷、尼克·舒尔曼、安玛丽·K·沃伦德、海伦·施密德、迪米特里·库科斯、杨慧琳、米农·梅森、威廉·凯尔顿、赛·T·雷迪
bioRxiv 2025.10.10.681689

推理模型在蛋白质从头设计中优于标准语言模型
阿尔弗雷德·格赖森、丛龙飞、格赖森·小珀、谢尔盖·奥夫钦尼科夫
Agents4Science

DLFea4AMPGen：通过整合深度学习模型所学特征进行抗菌肽的从头设计
高汉、关菲菲、罗博文、张东东、刘伟、沈玉英、范凌熙、徐国顺、王元、涂涛、吴宁峰、姚斌、罗慧英、滕岳、田健及黄霍庆
Nat Commun 16, 9134 (2025) • 代码

高性能Sec型信号肽的混合深度学习架构从头设计
戴小鹏、孟向春、周英俊、李志敏、于继、乌尔里希·施瓦内贝格、李宗林
JACS Au 5.10 (2025) • 代码

MOFormer：基于帕累托多目标Transformer导航抗菌肽设计空间
王丽、傅向正、杨佳豪、张欣怡、叶秀才、樱井哲也、曾祥祥、刘一平
Briefings in Bioinformatics 26.6 (2025) • 代码

利用大型语言模型生成抗原特异性配对链抗体
佩里·T·瓦斯丁、妮可·V·约翰逊、亚历克西斯·K·扬克、索菲娅·赫尔德、托马·M·马里诺夫、格温·约尔丹、丽贝卡·A·吉莱斯皮、勒娜·范登阿贝尔、法尼·潘图利、奥利维亚·C·鲍尔斯、马修·J·武科维奇、克林顿·M·霍尔特、郑烈尔·金、格兰特·汉斯曼、珍妮弗·洛格、海伦·Y·楚、莎拉·F·安德鲁斯、真守兼喜、朱塞佩·A·索托、泰德·M·罗斯、丹尼尔·J·舍沃德、杰森·S·麦克莱伦、亚历山德拉·A·阿布-施迈斯以及伊韦林·S·格奥尔基耶夫
Cell（2025） • 代码 • 模型

超越蛋白质语言模型：用于机制性酶设计的代理式LLM框架
布鲁诺·雅各布、库什布·阿加瓦尔、马塞尔·贝尔、彼得·赖斯、西蒙内·劳盖伊
arXiv:2511.19423

通用型大型语言模型，如DeepSeek V3.2，已具备蛋白质设计能力
李嘉伟、董欣秀
bioRxiv 2025.11.23.689994 • 代码

基于实验验证的大型语言模型智能体群用于蛋白质序列设计
菲奥娜·Y·王、迪·盛·李、大卫·L·卡普兰、马库斯·J·布勒
arXiv:2511.22311 • 代码

蛋白质语言模型的自蒸馏微调提升蛋白质设计的通用性
阿敏·塔瓦科利、拉斯万特·穆鲁甘、奥赞·戈克代米尔、阿尔文德·拉马纳坦、弗朗西斯·阿诺德、阿尼玛·阿南德库马尔
arXiv:2512.09329

TCRdesign：一种抗原特异性生成式语言模型，用于从头设计T细胞受体
李晓坤、杨强、徐龙、董卫和、王宽泉、董苏宇、王伟、罗功宁、张宪宇、杨天松、高鑫、王国华
Briefings in Bioinformatics，第26卷，第6期，2025年11月，bbaf691 • 数据 • 代码

TcrDesign：表位特异性全长T细胞受体的从头设计
刁凯旋、陈静、赵向宇、吴涛、邱蝶、王伟良、王浩鹏、刘雪松
bioRxiv 2026.01.15.699824 • 代码

TCRAD：面向抗原靶向的T细胞受体设计端到端框架
李晨奥、郭耀驰、关欣、陈辉、张勇、杨鹏远、楼继忠
bioRxiv 2026.01.21.700513

从头功能蛋白质序列生成：通过再生与大型语言模型克服数据稀缺性
任晨宇、何大海、黄健
Briefings in Bioinformatics • 数据

5.5 基于贝叶斯的方法

用于组合型贝叶斯优化的乐观博弈及其在蛋白质设计中的应用 梅利斯·伊莱达·巴尔、皮埃尔·朱塞佩·塞萨、莫米尔·穆特尼、安德烈亚斯·克劳斯 NeurIPS 2023 实际世界中的自适应实验设计与主动学习研讨会，2023年/arXiv:2409.18582

利用机器学习发现酶的新肽类底物 洛里莉·塔洛林、王嘉磊、金宇柱、斯瓦加特·萨胡、尼古拉斯·M·科萨、杨璞、马修·汤普森、迈克尔·K·吉尔森、彼得·I·弗雷泽、迈克尔·D·伯卡特及内森·C·吉安内斯基 Nature Communications 9.1 (2018) • 代码

基于批处理贝叶斯优化的生物序列设计 大卫·贝兰格、苏哈尼·沃拉、泽尔达·马里埃特、拉米娅·德什潘德、大卫·多汉、克里斯托夫·安格缪勒、凯文·墨菲、奥利维埃·沙佩尔、露西·科尔韦尔机器学习与物理科学研讨会（NeurIPS 2019）

利用贝叶斯学习进行晶格蛋白设计 高桥、友荣、乔治·奇肯吉和德喜时田 arXiv:2003.06601/Physical Review E 104.1 (2021): 014404

接下来是什么序列？用于蛋白质序列贝叶斯优化的预训练集成模型 齐悦·杨、卡塔琳娜·A·米拉斯、安德鲁·D·怀特 bioRxiv 2022.08.05.502972 • 代码 • 补充材料 • Colab

AntBO：通过组合型贝叶斯优化实现现实世界的自动化抗体设计 阿西夫·汗、亚历山大·I·考温-里弗斯、安托万·格罗尼特、德里克-戈-欣·戴克、菲利普·A·罗伯特、维克托·格雷夫、伊娃·斯莫罗迪娜、普尼特·拉瓦特、卡米尔·德雷茨科夫斯基、拉赫马德·阿克巴尔、拉斯乌尔·图图诺夫、丹尼·布-阿玛尔、王俊、阿莫斯·斯托基、海瑟姆·布-阿玛尔 arXiv 预印本（2022）/Cell Reports Methods (2023): 100374

利用去噪自编码器加速生物序列设计的贝叶斯优化 塞缪尔·斯坦顿、韦斯利·麦道克斯、内特·格鲁弗、菲利普·马费托内、艾米丽·德拉尼、佩顿·格林赛德、安德鲁·戈登·威尔逊 ICML 2022 • 代码

蛋白质设计的统计力学 高桥、友荣、乔治·奇肯吉和德喜时田 arXiv 预印本 arXiv:2205.03696 (2022)

PropertyDAG：面向生物序列设计的偏序混合变量属性的多目标贝叶斯优化 朴智源、塞缪尔·斯坦顿、萨义德·萨雷米、安德鲁·沃特金斯、亨利·德怀尔、弗拉基米尔·格里戈里耶维奇、理查德·邦诺、史蒂芬·拉、京贤·乔 arXiv:2210.04096

蛋白质稳定性、构象特异性和设计的概率视角 雅各布·A·斯特恩、泰勒·J·弗里、金伯利·L·斯特恩、斯宾塞·加迪纳、尼古拉斯·A·达利、布拉德利·C·邦迪、约书亚·L·普赖斯、大卫·温盖特、丹尼斯·德拉科尔特 bioRxiv 2022.12.28.521825/Scientific Reports 13.1 (2023) • 代码 • 补充材料

利用多目标贝叶斯优化设计含非蛋白质氨基酸的抗菌肽 村上Y、石田S、出水Y、寺山K ChemRxiv. 剑桥：剑桥开放参与；2023年 • 代码

Vaxformer：抗原性可控的Transformer模型用于针对SARS-CoV-2的疫苗设计 阿里奥·普拉迪普塔·杰马、米哈尔·科比埃拉、阿希尔·弗雷斯、阿吉塔·拉詹、迭戈·A·奥亚尔孙、哈维尔·安东尼奥·阿尔法罗 arXiv:2305.11194 • 代码

基于蛋白质语言模型的风险感知批处理贝叶斯优化实现高效抗体设计 严正旺、博越旺、天宇石、杰富、易周、志卓张 bioRxiv 2023.11.06.565922

整合蛋白质结构预测与贝叶斯优化用于肽设计 内金·曼绍尔、何飞、王多林、徐东 NeurIPS 2023 生成式AI与生物学（GenBio）研讨会，2023年

蛋白质序列设计的贝叶斯优化：具有零样本蛋白质语言模型先验均值的高斯过程 卡罗琳·本贾明斯、希卡·苏拉纳、奥利弗·本特、马里乌斯·林道尔、保罗·达克沃思机器学习与结构生物学研讨会，NeurIPS 2024

通过Profile贝叶斯流引导蛋白质家族设计 宫静静、裴宇、龙思宇、宋宇轩、张哲、黄文浩、曹子瑶、张淑怡、周浩、马伟英 arXiv:2502.07671

AMix-1：通往测试时可扩展蛋白质基础模型的道路
昌泽·吕、周江、龙思宇、王立豪、冯江涛、薛东宇、裴宇、王浩、张哲睿、蔡宇晨、高志强、马子渊、胡家凯、高超臣、宫静静、宋宇轩、张淑怡、郑晓青、熊德义、白雷、欧阳万力、张雅琴、马伟英、周博文、周浩
arXiv:2507.08920 • 代码

5.6 基于强化学习

基于模型的强化学习在生物序列设计中的应用 克里斯托夫·安格穆勒、大卫·多汉、大卫·贝兰杰、拉米娅·德什潘德、凯文·墨菲、露西·科尔韦尔国际表征学习会议。2019年

用于抗体设计的结构化Q学习 亚历山大·I·考温-里弗斯、菲利普·约翰·戈林斯基、艾瓦尔·索特拉、阿西夫·汗、刘福瑞、王军、扬·彼得斯、海萨姆·布·安马尔 arXiv预印本 arXiv:2209.04698 (2022)

基于模型的强化学习在潜在空间中进行蛋白质序列设计 李敏智、路易斯·费利佩·维基耶蒂、郑贤奎、卢贤珠、金浩珉、车美英 ICLR 2023/NeurIPS 2022 • 补充材料

通过元强化学习和贝叶斯优化设计生物序列 利奥·冯、帕迪德·努里、阿内里·穆尼、约书亚·本吉奥、皮埃尔-吕克·培肯 arXiv:2209.06259/NeurIPS 2022 • 海报

自对弈强化学习指导蛋白质工程 王毅、唐辉、黄立超、潘璐璐、杨立祥、杨焕明、穆峰、杨猛自然机器智能（2023） • 代码

基于强化学习的好奇心驱动蛋白质序列生成 匿名 ICLR 2024

用于抗体CDRH3区设计的稳定在线与离线强化学习 扬尼克·沃格特、梅迪·纳瓦尔、玛丽亚·卡尔韦特、克里斯托夫·科尔内利乌斯·米廷、尤斯图斯·杜斯特、罗兰·梅特尔斯曼、加布里埃尔·卡尔韦特、约施卡·博德克尔 arXiv:2401.05341

基于进化多目标优化的肽疫苗设计 刘丹轩、许一恒、钱超 arXiv:2406.05743

利用蛋白质语言模型的强化学习进行序列设计 吉滕达拉·苏布拉马尼安、希瓦坎特·苏吉特、尼洛伊·伊尔提萨姆、乌蒙·赛恩、德里克·诺鲁泽扎赖、萨米拉·埃布拉希米·卡胡、里亚沙特·伊斯兰 arXiv:2407.03154

BetterBodies：强化学习引导的扩散模型用于抗体序列设计 扬尼克·沃格特、梅迪·纳瓦尔、玛丽亚·卡尔韦特、克里斯托夫·科尔内利乌斯·米廷、尤斯图斯·杜斯特、约施卡·博德克尔、加布里埃尔·卡尔韦特 arXiv:2409.16298

强化学习驱动的肽空间探索：加速类药物肽的生成 王谦、胡晓彤、魏志强、陆浩、刘浩生物信息学简报 25.5 (2024): bbae444 • 代码

用强化学习引导生成式蛋白质语言模型 菲利波·斯托科、玛丽亚·阿尔蒂格斯-列沙、安德烈亚·洪克林格、塔拉勒·维达塔拉、马克·古埃尔、诺埃利亚·费鲁兹 arXiv:2412.12979 • 代码

DOTA：开发性优化的抗体生成 陶阮、刘家腾、安娜·哈特 UIUC 2024年秋季 CS582 MLCB

PepTune：多目标引导的离散扩散模型用于治疗性肽的从头生成 索菲娅·唐、尹诺·张、普拉南·查特吉 arXiv:2412.17780

PepINVENT：超越天然氨基酸的生成式肽设计 格克切·盖兰、乔恩·保罗·珍妮特、亚历山德罗·蒂博、贾振赫、阿塔纳斯·帕特罗诺夫、米哈伊尔·卡别绍夫、维尔加德·切赫蒂茨基、弗洛里安·戴维、奥拉·恩格奎斯特和莱昂纳多·德·玛利亚化学科学（2025） • 代码

用于抗生素发现的深度强化学习平台 曹汉群、马塞洛·D·T·托雷斯、张静洁、高子俊、吴芳、顾春斌、朱雷·莱斯科韦克、崔艺珍、塞萨尔·德拉富恩特-努涅斯、陈广勇、彭安·亨 bioRxiv 2025.09.23.678086

通过策略优化设计减少T细胞表位的蛋白质
曼维塔·庞纳帕蒂、萨普娜·辛哈、布莱恩·林奇、爱德华·S·博伊登、约瑟夫·雅各布森
bioRxiv 2025.09.27.678937 • 补充材料

强化学习引导的生成式蛋白质语言模型实现了高度多样化的AAV衣壳的从头设计
卢卡斯·费拉兹、安娜·F·罗德里格斯、佩德罗·吉埃斯特拉·科托维奥、马法尔达·文图拉、加布里埃拉·席尔瓦、安娜·索菲亚·科罗阿丁哈、米格尔·马丘凯罗、卡蒂娅·佩斯基塔
arXiv:2603.19473 • 代码

5.7 基于流的方法

利用GFlowNets进行生物序列设计 Moksh Jain、Emmanuel Bengio、Alex-Hernandez Garcia、Jarrid Rector-Brooks、Bonaventure F. P. Dossou、Chanakya Ekbote、Jie Fu、Tianyu Zhang、Micheal Kilgour、Dinghuai Zhang、Lena Simine、Payel Das、Yoshua Bengio arXiv预印本 arXiv:2203.04115 (2022) • 讲座

ProtFlow：基于压缩蛋白质语言模型嵌入的流匹配实现快速蛋白质序列设计 Zitai Kong、Yiheng Zhu、Yinlong Xu、Hanjing Zhou、Mingzhe Yin、Jialu Wu、Hongxia Xu、Chang-Yu Hsieh、Tingjun Hou、Jian Wu arXiv:2504.10983

GFlowNet与蛋白质语言模型的协同作用打造多样化抗体设计师
Mingze Yin、Hanjing Zhou、Yiheng Zhu、Jialu Wu、Wei Wu、Mingyang Li、Kun Fu、Zheng Wang、Chang-Yu Hsieh、Tingjun Hou、Jian Wu
AAAI人工智能会议论文集，第39卷，第21期，2025年

多目标引导的离散流匹配用于可控生物序列设计
Tong Chen、Yinuo Zhang、Sophia Tang、Pranam Chatterjee
arXiv:2505.07086 • 模型

利用TriFlow对大规模蛋白质设计中的结构条件序列空间进行建模
Harish Srinivasan、Rongqing Yuan、Qian Cong、Jian Zhou
bioRxiv 2025.11.30.691458 • 代码

ProtFlow：基于流匹配的蛋白质序列设计，兼具全面的蛋白质语义分布学习与高质量生成能力
Zitai Kong、Yiheng Zhu、Yinlong Xu、Mingze Yin、Tingjun Hou、Jian Wu、Hongxia Xu、Chang-Yu Hsieh
bioRxiv 2026.02.14.705870 • 代码

5.8 基于RNN的方法

深度学习设计核靶向非生物迷你蛋白质 Carly K. Schissel、Somesh Mohapatra、Justin M. Wolfe、Colin M. Fadzen、Kamela Bellovoda、Chia-Ling Wu、Jenna A. Wood、Annika B. Malmberg、Andrei Loas、Rafael Gómez-Bombarelli及Bradley L. Pentelute Nature Chemistry 13.10 (2021) • 代码

用于构建性肽设计的循环神经网络模型 Müller, Alex T.、Jan A. Hiss和Gisbert Schneider 化学信息与建模杂志 58.2 (2018)

机器学习设计非溶血性抗菌肽 Alice Capecchi、Xingguang Cai、Hippolyte Personne、Thilo Köhler、Christian van Delden和Jean-Louis Reymond Chemical Science 12.26 (2021)

利用分子动力学模拟优先筛选并理解人工智能生成的细胞穿透肽 Duy Phuoc Tran、Seiichi Tada、Akiko Yumoto、Akio Kitao、Yoshihiro Ito、Takanori Uzawa及Koji Tsuda Scientific Reports 11.1 (2021)

通过机器学习与DFT研究从头设计抗氧化肽 Parsa Hesamzadeh、Abdolvahab Seif、Kazem Mahmoudzadeh、Mokhtar Ganjali Koli、Amrollah Mostafazadeh、Kosar Nayeri、Zohreh Mirjafary及Hamid Saeidian Scientific Reports 14.1 (2024) • 代码

5.9 基于LSTM

基于深度学习的抗微生物肽设计及其对多重耐药临床分离菌株的评估 迪佩什·纳加拉詹、图沙尔·纳加拉詹、娜塔莎·罗伊、奥姆卡尔·库尔卡尼、萨提亚巴拉蒂·拉维昌德兰、马杜利卡·米什拉迪普希卡·查克拉沃蒂、纳加苏玛·钱德拉《生物化学杂志》293.10（2018）

深度学习助力功能性从头设计抗微生物蛋白 哈维尔·卡塞雷斯-德尔皮亚诺、罗伯托·伊巴涅斯、帕特里西奥·阿莱格雷、辛西娅·桑韦萨、罗穆阿尔多·帕斯-菲布拉斯、西蒙·科雷亚、佩德罗·雷塔马尔、胡安·克里斯托瓦尔·希门尼斯、莱昂纳多·阿尔瓦雷斯 bioRxiv（2020）

ECNet：一种融合进化背景信息的深度学习蛋白质工程框架 罗云楠、蒋广德、于天浩、刘洋、林武、丁汉田、苏宇峰、韦斯利·魏谦、赵慧敏及彭健《自然通讯》12.1（2021）

基于深度学习的新颖抗微生物肽设计 王、克里斯蒂娜、萨姆·加里克和米雷·佐洛《生物分子》11.3（2021）

利用基于LSTM的深度生成模型从噬菌体展示文库中进行亲和力成熟的抗体设计 小池五郎、角崎太郎、梅次正一、柏木大辉、吉田健二、和田学、津野田博之及寺本礼治《科学报告》11.1（2021）

无约束规模下基于机器学习的抗体设计的计算机模拟原理验证 阿克巴尔、拉赫马德等 Mabs，第14卷，第1期，泰勒与弗朗西斯出版社，2022年 • 代码

仅基于序列模型的大规模稳定蛋白质设计与优化 杰迪迪亚·M·辛格、斯科特·诺沃特尼、德文·斯特里克兰、休·K·哈多克斯、尼古拉斯·莱比、加布里埃尔·J·罗克林、卡梅伦·M·周、阿尼迪亚·罗伊、阿西姆·K·贝拉、弗朗西斯·C·莫塔、龙兴曹、伊娃-玛丽亚·施特劳赫、塔穆卡·M·奇迪亚乌西库、亚历克斯·福特、伊森·霍、亚历山大·扎伊采夫、克雷格·O·麦肯齐、哈迈德·埃拉米安、弗兰克·迪马约、格沃尔格·格里戈里扬、马修·沃恩、兰斯·J·斯图尔特、大卫·贝克、埃里克·克拉文斯 PloS one 17.3（2022） • 代码

基于深度学习的生物活性治疗肽生成与筛选 海平张、孔达·马尼·萨拉瓦南、严杰伟、杨娇、杨阳、易潘、徐丽吴、约翰·Z.H.张 bioRxiv 2022.11.14.516530 • 代码 • 补充材料

基于深度学习的生物活性肽生成及针对黄嘌呤氧化酶的筛选 海平张、孔达·马尼·萨拉瓦南、约翰·Z.H. 张、徐丽吴 bioRxiv 2023.01.11.523536

基于深度学习的生物活性治疗肽生成与筛选 海平张、孔达·马尼·萨拉瓦南、严杰伟、杨娇、杨阳、易潘、徐丽吴以及约翰·Z.H. 张《化学信息与建模杂志》63.3（2023） • 代码

Bio-xLSTM：生物与化学序列的生成式建模、表征及上下文学习 尼克拉斯·施密丁格、丽莎·施内肯赖特、菲利普·赛德尔、约翰内斯·希穆内克、彼得-扬·霍特、约翰内斯·布兰德施泰特、安德烈亚斯·迈尔、索赫维·卢科宁、塞普·霍赫赖特、君特·克兰鲍尔 arXiv:2411.04165

5.10 自回归模型

利用简单自回归模型高效生成蛋白质序列 珍妮·特兰基耶、圭多·乌古佐尼、安德烈亚·帕尼亚尼、弗朗切斯科·赞波尼及马丁·魏格特《自然通讯》12.1（2021）：1–11页 • 代码

用于设计问题的共形预测 克拉拉·范江、史蒂芬·贝茨、阿纳斯塔西奥斯·N·安杰洛普洛斯、珍妮弗·利斯特加滕、迈克尔·I·乔丹 arXiv:2202.03613v4 • 代码

通过水印化蛋白质设计增强生物安全中的隐私保护 闫硕陈、郑勉胡、义涵吴、瑞波陈、永睿金、马库斯詹、成进谢、伟陈、恒黄 Bioinformatics，2025年，btaf141 • 代码

基于自回归直接耦合分析并以主成分条件控制的可调控蛋白质设计
弗朗切斯科·卡雷达、安德烈亚·帕尼亚尼、保罗·德·洛斯·里奥斯、丽莎·盖尼
bioRxiv 2025.08.18.669886 • 代码

ProChoreo：基于构象集合的生成式深度学习从头设计结合蛋白
赛赛丁、易张
bioRxiv 2026.01.23.701298

5.11 基于玻尔兹曼机的

成对共进化模型如何捕捉蛋白质中残基的集体变异性？ Figliuzzi, Matteo、Pierre Barrat-Charlaix 和 Martin Weigt 分子生物学与进化 35.4 (2018): 1018-1027 • 代码

用于蛋白质序列采样和优化的帕累托最优组成能量模型 Nataša Tagasovska、Nathan C. Frey、Andreas Loukas、Isidro Hötzel、Julien Lafrance-Vanasse、Ryan Lewis Kelly、Yan Wu、Arvind Rajpal、Richard Bonneau、Kyunghyun Cho、Stephen Ra、Vladimir Gligorijević arXiv:2210.10838 • 幻灯片

利用基于进化的建模和结构质量评估进行新型 Cas9 PAM 相互作用域的计算设计 Cyril Malbranke、William Rostain、Florence Depardieu、Simona Cocco、Remi Monasson、David Bikard bioRxiv 2023.03.20.533501 • 代码 • 补充材料

基于离散行走—跳跃采样的蛋白质发现 Nathan C. Frey、Daniel Berenberg、Karina Zadorozhny、Joseph Kleinhenz、Julien Lafrance-Vanasse、Isidro Hotzel、Yan Wu、Stephen Ra、Richard Bonneau、Kyunghyun Cho、Andreas Loukas、Vladimir Gligorijevic、Saeed Saremi arXiv:2306.12360/ICLR 2024 • 代码 • 讲座

5.12 基于扩散的

去噪扩散蛋白质序列 Zhangzhi Peng 论文不可用 • github

引导式离散扩散的蛋白质设计 Nate Gruver、Samuel Stanton、Nathan C. Frey、Tim G. J. Rudner、Isidro Hotzel、Julien Lafrance-Vanasse、Arvind Rajpal、Kyunghyun Cho、Andrew Gordon Wilson arXiv:2305.20009/神经信息处理系统进展，2024 • 代码 • 讲座

PRO-LDM：基于条件潜扩散模型的蛋白质序列生成 Zixuan Jiang、Sitao Zhang、Rundong Huang、Shaoxun Mo、Letao Zhu、Peiheng Li、Ziyi Zhang、Xi Chen、Yunfei Long、Renjing Xu、Rui Qing bioRxiv 2023.08.22.554145 • 补充材料

基于进化扩散的蛋白质生成：序列就是一切 Sarah Alamdari、Nitya Thakkar、Rianne van den Berg、Alex Xijie Lu、Nicolo Fusi、Ava Pardis Amini、Kevin K Yang bioRxiv 2023.09.11.556673 • 代码 • 数据 • 讲座，讲座2

AntiBARTy 指导属性的抗体扩散设计 Jordan Venderley arXiv:2309.13129

使用 AI 蛋白质扩散技术发现 PD-1 靶向抗体 Colby T. Ford bioRxiv 2024.01.18.576323 • 代码

ProT-Diff：通过整合蛋白质语言模型和扩散模型实现抗菌肽序列从头生成的模块化高效方法 Xue-Fei Wang、Jing-Ya Tang、Han Liang、Jing Sun、Sonam Dorje、Bo Peng、Xu-Wo Ji、Zhe Li、Xian-En Zhang、Dian-Bing Wang bioRxiv 2024.02.22.581480 • 补充材料

TaxDiff：用于蛋白质序列生成的分类学指导扩散模型 Lin Zongying、Li Hao、Lv Liuzhenghao、Lin Bin、Zhang Junwu、Chen Calvin Yu-Chian、Yuan Li、Tian Yonghong arXiv:2402.17156 • 代码

基于语言模型嵌入的扩散用于蛋白质序列生成 Viacheslav Meshchaninov、Pavel Strashnov、Andrey Shevtsov、Fedor Nikolaev、Nikita Ivanisenko、Olga Kardymon、Dmitry Vetrov arXiv:2403.03726

AMP-Diffusion：将潜扩散与蛋白质语言模型结合用于抗菌肽生成 Tianlai Chen、Pranay Vure、Rishab Pulugurta、Pranam Chatterjee bioRxiv 2024.03.03.583201

原子级精确的单域抗体从头设计 Nathaniel R. Bennett、Joseph L. Watson、Robert J. Ragotte、Andrew J. Borst、DeJenae L. See、Connor Weidle、Riti Biswas、Ellen L. Shrock、Philip J. Y. Leung、Buwei Huang、Inna Goreshnik、Russell Ault、Kenneth D. Carr、Benedikt Singer、Cameron Criswell、Dionne Vafeados、Mariana Garcia Sanchez、Ho Min Kim、Susana Vazquez Torres、Sidney Chan、David Baker bioRxiv 2024.03.14.585103/Nature (2025) • 补充材料

基于等变扩散生成模型的复合物结合配体蛋白重新设计 Viet Thanh Duy Nguyen、Nhan Nguyen、Truong Son Hy bioRxiv 2024.04.17.589997 • 代码

通过在扩散模型中约束催化口袋设计细胞色素 P450 酶 Qian Wang、Xiaonan Liu、Hejian Zhang、Huanyu Chu、Chao Shi、Lei Zhang、Jie Bai、Pi Liu、Jing Li、Xiaoxi Zhu、Yuwan Liu、Zhangxin Chen、Rong Huang、Hong Chang、Tian Liu、Zhenzhan Chang、Jian Cheng 和 Huifeng Jiang Research (2024) • 代码

面向分布外分子和蛋白质设计的上下文引导扩散 Leo Klarner、Tim G. J. Rudner、Garrett M. Morris、Charlotte M. Deane、Yee Whye Teh arXiv:2407.11942 • 代码

基于二级结构引导的潜图扩散新蛋白质序列生成 Yutong Hu、Yang Tan、Andi Han、Lirong Zheng、Liang Hong、Bingxin Zhou arXiv:2407.07443 • 代码

AI生成的小型结合剂提升了原位编辑效率 朴柱灿、严熙秀、金容宇、吴艺恩、裴尚洙
bioRxiv 2024.09.11.612443 • 补充材料

MeMDLM：基于掩码离散扩散蛋白质语言模型的从头设计膜蛋白 Shrey Goel、Vishrut Thoutam、Edgar Mariano Marroquin、Aaron Gokaslan、Arash Firouzbakht、Sophia Vincoff、Volodymyr Kuleshov、Huong T. Kratochvil、Pranam Chatterjee
arXiv:2410.16735/ICLR 2025 工作坊 LMRL

用于结构指导抗体设计与优化的检索增强扩散模型 王子辰、季耀坤、田佳宁、郑双嘉
arXiv:2410.15040

ProtDiff：面向功能条件的掩码扩散模型，用于稳健的定向蛋白质生成 Vishrut Thoutam、Yair Schiff、Sergey Ovchinnikov、Pranam Chatterjee
NeurIPS 2024 科学基础模型研讨会：进展、机遇与挑战

基于语言模型编码的扩散模型用于蛋白质序列生成 Viacheslav Meshchaninov、Pavel Strashnov、Andrey Shevtsov、Fedor Nikolaev、Nikita Ivanisenko、Olga Kardymon、Dmitry Vetrov
ICLR 2025

基于奖励引导的测试时迭代精炼扩散模型及其在蛋白质和DNA设计中的应用 Masatoshi Uehara、苏星宇、赵玉来、李希讷、Aviv Regev、季水旺、Sergey Levine、Tommaso Biancalani
arXiv:2502.14944 • 代码

在残基二级结构约束下，融合LSTM与注意力机制的轻量级扩散模型用于大型多肽的从头设计 廖思盛、徐刚、金力、马建鹏
Molecules 30.5 (2025) • 代码

基于AI的抗体设计，靶向近期H5N1禽流感病毒株
Nicholas Santolla、Colby T. Ford
bioRxiv 2025.04.24.650061 • 代码 • 基于EvoDiff

CFP-Gen：通过扩散语言模型实现组合式功能性蛋白质生成
尹俊波、查超、何文佳、许晨程、高鑫
arXiv:2505.22869

AMPGen：一种保留进化信息且由扩散驱动的生成模型，用于抗菌肽的从头设计
金淑雯、曾志涵、熊曦妍、黄柏成、唐莉、王洪生、马晓、唐小春、邵国清、黄兴旭及林峰
Communications Biology 8.1 (2025) • 代码

用于增强蛋白质表征与生成的扩散序列模型
Logan Hallee、Nikolaos Rafailidis、David B. Bichara、Jason P. Gleghorn
arXiv:2506.08293 • 代码

不确定性感知的离散扩散技术提升蛋白质设计效果
Sazan Mahbub、Christoph Feinauer、Caleb N. Ellington、宋乐、Eric P. Xing
bioRxiv 2025.06.30.662407

针对可开发性抗体的引导生成
赵思琪、Joshua Moller、Porfi Quintero-Cadena、Lood van Niekerk
arXiv:2507.02670 • 基于ESM-2

PRO‐LDM：用于蛋白质序列设计与功能优化的条件潜扩散模型
张思涛、蒋子轩、黄润东、黄文婷、彭思远、莫绍勋、朱乐陶、李培恒、张子怡、潘艾米丽、陈曦、龙云飞、梁奇、唐进、徐仁静、秦睿
Advanced Science (2025) • 基于ESM-2

基于广义扩散模型的类似Protein A的肽类生成
周天谦、张世博、宋慧佳、何强、方纯及林小竹
J Comput Aided Mol Des 39, 76 (2025) • 代码

PepCCD：用于靶向特异性肽类生成的对比条件扩散框架
张军、周阳阳、朱天田、朱泽轩
bioRxiv 2025.09.01.673427 • 补充材料

生成式潜在扩散语言建模产生抗感染合成肽
Marcelo D.T. Torres、Leo Tianlai Chen、万芳平、Pranam Chatterjee、Cesar de la Fuente-Nunez
Cell Biomaterials (2025) • 代码

通过知识感知提示扩散模型可控地生成病原体特异性抗菌肽
王永康、李梦露、黄峰、邱敏瑶、张文
Advanced Science（德国巴登-符腾堡州魏因海姆）

High-PepBinder：基于pLM引导的潜扩散框架，用于亲和力导向的靶向肽类设计
毛庆义、翟思龙、曹森、朱仁杰、徐文、张承云、朱宁、郭晶晶、段宏亮
bioRxiv 2026.01.12.69898 • 补充材料

5.13 基于GNN的方法

生成式预训练自回归Transformer图神经网络在新型蛋白质分析与发现中的应用
Markus J. Buehler
arXiv:2305.04934 • 代码

5.14 基于评分的方法

微滴筛选快速评估生物催化剂，以支持其AI辅助工程改造
Maximilian Gantz、Simon V. Mathis、Friederike E. H. Nintzel、Paul J. Zurek、Tanja Knaus、Elie Patel、Daniel Boros、Friedrich-Maximilian Weberling、Matthew R. A. Kenneth、Oskar J. Klein、Elliot J. Medcalf、Jacob Moss、Michael Herger、Tomasz S. Kaminski、Francesco G. Mutti、Pietro Lio、Florian Hollfelder
bioRxiv (2024.04.08)

基于评分条件的生成器的自举训练，用于生物序列的离线设计
Minsu Kim、Federico Berto、安成洙、朴镇九
arXiv:2306.03111 • 代码

6. 基于功能的结构生成

这些模型可以根据预期的功能生成蛋白质结构（包括侧链），或者恢复蛋白质结构的一部分（即图像修复）。

6.0 回顾

迈向用于蛋白质设计的深度学习序列-结构联合生成 王晨桐、萨拉·阿拉姆达里、卡莱斯·多明戈-恩里奇、艾娃·阿米尼、凯文·K·杨 arXiv:2410.01773/Current Opinion in Structural Biology (2025)

6.1 基于LSTM的方法

利用深度学习进行蛋白质-蛋白质相互作用基序的单侧设计 Syrlybaeva、Raulia 和 Eva-Maria Strauch bioRxiv (2022) • 代码 • 我们的笔记 • 讲座

6.2 基于扩散的方法

使用等变去噪扩散概率模型生成蛋白质结构和序列 Namrata Anand、Tudor Achim GitHub (2022)/arXiv (2022) • 我们的笔记 • 讲座

基于扩散生成模型的抗原特异性抗体设计与优化——用于蛋白质结构的生成 Shitong Luo、Yufeng Su、Xingang Peng、Sheng Wang、Jian Peng、Jianzhu Ma bioRxiv 2022.07.10.499510/ICML (2023) • 代码 • Hugging Face

用可编程生成模型照亮蛋白质空间 John Ingraham、Max Baranov、Zak Costello、Vincent Frappier、Ahmed Ismail、Shan Tie、Wujie Wang、Vincent Xue、Fritz Obermeyer、Andrew Beam、Gevorg Grigoryan Generate Biomedicines 预印本/bioRxiv 2022.12.01.518682/Nature (2023) • 官网 • 新闻 • 代码 • Colab • 商业化

基于物理启发的蛋白质编码器预训练：通过暹罗序列-结构扩散轨迹预测 Zuobai Zhang、Minghao Xu、Aurélie Lozano、Vijil Chenthamarakshan、Payel Das、Jian Tang arXiv:2301.12068 • 代码

TRDiffusion TIANRANG XLab 新闻 • 官网 • 商业化

一种全原子蛋白质生成模型 Alexander E Chu、Lucy Cheng、Gina El Nesr、Minkai Xu、Po-Ssu Huang bioRxiv 2023.05.24.542194/美国国家科学院院刊 121.27 (2024) • 代码

DiffPack：用于自回归式蛋白质侧链堆积的扭转扩散模型 Yangtian Zhan、Zuobai Zhang、Bozitao Zhong、Sanchit Misra、Jian Tang arXiv 2023.06.01 • 代码

AbDiffuser：体外功能抗体的全原子生成 Karolis Martinkus、Jan Ludwiczak、Kyunghyun Cho、Wei-Ching Lian、Julien Lafrance-Vanasse、Isidro Hotzel、Arvind Rajpal、Yan Wu、Richard Bonneau、Vladimir Gligorijevic、Andreas Loukas arXiv:2308.05027 • 讲座

用于抗体设计、对接和优化的生成式扩散模型 Zhangzhi Peng、Chenchen Han、Xiaohan Wang、Dapeng Li、Fajiie Yuan bioRxiv 2023.09.25.559190 • 代码 • 网站

连接序列与结构：用于条件性蛋白质生成的潜在扩散模型 匿名 ICLR 2024

指导扩散模型进行具有开发可行性的抗体序列和结构联合设计 Amelia Villegas-Morcillo、Jana M. Weber、Marcel J.T. Reinders bioRxiv 2023.11.22.568230/NeurIPS 2023 生成式AI与生物学研讨会 • 代码

用于治疗性肽生成的多模态对比扩散模型 Yongkang Wang、Xuan Liu、Feng Huang、Zhankun Xiong、Wen Zhang arXiv:2312.15665 • 代码

迈向核酸与蛋白质复合物的联合序列-结构生成：SE(3)-离散扩散 Alex Morehead、Jeffrey Ruffolo、Aadyot Bhatnagar、Ali Madani arXiv:2401.06151 • 代码

Proteus：探索蛋白质结构生成以提升可设计性和效率 王晨桐、Yannan Qu、Peng Zhangzhi、Wang Yukai、Zhu Hongli、Chen Dachuan、Cao Longxing bioRxiv 2024.02.10.579791 • 代码

基于几何潜在扩散的全原子肽设计 Xiangzhe Kong、Wenbing Huang、Yang Liu arXiv:2402.13555

用于稳定、亲和力驱动且具备受体感知能力的肽生成的混合扩散模型 R Vishva Saravanan、Soham Choudhuri、Bhaswar Ghosh bioRxiv 2024.03.14.584934 • 代码 • 数据集

通过直接基于能量的偏好优化进行抗原特异性抗体设计 Xiangxin Zhou、Dongyu Xue、Ruizhe Chen、Zaixiang Zheng、Liang Wang、Quanquan Gu arXiv:2403.16576

HelixDiff：一种基于分数的扩散模型，用于生成全原子α-螺旋结构 Xuezhi Xie、Pedro A Valiente、Jisun Kim 和 Philip M Kim ACS Central Science (2024) • 代码

结合Transformer与3DCNN模型，以扩散方式实现抗体结构与序列的协同设计 胡悦、陶峰、兰俊文、张静 bioRxiv 2024.04.25.587828 • 代码

基于DiffPepBuilder的靶向特异性从头肽结合物设计 王帆浩、王宇哲、冯来义、张长生、赖陆华 arXiv:2405.00128/J. Chem. Inf. Model. 2024 • 代码

利用扩散模型中的力引导采样改进抗体设计 保利娜·库利特、弗朗西斯科·巴尔加斯、西蒙·瓦伦丁·马蒂斯、王昱光、何塞·米格尔·埃尔南德斯-洛巴托、皮耶特罗·利奥 arXiv:2406.05832

基于进化、物理及几何约束指导的评分式扩散模型用于抗体设计 朱天、任米龙、张海沧 ICML 2024 • 代码

Antibody-SGM：一种基于评分的生成模型，用于抗体重链设计 谢学智、佩德罗·A·瓦连特、李镇燮、金智善、菲利普·M·金化学信息与建模杂志（2024） • 代码

用于稳定、亲和力驱动且具有受体感知能力的肽生成的混合扩散模型 维什瓦·萨拉瓦南·R、索哈姆·乔杜里、巴斯瓦尔·戈什 J. Chem. Inf. Model. 2024 • 代码

使用AlphaProteo进行高亲和力蛋白质结合物的从头设计 维尼修斯·赞巴尔迪、大卫·拉、亚历山大·E·楚、哈什尼拉·帕塔尼、艾米·E·丹森、特里斯坦·O·C·关、托马斯·弗雷里克斯、罗莎莉娅·G·施耐德、大卫·萨克顿、阿肖克·蒂莱顺达拉姆、扎卡里·吴、伊莎贝尔·莫拉埃斯、奥斯卡·兰格、埃利塞奥·帕帕、加布里埃拉·斯坦顿、维克多·马丁、苏赫迪普·辛格、赖H·王、拉斯·贝茨、西蒙·A·科尔、乔什·阿布拉姆森、安德鲁·W·塞尼尔、尤尔马兹·阿尔古埃尔、玛丽·Y·吴、伊莲娜·M·阿斯帕尔特、凯蒂·本特利、大卫·L.V·鲍尔、彼得·切列帕诺夫、德米斯·哈萨比斯、普什米特·科利、罗布·费格斯以及王珏 DeepMind预印本/arXiv:2409.08022 • 博客

DPLM-2：多模态扩散蛋白质语言模型 王新友、郑在祥、叶飞、薛东宇、黄树坚、管全权 arXiv:2410.13782 • 代码 • 网站

E(3)不变性扩散模型用于口袋感知肽生成 梁博宇、白军 arXiv:2410.21335 • 代码

仅基于序列训练数据生成全原子蛋白质结构 / 利用潜在扩散生成全原子蛋白质 卢艾米X、颜威尔逊、罗宾逊莎拉A、杨凯文K、格里戈里耶维奇弗拉基米尔、曹庆贤、邦诺理查德、阿贝尔彼得、弗雷内森 bioRxiv 2024.12.02.626353/OpenReview • 代码 • 博客

利用稀疏去噪模型高效生成蛋白质结构 迈克尔·延德鲁施、扬O·科尔贝尔 bioRxiv 2025.01.31.635780/自然机器智能7, 1429–1445 (2025) • 代码, github

Neo-1 VANTAI 论文未公开 • 网站 • 商业化

UniMoMo：统一的3D分子生成建模，用于从头结合物设计 孔翔哲、张子深、张子婷、焦锐、马建竹、刘凯、黄文兵、刘洋 arXiv:2503.19300

PPDiff：在混合序列-结构空间中扩散，用于蛋白质-蛋白质复合物设计 宋振桥、李条晓、李磊、闵仁强马丁 arXiv:2506.11420

利用多尺度等变图扩散模型进行抗体设计与优化，以实现对复杂抗原的精准结合 陈佳萌、蔡先涛、吴嘉、胡文斌 arXiv:2506.20957 • 代码

借助层次化条件扩散模型揭秘蛋白质生成 凌子楠、史毅、严达、周阳、惠博 arXiv:2507.18603

PXDesign：快速、模块化且精准的蛋白质结合物从头设计 任米龙、孙金元、关家琪、刘聪、龚成悦、王宇哲、王兰、蔡启旭、陈新石、肖文志技术报告/bioRxiv 2025.08.15.670450 • 代码 • 服务器 • 数据

基于深度学习的联合序列-结构从头膜蛋白设计 卢卡斯·鲁登、雷莫·巴蒂格、文尼·安德鲁斯、朱莉·阮、马丁·斯托尔、洛伦佐·斯库特里、米哈尔·温尼基、梅丽莎·J·卡尔、马修·E·卡尔、达米安·泰韦宁、帕特里克·巴斯 bioRxiv 2025.08.15.670493

利用Protpardelle-1C进行条件式蛋白质结构生成 陆天宇、理查德·帅、彼得·寇巴、李兆阳、陈怡琳、白井明雄、金镇浩、黄宝书 bioRxiv 2025.08.18.670959 • 代码

利用多模态扩散Transformer生成功能性和多态蛋白质 景博文、安娜·萨平顿、米希尔·巴夫纳、拉维·沙阿、阿德里娜·唐、罗希特·克里希纳、亚当·克利万斯、丹尼尔·J·迪亚斯、邦妮·伯格 bioRxiv 2025.09.03.672144 • 代码

利用扩散桥模型联合设计蛋白质表面与主链 李冠略、赵旭峰、吴芳、劳厄索伦 NeurIPS 2025海报

通过结合界面模拟进行肽设计：PepMimic
孔祥哲、焦锐、林浩伟、郭瑞涵、黄文兵、马伟英、王子华、刘洋及马建竹
Nat. Biomed. Eng (2025) • 代码

基于GeoFlow-V3的快速从头抗体设计
BioGeometry团队
技术报告 • 网站 • 商业化

AbEgDiffuser：利用等变图神经网络与扩散模型实现抗体序列—结构协同设计
朱一博、石秀敏、张静娟、孙伟中、王璐
J. Chem. Theory Comput.(2025) • 代码

ODesign：用于生物分子相互作用设计的世界模型
ODesign团队
技术报告 • 网站 • 代码

BoltzGen：迈向通用结合剂设计
汉内斯·斯塔克、费利克斯·法尔廷斯、崔珉奎、谢宇欣、许恩洙、蒂莫西·奥唐奈尔、安东·布舒耶夫、塔利普·乌恰尔、萨罗·帕萨罗、毛伟安、马特奥·雷韦伊斯、罗曼·布舒耶夫、托马什·普卢斯卡尔、约瑟夫·西维奇、卡斯滕·克莱斯、阿拉什·瓦赫达特、沙玛耶塔·雷、乔纳森·T·戈德斯坦、安德鲁·萨维诺夫、雅各布·A·汉巴莱克、安希卡·古普塔、迭戈·A·塔基里-迪亚斯、张耀天、A·凯瑟琳·哈特斯塔特、安杰莉卡·阿拉达、金南亨、埃塞尔·塔基耶-亚尔博伊、迪伦·博塞利、李·施奈德、刘昌C、李基因伟、德内斯·赫尼兹、大卫·M·萨巴蒂尼、威廉·F·德格拉多、杰里米·沃尔温德、加布里埃莱·科尔索、雷吉娜·巴尔齐莱、汤米·S·雅科拉技术报告 • 网站 • 模型

用于蛋白质序列与结构联合设计的多模态扩散模型
朱绍文、西丹特·古拉蒂、刘宇轩、西迪·科特尼斯、孙青、沈阳
Protein Science 34.12 (2025) • 代码

Peptide2Mol：一种生成小分子以作为肽类模拟物用于靶向蛋白结合的扩散模型
何新恒、张义嘉、林浩伟、彭星刚、孔祥哲、李明宇、马建竹
arXiv:2511.04984

利用扩散桥模型进行蛋白质表面与结构的联合设计
李冠略、赵旭峰、吴芳、索伦·劳厄
arXiv:2511.16675 • 代码

SeedProteo：精确的从头全原子蛋白质结合剂设计
屈伟、马一鸣、叶飞、陆婵、周毅、张可欣、王兰、桂敏睿、顾权权
arXiv:2512.24192 • GitHub

用于靶向切割淀粉样β蛋白的金属蛋白酶从头设计
曲燕楠、王晨彤、朱红丽、王艳军、曹隆兴
bioRxiv 2026.01.06.697903

6.3 基于RoseTTAFold的方法

利用深度学习方法设计具有功能位点的蛋白质支架 / 使用深度学习设计蛋白质功能位点支架
王珏、西德尼·利桑扎、大卫·尤尔根斯、道格·提舍尔、伊万·阿尼申科、白珉京、约瑟夫·L·沃森、春正浩、卢卡斯·F·米勒斯、尤斯塔斯·道帕拉斯、马克·埃克斯波西特、杨伟、阿米贾伊·萨拉戈维、谢尔盖·奥夫钦尼科夫、戴维·贝克 bioRxiv(2021)/Science(2022) • RFDesign • 我们的笔记 • 讲座 • RoseTTAFold • 补充材料, 其他补充材料

通过整合结构预测网络和扩散生成模型实现广泛适用且准确的蛋白质设计 / 利用RFdiffusion进行蛋白质结构与功能的从头设计
约瑟夫·L·沃森、大卫·尤尔根斯、纳撒尼尔·R·贝内特、布莱恩·L·特里普、杰森·尹、海伦·E·艾森纳赫、伍迪·阿亨、安德鲁·J·博斯特、罗伯特·J·拉戈特、卢卡斯·F·米勒斯、巴西勒·I·M·威基、尼基塔·哈尼克尔、塞缪尔·J·佩洛克、亚历克西斯·库尔贝、威廉·谢弗勒、王珏、普里塔姆·文卡特什、艾萨克·萨平顿、苏珊娜·巴斯克斯·托雷斯、安娜·劳科、瓦伦丁·德·博尔托利、埃米尔·马修、雷吉娜·巴尔齐莱、汤米·S·雅科拉、弗兰克·迪马约、白珉京、戴维·贝克 Bakerlab预印本/bioRxiv 2022.12.09.519842/Nature (2023) • 新闻、新闻2、新闻3 • 补充材料 • 讲座、讲座2 • RFdiffusion：代码、Colab • 博客

针对生物活性螺旋肽的高亲和力蛋白质结合剂从头设计
苏珊娜·巴斯克斯·托雷斯、菲利普·J·Y·梁、艾萨克·D·卢茨、普里塔姆·文卡特什、约瑟夫·L·沃森、法比安·欣克、胡-贤·阮、安迪·Hsien-Wei 叶、大卫·尤尔根斯、纳撒尼尔·R·贝内特、安德鲁·N·胡夫纳格尔、埃里克·黄、迈克尔·J·麦科斯、马克·埃克斯波西特、李圭里、埃利夫·尼哈尔·科尔克马兹、杰夫·尼瓦拉、兰斯·斯图尔特、约瑟夫·M·罗杰斯、戴维·贝克 bioRxiv 2022.12.10.519862/Nature (2023) • 补充材料

利用 RoseTTAFold 序列空间扩散联合生成蛋白质序列与结构 西德尼·利亚尤加·利桑扎、雅各布·默尔·格什恩、萨姆·韦恩·肯莫尔·蒂普斯、卢卡斯·阿诺尔特、塞缪尔·亨德尔、杰里迈亚·纳尔逊·西姆斯、李欣婷、大卫·贝克 bioRxiv 2023.05.08.539766/Nat Biotechnol (2024) • 代码 • hugging face • 讲座

通过大规模从头设计揭示免疫球蛋白折叠的结构景观 豪尔赫·罗埃尔-托里斯、洛尔德斯·卡尔塞伦、恩里克·马科斯 bioRxiv 2023.10.03.560637/Protein Science (2024) • 补充材料 • 代码 • 数据

基于 RoseTTAFold 全原子模型的通用生物分子建模与设计 罗希特·克里希纳、王珏、伍迪·艾恩、帕斯卡尔·施图尔姆费尔斯、普里塔姆·文卡特什、因德雷克·卡尔韦特、李圭丽、菲利克斯·S·莫雷-伯罗斯、伊万·阿尼申科、伊恩·R·汉弗里斯、瑞安·麦休、狄俄涅·瓦菲阿多斯、李欣婷、乔治·A·萨瑟兰、安德鲁·希奇科克、C·尼尔·亨特、白敏京、弗兰克·迪马约、大卫·贝克 bioRxiv 2023.10.09.561603/Science • 补充材料 • 代码

Amalga：结合折叠与逆向折叠指导的设计可编程蛋白质骨架生成 陈书高、李子瑶、曾湘湘、柯国林 bioRxiv 2023.11.07.565939

通过合成蛋白质支架定位活性位点以复制酶活性 丁宇婧、张珊珊、亨利·赫斯、孔贤、张一飞 bioRxiv 2024.01.31.577620/Advanced Science (2025) • 补充材料 • 基于 RFjoint/ProteinMPNN

利用深度学习精准搭建三个非重叠蛋白质表位的单域支架 卡拉·M·卡斯特罗、约瑟夫·L·沃森、王珏、乔舒亚·索瑟恩、雷哈内·阿亚杜拉比、桑德琳·乔治昂、斯蒂芬·罗塞、大卫·贝克、布鲁诺·E·科雷亚 bioRxiv 2024.05.07.592871 • 补充材料

通过幻觉多样化从头设计 TIM 桶状结构 贝克、朱利安、苏鲁班·尚穆加拉特南和比尔特·霍克尔 Protein Science 33.6 (2024)

从头设计的蛋白质可中和致命蛇毒毒素 苏珊娜·巴斯克斯·托雷斯、梅丽莎·贝纳德·巴列、斯蒂芬·P·麦克西、斯蒂法妮·K·门齐斯、尼古拉斯·R·卡斯威尔、希林·艾哈迈迪、尼克·J·伯莱特、埃丁·穆拉特沙皮奇、以撒·萨平顿、马克·D·欧弗拉思、埃斯佩兰萨·里韦拉-德-托雷、扬·莱德格贝尔、安德烈亚斯·H·劳斯特森、金·博杜姆、阿西姆·K·贝拉、亚历克斯·康、埃文斯·布拉肯布罗、伊亚拉·A·卡多索、爱德华·P·克里滕登、丽贝卡·J·埃奇、贾斯汀·德卡罗、罗伯特·J·拉戈特、阿尔温德·S·皮莱、穆罕默德·阿贝迪、汉娜·L·韩、斯泰西·R·格尔本、阿纳莉萨·默里、丽贝卡·斯科海姆、琳达·斯图尔特、兰斯·斯图尔特、托马斯·J·A·弗莱尔、蒂莫西·P·詹金斯、大卫·贝克预印本（第1版）可在 Research Square 上获取/Nature (2025)

金属氧化物模板化蛋白质的从头设计 阿米贾伊·萨拉戈维、哈利·派尔斯、蒂莫西·F·哈迪、温兆戴、李新奇、安德鲁·J·博斯特、尼基塔·哈尼克尔、亚历克西斯·库尔贝、保罗·权、法蒂玛·A·达维拉-埃尔南德斯、瑞安·基布勒、狄俄涅·K·瓦菲阿多斯、阿扎·艾伦、肯尼斯·D·卡尔、阿西姆·K·贝拉、亚历克斯·康、埃文斯·布拉肯布罗、萨克希·施密德、尹娜·裴、兰斯·斯图尔特、帅张、詹姆斯·德·约雷奥、大卫·贝克 bioRxiv 2024.06.24.600095

向固有无序蛋白质扩散蛋白质结合剂 蔡轩刘、凯嘉吴、浩俊崔、汉娜·韩、薛丽张、约瑟夫·L·沃森、萨拉·希乔、阿西姆·K·贝拉、亚历克斯·康、埃文斯·布拉肯布罗、布莱恩·科文特里、德里克·R·希克、安德鲁·N·胡夫纳格尔、平珠、李欣婷、贾斯汀·德卡罗、斯泰西·R·格尔本、魏杨、王鑫茹、米拉·兰普、阿纳莉萨·默里、马格努斯·鲍尔、大卫·贝克 bioRxiv 2024.07.16.603789/Nature (2025) • 补充材料

利用深度学习进行参数化引导的β桶和跨膜纳米孔设计 大卫·E·金、约瑟夫·L·沃森、大卫·尤尔根斯、萨加迪普·马朱姆达尔、斯泰西·R·格尔本、亚历克斯·康、阿西姆·K·贝拉、李欣婷、大卫·贝克 bioRxiv 2024.07.22.604663/Proc. Natl. Acad. Sci. U.S.A. 122 (38) e2425459122 • 补充材料 • 代码1、代码2

高度活性从头设计酶的计算设计 马库斯·布劳恩、艾德里安·特里普、莫拉科特·查卡托克、西格丽德·卡尔滕布鲁纳、马西莫·G·托塔罗、大卫·斯托尔、亚历山大·比耶利奇、瓦埃尔·埃莱伊利、什洛莫·亚基尔·亚基尔·霍赫、马特奥·阿莱奥蒂、梅拉妮·霍尔、古斯塔夫·奥伯多尔费尔 bioRxiv 2024.08.02.606416 • 补充材料

丝氨酸水解酶的计算设计 安娜·劳科、塞缪尔·J·佩洛克、伊万·阿尼申卡、基拉·H·苏米达、大卫·尤尔根斯、伍迪·艾恩、亚历克斯·志田、安德鲁·亨特、因德雷克·卡尔韦特、克里斯托弗·诺恩、伊恩·R·汉弗里斯、库珀·S·杰米森、亚历克斯·康、埃文斯·布拉肯布罗、巴努马蒂·桑卡兰、K·N·侯克、大卫·贝克 bioRxiv 2024.08.29.610411/Science0,eadu2454 • 新闻

从头设计Ras同工型选择性结合剂 张兆兴、李欣婷、刘彩萱、姜翰伦、吴可嘉、大卫·贝克 bioRxiv 2024.08.29.610300/Cell Chemical Biology

利用β-配对靶向的RFdiffusion改进蛋白质结合剂设计 艾萨克·萨平顿、马丁·托尔、戴维·S·李、斯蒂芬妮·A·罗宾逊、因娜·戈列什尼克、克拉拉·麦克迪、陈东清、尼克·布赫霍尔茨、黄步伟、狄奥妮·瓦菲阿多斯、玛丽亚娜·加西亚-桑切斯、妮可·鲁耶、马蒂亚斯·格勒格尔、克里斯·金、约瑟夫·L·沃森、苏珊娜·巴斯克斯·托雷斯、科恩·H·G·费尔斯胡伦、肯尼思·弗斯特拉特、辛西娅·S·欣克、梅丽莎·贝纳德-瓦列、布莱恩·考文特里、杰里迈亚·尼尔森·西姆斯、格林·安、王鑫如、安德鲁·P·欣克、蒂莫西·P·詹金斯、汉内莱·鲁霍拉-贝克、史蒂文·M·巴尼克、萨瓦斯·N·萨维德斯、大卫·贝克 bioRxiv 2024.10.11.617496/预印本 • 补充材料

Afpdb——用于AI蛋白质设计的高效结构操作工具包 周英尧、柯熙怡、周斌、朱天成、钟阳、格伦·斯普拉贡 Bioinformatics (2024): btae654 • 代码 • 网站

GRACE：人工智能计算酶学中的生成式重新设计 芮恩、胡奇华、吴伊孙 ACS Synthetic Biology (2024) • 代码

金属水解酶的计算设计 金东孝、塞思·M·伍德伯里、伍迪·艾亨、因德雷克·卡尔韦特、尼基塔·哈尼克尔、萨曼·萨利克、塞缪尔·J·佩洛克、安娜·劳科、唐纳德·希尔弗特、大卫·贝克 bioRxiv 2024.11.13.623507/Nature (2025) • 补充材料

促进解离的设计实现对细胞因子信号持续时间的控制 亚当·J·布罗尔曼、克里斯托夫·波尔曼、毛里茨·A·利希滕斯坦、马克·D·杰克逊、麦克斯·H·泰斯默、柳元熙、穆罕默德·H·阿贝迪、丹尼·D·萨托、阿扎·艾伦、亚历克斯·康、乔什敏·德拉克鲁兹、埃文斯·布拉肯布罗、巴努马蒂·桑卡兰、阿西姆·K·贝拉、丹尼尔·M·祖克曼、施特凡·施托尔、弗洛里安·普雷托里乌斯、雅各布·皮勒、大卫·贝克 bioRxiv 2024.11.15.623900/Nature (2025) • 补充材料

利用深度学习精确从头设计高亲和力蛋白质结合大环化合物 斯蒂芬·A·雷蒂、大卫·尤尔根斯、维克多·阿德博米、延西·弗洛雷斯·布埃索、赵琴琴、亚历山德拉·N·勒维尔、安迪·刘、阿西姆·K·贝拉、乔安娜·A·维尔姆斯、阿莉娜·于芬、亚历克斯·康、埃文斯·布拉肯布罗、米拉·兰布、斯泰西·R·格尔本、阿纳丽萨·默里、保罗·M·莱文、迈卡·施奈德、维芭·瓦西雷迪、谢尔盖·奥夫钦尼科夫、奥利弗·H·魏尔格拉伯、迪特尔·维尔博尔德、约书亚·A·克里策、约瑟夫·D·莫古斯、大卫·贝克、弗兰克·迪马约、加拉夫·巴德瓦杰 bioRxiv 2024.11.18.622547/Nat Chem Biol (2025) • 补充材料 • 代码

利用生成式AI工程化从头设计CAR-T细胞疗法的结合剂 马库斯·梅尔根、丹妮拉·阿贝尔、奈勒·科莱奇、阿尔巴·施马尔·费尔南德斯、玛雅·萨格登、诺亚·霍尔茨莱特纳、安德烈亚斯·卡尔、莱昂妮·里格尔、瓦伦蒂娜·莱昂、马克西米利安·赖歇特、卡尔-路德维希·劳格维茨、弗洛里安·巴瑟曼、迪尔克·H·布施、朱利安·格吕内瓦尔德、安德烈亚·施密茨 bioRxiv 2024.11.25.625151 • 基于RFDiffusion/ProteinMPNN

CycleDesigner：利用RFdiffusion和HighFold设计针对特定靶标的环肽结合剂 张晨浩、徐振宇、林康、张承云、许文、段洪亮 bioRxiv 2024.11.27.625581 • 基于RFDiffusion/ProteinMPNN

从头设计的pMHC结合剂促进T细胞介导的癌细胞杀伤 克里斯托弗·豪鲁姆·约翰森、达里安·斯蒂芬·沃尔夫、贝亚特丽丝·斯卡波洛、莫妮卡·L·费尔南德斯·昆特罗、夏洛特·里萨格尔·克里斯滕森、约翰内斯·R·洛夫勒、埃斯佩兰萨·里韦拉-德-托雷、马克思·D·欧弗拉特、卡米拉·克亚尔加德·蒙克、奥利弗·莫雷尔、玛丽·克里斯汀·维夫、阿尔贝特·T·达姆·恩格伦、玛蒂尔德·杜埃、斯特法诺·福尔利、艾玛·青洁·安德森、乔丹·西尔维斯特·费尔南德斯、苏提蒙·通特乔、安德鲁·B·沃德、玛丽亚·奥尔姆霍伊、西涅·雷克尔·哈德鲁普、蒂莫西·P·詹金斯 bioRxiv 2024.11.27.624796/Science389,380-385(2025) • 补充材料

针对肽-MHC-I复合物的高特异性结合剂设计 刘炳旭、内森·F·格林伍德、朱莉娅·E·邦扎尼尼、阿米尔·莫特曼、贾兹敏·夏普、王春宇、吉安·马可·维萨尼、狄奥妮·K·瓦菲阿多斯、妮可·鲁耶、阿尔米塔·努尔穆罕默德、K·克里斯托弗·加西亚、大卫·贝克 bioRxiv 2024.11.28.625793/Science389,386-391(2025)

靶标条件扩散生成强效TNFR超家族拮抗剂和激动剂 马蒂亚斯·格勒格尔、阿迪蒂亚·克里希纳库马尔、罗伯特·J·拉戈特、因娜·戈列什尼克、布莱恩·考文特里、阿西姆·K·贝拉、亚历克斯·康、艾米丽·乔伊斯、格林·安、黄步伟、杨伟、陈伟、玛丽亚娜·加西亚·桑切斯、布莱恩·科普尼克、大卫·贝克 Science 386.6726 (2024)

基于计算表位支架设计水溶性CD20抗原 姚志远、布莱恩·库尔曼 bioRxiv 2024.12.05.627087 • 补充材料 • 代码 • 基于RFDiffusion

利用从头设计的蛋白质抑制致病性大肠杆菌对血红素的劫持 丹尼尔·R·福克斯、卡泽姆·阿萨多利、伊莫金·G·塞缪尔斯、布拉德利·斯派瑟、阿什莉·克罗普、克里斯·卢普顿、凯文·林、王春晓、哈里普拉萨德·维努戈帕尔、玛丽亚·德拉米恰宁、加文·J·诺特、瑞斯·格林特 bioRxiv 2024.12.05.626953/Nat Commun 16, 6066 (2025) • 基于RFDiffusion/ProteinMPNN

高效CRISPR-Cas13抑制剂的从头设计 辛西娅·塔韦诺、何翔柴、乔维塔·迪席尔瓦、丽贝卡·S·巴默特、布鲁克·K·海耶斯、罗兰·W·卡尔弗特、丹尼尔·J·柯温、法比安·蒙德尔、利桑德拉·L·马丁、杰里米·J·巴尔、瑞斯·格林特、加文·J·诺特 bioRxiv 2024.12.05.626932 • 补充材料 • 基于RFDiffusion/ProteinMPNN

开发一种能够抑制α激酶eEF2K的从头设计蛋白质结合剂 科迪·A·克鲁普特、伊森·贝尔罗斯、贾宗超 bioRxiv 2024.12.10.627789 • 补充材料 • 基于RFDiffusion/ProteinMPNN

为蛋白质骨架生成并评估多样化的序列 青木洋、谢尔盖·奥夫钦尼科夫机器学习在结构生物学中的应用研讨会，NeurIPS 2024 • 基于RFDiffusion/ProteinMPNN

以肽为中心的TCR模拟结合模块的从头设计与结构解析 卡斯滕·D·豪斯霍尔德、向鑫宇、凯文·M·朱德、阿瑟·邓、马蒂亚斯·奥本瑙斯、史蒂文·C·威尔逊、陈晓静、王楠、K·克里斯托弗·加西亚 bioRxiv 2024.12.16.628822/Science389,375-379(2025) • 补充材料 • 基于RFDiffusion/ProteinMPNN

伪对称蛋白质异二聚体的自下而上设计 瑞安·D·基布勒、李相珉、麦迪逊·A·肯尼迪、巴西勒·I·M·威基、斯特拉·M·莱、马里乌斯·M·科斯特利奇、安妮·卡尔、李欣婷、卡梅伦·M·周、丁娜·K·阮、劳伦·卡特、维姬·H·维索基、巴里·L·斯托达德及大卫·贝克 Nat Commun 15, 10684 (2024) • 代码

基于明确选择性过滤器几何结构的钙通道自下而上设计 刘玉来、康纳·魏德尔、柳比察·米哈列维奇、约瑟夫·L·沃森、李哲、乐·特蕾西·余、萨加迪普·马朱姆达尔、安德鲁·J·博斯特、肯尼斯·D·卡尔、瑞安·D·基布勒、塔米尔·M·加马尔·埃尔丁、威廉·A·卡特罗尔、大卫·贝克 bioRxiv 2024.12.19.629320 • 补充材料 • 基于RFDiffusion/ProteinMPNN

利用设计的蛋白质WRAPS实现膜蛋白的可溶化 柳比察·米哈列维奇、戴维·E·金、海伦·E·艾森纳赫、普贾·D·班达万、安德鲁·J·博斯特、阿莱克西·库尔贝、埃弗顿·贝廷、刘秋实、康纳·魏德尔、萨加迪普·马朱姆达尔、李欣婷、米拉·兰布、阿纳丽莎·妮可·阿斯卡拉加·穆雷、拉什米·拉维昌德兰、伊丽莎白·C·威廉姆斯、胡书远、琳达·斯图尔特、琳达·格里洛娃、尼古拉斯·R·汤姆森、常鹏翔、梅丽莎·J·凯曼诺、凯莉·L·霍利、尼尔·P·金、大卫·贝克 bioRxiv 2025.02.04.636539 • 基于RFDiffusion/ProteinMPNN

用设计的无扭转螺旋重复蛋白抑制冰的再结晶 罗伯特·J·德哈斯、哈利·派尔斯、蒂莫西·F·哈迪、扬尼克·范奥森布鲁根、郑传宝、丹妮埃尔·范登布鲁克、安妮·卡尔、阿西姆·K·贝拉、亚历克斯·康、埃文斯·布拉肯布罗、艾米丽·乔伊斯、巴努马蒂·桑卡兰、大卫·贝克、伊利亚·K·沃茨、伦科·德弗里斯 bioRxiv 2025.03.09.642278/美国国家科学院院刊 122.48 (2025) • 补充材料 • 代码 • 基于RFDiffusion/ProteinMPNN

RoseTTAFold扩散引导下的短肽设计：以针对Keap1/Nrf2的结合剂为例 弗朗切斯科·莫雷纳、基亚拉·琴奇尼亚、卡拉·埃米利亚尼、萨巴塔·马蒂诺阿计算与结构生物技术杂志 (2025) • 基于RFDiffusion/ProteinMPNN

靶向G蛋白偶联受体的迷你蛋白激动剂和拮抗剂的从头设计 埃丁·穆拉特沙皮奇、大卫·费尔德曼、戴维·E·金、曲祥立、安娜-玛丽亚·布拉托维阿努、保拉·里韦拉-桑切斯、费德丽卡·季米特里、杰森·曹、布莱恩·P·卡里、马修·J·贝洛索夫、彼得·凯欧、陈清超、任悦、贾斯汀·法因、以撒·萨平顿、托马斯·施利希泰尔、张志中、阿尔文德·皮莱、柳比察·米哈列维奇、马格努斯·鲍尔、苏珊娜·巴斯克斯·托雷斯、阿米尔·莫特曼、李圭丽、龙·陈、王欣茹、英娜·戈列什尼克、狄俄涅·K·瓦菲阿多斯、贾斯汀·E·斯文森、帕丽萨·侯赛因扎德、尼古拉·林德加德、马特豪斯·布兰特、扬·瓦尔滕斯普尔、克里斯蒂娜·代布勒、卢克·奥斯蒂迪克、威廉·曹、拉克什米·阿南塔拉曼、兰斯·斯图尔特、劳伦·霍洛兰、杰米·B·斯潘格勒、帕特里克·M·塞克斯顿、布莱恩·L·罗斯、布莱恩·E·克鲁姆、丹妮丝·伍滕、克里斯托弗·G·泰特、克里斯托弗·诺恩、大卫·贝克 bioRxiv 2025.03.23.644666 • 补充材料

利用RFdiffusion2进行原子级酶活性位点支架构建 伍迪·阿亨、杰森·尹、道格·提舍尔、萨曼·萨利克、塞思·伍德伯里、金东孝、因德雷克·卡尔韦特、雅科夫·基普尼斯、布莱恩·科文特里、韩·阿尔泰-陈、马格努斯·鲍尔、雷吉娜·巴尔齐莱、汤米·贾科拉、罗希特·克里希纳、戴维·A·贝克 bioRxiv 2025.04.09.648075/Nat Methods (2025) • 补充材料 • 讲座 • 代码

生成式蛋白质设计与合成卟啉组装的结合 稻叶弘明、小野田浩树、内桥隆之、大岛敦则及庄司央美 ChemRxiv. 2025 • 基于RFDiffusion/ProteinMPNN

基于人工智能设计的蛋白质结合剂在癌症细胞表面蛋白检测与靶向中的开发
比安卡·布罗斯克、索菲·C·宾德、本杰明·A·麦克恩罗、蒂姆·N·肯普琴、卡罗琳·I·范德雷、朱莉娅·M·梅斯默、伊丽莎白·谭、彼得·科诺普卡、多米尼克·费尔伯、米歇尔·C·R·容、玛丽·克莱内特、亚历山大·霍赫、卡佳·布鲁门斯托克、扬·M·P·托特曼、约翰内斯·奥尔登堡、海科·鲁尔、亚历山大·塞曼、马里埃塔·I·托马、克里斯蒂娜·马尔科娃、塞巴斯蒂安·科博尔德、蒂姆·罗伦斯克、马蒂亚斯·盖耶、施特凡·门策尔、托比亚斯·巴尔德、乔纳森·L·施密德-布尔格克、格雷戈尔·哈格吕肯、迈克尔·霍尔策尔
bioRxiv 2025.05.11.652819 • 代码 • 基于RFDiffusion/ProteinMPNN

痘病毒被RFdiffusion肽类结合剂靶向
J. Coll
bioRxiv 2025.05.14.654163 • 基于RFDiffusion/ProteinMPNN

人工智能辅助设计针对脂质运载蛋白-2的配体
雅各波·斯格里尼亚尼、萨拉·布斯卡里尼、帕特里齐娅·洛卡泰利、孔切塔·格拉、阿尔贝托·富尔兰、陈英怡、贾达·佐皮、安德烈亚·卡瓦利
bioRxiv 2025.05.18.654718/Frontiers in Immunology, 2025 • 补充材料 • 基于RFDiffusion/ProteinMPNN

从头设计的荧光素酶实现多重生物发光成像
朱莉·易萱·陈、青石、雪鹏、让·德·迪厄·哈比马纳、詹姆斯·王、威廉·索博列夫斯基、安迪·贤伟·叶
Chem 11.3 (2025) • 基于RFjoint/ProteinMPNN

MgtE Mg2+通道的生物信息学分类及用于稳定其新型亚类的从头蛋白质设计
赵志轩、小前希美穗、岩崎亘、张子义、潘发志、李恩珍、服部元幸
bioRxiv 2025.05.26.656215 • 代码 • 基于RFDiffusion/ProteinMPNN

基于结构的TEM-171 β-内酰胺酶蛋白抑制剂的从头设计：整合深度学习与多尺度模拟以对抗细菌耐药性
克里希夫·波特卢里
bioRxiv 2025.06.23.661177 • 代码 • 基于RFDiffusion/ProteinMPNN

利用扩散模型生成结构引导的pMHC-I文库
塞尔吉奥·马雷斯、阿里埃尔·埃斯皮诺萨·韦因伯格、尼拉·M·伊万尼迪斯
arXiv:2507.08902 • 代码 • 基于RFDiffusion/ProteinMPNN

CycleDesigner：利用CycRFdiffusion和HighFold设计针对特定靶标的环肽结合剂
陈浩、张振宇、林康、朱宁、张成云、徐文、郭晶晶、苏安、李成熙、段洪亮
J. Chem. Inf. Model. 2025

从头设计蛋白质结合剂以稳定单体TDP-43并抑制其病理性聚集
孙刚宇、李翔、胡娇娇、杨天彬、刘聪、王志志、李丹、许文清
Proc. Natl. Acad. Sci. U.S.A. 122 (36) e2505320122

人工智能生成的小分子MLH1结合剂提高先导编辑效率
朴柱灿、严熙秀、金勇武、吴艺恩、李章贤、杨智允、金京美、裴尚洙
Cell (2025) • 代码

利用深度学习从头设计光调控动态蛋白质
帕特里克·巴斯、洛伦佐·斯库特里、卢恰诺·阿布里亚塔、张书豪、艾西玛·哈西苏莱曼、凯尔文·劳、弗洛伦斯·波耶尔、萨汉德·贾马尔·拉希
bioRxiv 2025.08.12.669910 • 基于RFDiffusion/ProteinMPNN

细菌黏附素的小型蛋白抑制剂的从头设计
亚当·M·查津-格雷、图斯坎·R·汤普森、爱德华·D·B·洛帕托、珀尔·马加拉、帕特里克·W·埃里克森、安德鲁·C·亨特、安娜·曼琴科、帕维尔·阿普里基扬、维罗妮卡·切什诺科娃、伊琳娜·巴索娃、丹尼斯·A·萨尼克、凯文·O·塔马东法尔、摩根·R·蒂姆、杰罗姆·S·平克纳、卡伦·W·多德森、亚历克斯·康、艾米丽·乔伊斯、阿西姆·K·贝拉、亚伦·J·施密茨、阿里·H·埃勒贝迪、凯莉·L·霍沃雷尼、马克·J·卡特赖特、安迪娜·韦内特、萨赖·巴尔达莱斯、德斯蒙德·怀特、瑞秋·E·克利维特、叶夫根尼·V·索库连科、斯科特·J·胡尔特格伦、大卫·贝克
bioRxiv 2025.08.18.670751 • 基于RFDiffusion/ProteinMPNN

计算设计的纳米结合剂作为诊断与治疗应用中的亲和配体
全珠恩、Q. 约翰·刘、禹贤庆、伊莎贝尔·巴斯、崔允贞、L. 杰西卡·桑、李学浩
J. Am. Chem. Soc.(2025) • 基于RFDiffusion/ProteinMPNN

使用BinderFlow实现自动化且模块化的蛋白质结合剂设计
卡洛斯·查孔-桑切斯、纳伊姆·冈萨雷斯-罗德里格斯、奥斯卡·略尔卡、拉斐尔·费尔南德斯-莱罗
bioRxiv 2025.09.10.675490 • 补充材料 • 代码 • 基于RFDiffusion/ProteinMPNN

使用RFdiffusion3进行全原子级生物分子相互作用的从头设计
贾斯珀·肯尼思·维耶·布彻、罗希特·克里希纳、拉克提姆·米特拉、拉斐尔·艾萨克·布伦特、李燕京、纳撒尼尔·科尔利、保罗·金、乔纳森·芬克、西蒙·瓦伦丁·马蒂斯、萨曼·萨利克、爱子·村石、海伦·艾森纳赫、图斯坎·洛克·汤普森、陈洁、尤利娅·波利坦斯卡、恩尼莎·塞加尔、布莱恩·科文特里、奥丁·张、薄强、基兰·迪迪、麦克斯韦尔·卡兹曼、弗兰克·迪马约、大卫·贝克
bioRxiv 2025.09.18.676967 • 补充材料 • 代码

基于人工智能指导的环肽结合剂设计，靶向TREM2：利用CycleRFdiffusion并经实验验证
曹成佑、朱仁杰、卡塔日娜·昆采维奇、段洪亮、穆斯塔法·加布尔
bioRxiv 2025.09.18.676322 • 补充材料

ProteinDJ：高性能且模块化的蛋白质设计流程
迪伦·希尔克、朱莉·伊斯坎德尔、潘俊奇、安德鲁·P·汤普森、安东尼·T·帕彭福斯、伊莎贝尔·S·卢塞特、乔舒亚·M·哈迪
bioRxiv 2025.09.24.678028/Protein Science. 2026

基于计算的表位图谱分析与人工智能驱动的蛋白质工程，实现结核分枝杆菌多表位疫苗的理性设计
李新峰、陶欣宇、钟明月、王一瑶、薛恒、宾达·T·安东马、周善浩、魏洪平、何进、杨航
计算与结构生物技术杂志（2025年）

pH敏感结合蛋白的计算设计
格林·安、布赖恩·科文特里、艾拉·海夫纳、沙扬·萨德雷、珍妮·胡、米莫萨·范、黄步伟、艾萨克·萨平顿、亚当·J·布罗尔曼、毛里茨·A·利希滕斯坦、马蒂亚斯·格勒格尔、因娜·戈列什尼克、迪昂妮·瓦菲阿多斯、大卫·贝克
bioRxiv 2025.09.29.678932

从头设计磷酸化酪氨酸肽结合蛋白
马格努斯·S·鲍尔、张志坚、吴凯嘉、李圭丽、布赖恩·科文特里、科迪·A·克鲁普特、史久涵、拉斐尔·I·布伦特、李欣婷、卡罗琳娜·莫勒、妮可·鲁耶、迪昂妮·K·瓦菲阿多斯、因德雷克·卡尔韦特、丽贝卡·K·斯科特海姆、朱思宇、阿米尔·莫特曼、卢卡·C·赫尔曼、帕斯卡尔·施图尔姆费尔斯、道格·提舍尔、韩·劳特·阿尔泰-特兰、大卫·尤尔根斯、罗希特·克里希纳、伍迪·阿亨、詹森·尹、阿西姆·K·贝拉、亚历克斯·康、艾米莉·乔伊斯、安德鲁·卢、兰斯·斯图尔特、弗兰克·迪马约、大卫·贝克
bioRxiv 2025.09.29.678898

RNA及核蛋白复合物的从头设计
安德鲁·H·法沃、莱利·奎哈诺、叶利扎维塔·切尔诺娃、安德鲁·库巴内伊、康纳·魏德尔、摩根·A·埃斯勒、莉莲·麦克休、安·卡尔、夏阳、大卫·尤尔根斯、肯尼思·D·卡尔、保罗·T·金、尤利娅·波利坦斯卡、埃尼莎·塞加尔、保罗·S·权、罗伯特·J·佩科拉罗、卡梅隆·格拉斯科克、安德鲁·J·博斯特、弗兰克·迪马约、巴里·L·斯托达德、大卫·贝克
bioRxiv 2025.10.01.679929

细胞因子受体相互作用的几何调控可调节合成激动剂信号传导
马克·埃克斯波西特、穆罕默德·阿贝迪、阿迪蒂亚·克里希纳库马尔、舒鲁蒂·贾因、余太乙、蒂莫西·R·赫库斯、迪维杰·马修、索菲·格雷-盖亚尔、陈志杰、威廉·S·格鲁布、安德鲁·法沃、温妮·L·坎、托马斯·施利希特哈尔勒、陈伟、迈克尔·W·帕克、胡安·L·门多萨、安赫尔·F·洛佩斯、E·约翰·韦里、大卫·贝克
bioRxiv 2025.10.12.681819

高通量从头蛋白质设计产生新型免疫调节激动剂
穆罕默德·阿贝迪、马克·埃克斯波西特、布赖恩·科文特里、迪维杰·马修、舒鲁蒂·贾因、阿迪蒂亚·克里希纳库马尔、因娜·戈列什尼克、索菲·L·格雷-盖亚尔、玛格丽特·伦恩-哈尔伯特、余太乙、马蒂亚斯·格勒格尔、乌玛·米切尔、里亚·凯什里、春重浩、汉内勒·鲁霍拉-贝克、E·约翰·韦里、大卫·贝克
bioRxiv 2025.10.12.681920

自下而上设计具有明确选择性滤器几何结构的Ca2+通道
刘玉来、康纳·魏德尔、柳比察·米哈列维奇、约瑟夫·L·沃森、李哲、乐·特蕾西·余、萨加迪普·马朱姆达尔、安德鲁·J·博斯特、肯尼思·D·卡尔、瑞安·D·基布勒、塔梅尔·M·加马尔·埃尔丁、威廉·A·卡特罗尔以及大卫·贝克
自然杂志（2025年） • 代码

利用设计的CEA结合蛋白递送p53蛋白和TCF/LEF转录因子诱饵DNA，靶向抑制结直肠癌
王文、孙璇和吴耿
国际分子科学杂志，2025年 • 补充材料 • 基于RFDiffusion/ProteinMPNN

用于迷你蛋白结合剂优先级排序的混合AI/物理流程：以BRD3 ET结构域为例
乔肯特·加萨、莫妮卡·J·罗斯、盖塔诺·T·蒙特利奥内和阿尔贝托·佩雷斯
化学通讯（2025年） • 代码

通过最大化氢键作用进行超稳定蛋白质的计算设计
郑斌、陆卓健、王尚辰、刘立超、敖明俊、周雨睿、唐国静、王瑞石、刘元昊、张瀚天、孟银英、邱军、冯天富、王子怡、刘仁明、肖跃龙、刘宇彤、王梓凌、黄依芬、姜雅君及郑鹏
自然化学（2025年）

高亲和力HER2靶向蛋白迷你结合剂的从头设计
赵义泽、魏文平、程子俊、杨敏和严云俊
生物分子第15卷第11期（2025年）

用于探测气体通道并提高[NiFe]氢酶氧耐受性的蛋白质结合剂的从头设计
孙璇、李文瑾、李旺哲、罗航、肖琪、张乐言、范怡琳、蒋培宇、吴耿、张丽云
bioRxiv 2025.11.19.689374

金属蛋白酶的计算设计
陈安琪、吴凯嘉、崔浩宰、普里塔姆·文卡特什、塞缪尔·J·佩洛克、尼基塔·哈尼克尔、布赖恩·科文特里、金东孝、塞思·M·伍德伯里、季鹏飞、本田真吾、李欣婷、斯泰西·格尔本、勒穆埃尔·张、萧燕、安东尼·A·海曼、唐纳德·希尔弗特、大卫·贝克
bioRxiv 2025.11.20.689622 • 补充材料

半胱氨酸蛋白酶的计算设计
崔浩宰、布赖恩·科文特里、马格努斯·鲍尔、普里塔姆·文卡特什、陈安琪、金东孝、阿西姆·K·贝拉、亚历克斯·康、汉娜·阮、艾米莉·乔伊斯、巴努马蒂·香卡拉恩、图斯坎·洛克·汤普森、雅各布·默尔·格什恩、亚历山大·F·希达、李圭丽、唐纳德·希尔弗特、塞缪尔·J·佩洛克、大卫·贝克
bioRxiv 2025.11.21.689808 • 补充材料

肽掩蔽的从头设计实现条件活性迷你蛋白结合剂的快速生成
蒙塞拉特·埃斯科巴尔-罗萨莱斯、克里斯蒂娜·蒙塔内尔、马克·埃克斯波西特、罗伯塔·卢奇、克里斯蒂娜·迪亚斯-佩尔拉斯、大卫·贝克、本哈米·奥列尔-萨尔维亚
美国化学会杂志（2025年）

Ovo：一个用于从头蛋白质设计的开源生态系统
大卫·普里霍达、马可·安科纳、特蕾莎·卡洛诺娃、亚当·克拉尔、卢卡斯·波拉克、雨果·赫尔班、尼古拉斯·J·狄更斯、丹尼·阿舍·比特顿
bioRxiv 2025.11.27.691041 • 代码

机器学习助力恶性疟原虫环子孢子蛋白从头多表位设计，以靶向三聚体L9抗体
J. Andrew D. Nelson、Samuel E. Garfinkle、Zi Jie Lin、Joyce Park、Amber J. Kim、Kelly Bayruns、Madison E. McCanna、Kylie M. Konrath、Colby J. Agostino、Daniel W. Kulp、Daniel.Kulp、Audrey R. Odom John及Jesper Pallesen
《美国国家科学院院刊》122卷第49期（2025年）

利用深度学习精确搭建三个非重叠蛋白质表位的单域支架
Karla M. Castro、Joseph L. Watson、Jue Wang、Joshua Southern、Reyhaneh Ayardulabi、Sandrine Georgeon、Stéphane Rosset、David Baker及Bruno E. Correia
Nat Chem Biol（2025年）

基于催化基序支架的酶计算设计
Markus Braun、Adrian Tripp、Morakot Chakatok、Sigrid Kaltenbrunner、Celina Fischer、David Stoll、Aleksandar Bijelic、Wael Elaily、Massimo G. Totaro、Melanie Moser、Shlomo Y. Hoch、Horst Lechner、Federico Rossi、Matteo Aleotti、Mélanie Hall及Gustav Oberdorfer
Nature（2025年） • 代码链接

集成功能基序的蛋白质纳米颗粒从头设计
Cyrus M Haas、Sanela Rankovic、Hanul K Lewis、Kenneth D Carr、Connor Weidle、Sophie S Gerdes、Lily R Nuss、Felicitas Ruiz、Syed Moiz、Maggie Fiorelli、Emily Grey、Jackson McGowan、Nikhila Kumar、Adrian Creanga、Alex Kang、Hannah Nguyen、Yanqing Wang、Banumathi Sankaran、Annie Dosey、Rashmi Ravichandran、Asim K Bera、Elizabeth M Leaf、Cole A DeForest、Masaru Kanekiyo、Andrew J Borst、Neil P King
bioRxiv 2025.12.19.695620 • 代码链接

靶向DELE1以抑制线粒体应激反应的蛋白质结合剂从头设计
Rui Yang、Kaiyuan Zheng、McGuire Metts、Yiluo Wang、Danyan Yin、Kevin P. Li、Agnieszka A. Prazmowska、David F. Kashatus、Brian Kuhlman、Jie Yang
bioRxiv 2025.12.22.695711

作为潜在甜味蛋白的人类甜味受体靶向蛋白质结合剂的从头设计
Saisai Ding、Yi Zhang
arXiv:2601.14574

在设计的蛋白质组装体中模板化并限制磷酸钙矿化
Le Tracy Yu、Harley Pyles、Xinqi Li、Andrew J. Borst、Neville P. Bethel、Paul S. Kwon、Connor Weidle、Ryan D. Kibler、Kenneth D. Carr、Yulai Liu、Stanislav Moroz、Shuai Zhang、James De Yoreo、David Baker
bioRxiv 2026.01.14.699524 • 补充材料

强效CRISPR–Cas13抑制剂的从头设计
Cyntia Taveneau、Her Xiang Chai、Jovita D’Silva、Rebecca S. Bamert、Honglin Chen、Brooke K. Hayes、Roland W. Calvert、Jacob Purcell、Daniel J. Curwen、Fabian Munder、Lisandra L. Martin、Jeremy J. Barr、Joseph Rosenbluh、Mohamed Fareh、Rhys Grinter及Gavin J. Knott
Nat Chem Biol（2026年）

RFdiffusion设计的小型蛋白质结合SARS-CoV-2核衣壳蛋白的实验分析
Zeenat Khakerwala、Ashwani Kumar、Sujay S Gaikwad、Truptimayee Barik、Shweta Singh、Gagan Deep Gupta、Ravindra D Makde
Protein Engineering, Design and Selection，2026年

基于肽基序支架的蓝色黑色素计算设计
Di Sheng Lee、Bomi Park、Sergio Salgado、James Dolgin、David L. Kaplan
bioRxiv 2026.02.02.703104

GPCR外框架调节剂的从头设计
Shizhuo Cheng、Jia Guo、Yun-li Zhou、Xumei Luo、Gufang Zhang、Ya-zhi Zhang、Yixin Yang、Jiannan Xie、Ping Xu、Dan-dan Shen、Shaokun Zang、Huicui Yang、Xuechu Zhen、Min Zhang及Yan Zhang
Nature（2026年）

用设计的bioPROTAC重新编程CAR T细胞
Vivek S Peche、Sebastian Kenny、Tae Gun Kang、Brian Coventry、Tian Mi、Inna Goreshnik、Mariana Garcia Sanchez、Reid Martin、Macey Smith、Dionne Vafeados、Rahul S Kathayat、Yu Kaiwen、Zuo-Fei Yuan、Long Wu、Anthony High、Andrew Nemecek、Elizabeth Wickmann、Adeleye Adeshakin、Francesca Ferrara、Robert E Throm、Taosheng Chen、Benjamin Youngblood、David Baker、Stephen Gottschalk
bioRxiv 2026.02.21.706835

金黄色葡萄球菌外排转运蛋白NorA的小型蛋白质抑制剂
Priyanka Mishra、Adam Chazin-Gray、Gaëlle Lamon、David Kim、David Baker、Nathaniel J. Traaseth
bioRxiv 2026.03.05.709893 • 补充材料

靶向补体C9以阻断膜攻击复合物组装的小型蛋白质抑制剂设计
Bing He、Chenchen Qin、Yu Zhao、Long-Kai Huang、Zihan Wu、Fang Wang、Fandi Wu、Fan Yang及Jianhua Yao
Nat Commun（2026年）

6.4 基于CNN

利用表面指纹从头设计位点特异性蛋白质结合剂 Pablo Gainza、Sarah Wehrle、Alexandra Van Hall-Beauvais、Anthony Marchand、Andreas Scheck、Zander Harteveld、Stephen Buckley、Dongchun Ni、Shuguang Tan、Freyr Sverrisson、Casper Goverde、Priscilla Turelli、Charlène Raclot、Alexandra Teslenko、Martin Pacesa、Stéphane Rosset、Sandrine Georgeon、Jane Marsden、Aaron Petruzzella、Kefang Liu、Zepeng Xu、Yan Chai、Pu Han、George F. Gao、Elisa Oricchio、Beat Fierz、Didier Trono、Henning Stahlberg、Michael Bronstein、Bruno E. Correia Protein Science 30.CONF (2021)/bioRxiv (2022)/Nature (2023) • 补充材料 • masif_seed • masif • 讲座

利用可泛化的深度学习方法靶向蛋白质-配体新表面 Anthony Marchand、Stephen Buckley、Arne Schneuing、Martin Pacesa、Pablo Gainza、Evgenia Elizarova、Rebecca Manuela Neeser、Pao-Wan Lee、Luc Reymond、Maddalena Elia、Leo Scheller、Sandrine Georgeon、Joseph Schmidt、Philippe Schwaller、Sebastian Josef Maerkl、Michael Bronstein、Bruno Emmanuel Correia bioRxiv 2024.03.25.585721/Nature (2025) • 补充材料 • 代码 • 讲座

绘制人类表面组中可靶向位点以设计新型结合剂 Petra E. M. Balbi、Ahmed Sadek、Anthony Marchand、Ta-Yi Yu、Sandrine Georgeon、Joseph Schmidt、Simone Fulle、Che Yang、Hamed Khakzad 和 Bruno E. Correia
bioRxiv 2024.12.16.628626/Proc. Natl. Acad. Sci. • 代码 • 网站

AutoBinder Agent：基于MCP的端到端蛋白质结合剂设计代理
Fukang Ge、Jiarui Zhu、Linjie Zhang、Haowen Xiao、Xiangcheng Bao、Fangnan Xie、Danyang Chen、Yanrui Lu、Yuting Wang、Ziqian Guan、Lin Gu、Jinhao Bi、Yingying Zhu arXiv:2602.00019

6.5 基于GNN

用于抗体序列-结构协同设计的迭代精炼图神经网络 Wengong Jin、Jeremy Wohlwend、Regina Barzilay、Tommi Jaakkola arXiv预印本 arXiv:2110.04624 (2021) • RefineGNN • 讲座1、讲座2

利用约束能量模型设计抗体互补决定区（CDR） Fu、Tianfan 和 Jimeng Sun 第28届ACM SIGKDD知识发现与数据挖掘会议论文集，2022年 • 代码

作为3D等变图转换的条件性抗体设计 Xiangzhe Kong、Wenbing Huang、Yang Liu ICLR 2023/arXiv:2208.06073

端到端全原子抗体设计 Xiangzhe Kong、Wenbing Huang、Yang Liu arXiv:2302.00203 • 代码

AbODE：利用联合ODE从头设计抗体 Yogesh Verma、Markus Heinonen、Vikas Garg arXiv:2306.01005

基于基序的蛋白质序列与结构联合设计 Zhenqiao Song、Yunlong Zhao、Yufei Song、Wenxian Shi、Yang Yang、Lei Li arXiv:2310.02546

利用几何矢量场网络从头设计蛋白质 Weian Mao、Muzhi Zhu、Zheng Sun、Shuaike Shen、Lin Yuanbo Wu、Hao Chen、Chunhua Shen arXiv:2310.11802/ICLR 2024

几何图神经网络综述：数据结构、模型与应用 Jiaqi Han、Jiacheng Cen、Liming Wu、Zongzhao Li、Xiangzhe Kong、Rui Jiao、Ziyang Yu、Tingyang Xu、Fandi Wu、Zihe Wang、Hongteng Xu、Zhewei Wei、Yang Liu、Yu Rong、Wenbing Huang arXiv:2403.00485 • 综述

GeoAB：迈向更真实的抗体设计与可靠的亲和力成熟 Haitao LIN、Lirong Wu、Huang Yufei、Yunfan Liu、Odin Zhang、Yuanqing Zhou、Rui Sun、Stan Z Li bioRxiv 2024.05.15.594274/ICML 2024 • 代码

拓扑神经网络走向持久化、等变性和连续性 Yogesh Verma、Amauri H Souza、Vikas Garg arXiv:2406.03164 • 代码

面向表位未知抗体设计及特异性优化的关系感知等变图网络 Lirong Wu、Haitao Lin、Yufei Huang、Zhangyang Gao、Cheng Tan、Yunfan Liu、Tailin Wu、Stan Z. Li arXiv:2501.00013 • 代码

迈向更精确的全原子抗体协同设计 Jiayang Wu、Xingyi Zhang、Xiangyu Dong、Kun Xie、Ziqi Liu、Wensheng Gan、Sibo Wang、Le Song arXiv:2502.19391/OpenReview

NanoDesigner：通过迭代精炼解决复杂–CDR相互依赖问题 Melissa Maria Rios Zertuche、Şenay Kafkas、Dominik Renn、Magnus Rueping、Robert Hoehndorf bioRxiv 2025.02.25.640028 • 补充材料 • 代码 • 基于dyMEAN

6.6 基于 Transformer 的方法

具有等变平移不变性的蛋白质序列与结构协同设计
史辰策、王传睿、陆嘉睿、钟博子涛、唐健
arXiv:2210.08761/ICLR 2023 • 补充材料 • 代码

用于灵活且位点特异性蛋白质对接与设计的深度学习
马特·麦克帕特隆、许进波
bioRxiv 2023.04.01.535079 • 代码

通过迭代精炼进行全原子蛋白质口袋设计
张在熙、卢泽普、郝仲凯、马林卡·齐特尼克、刘琪
arXiv:2310.02553 • 代码

基于功能几何引导的蛋白质序列与主链结构协同设计
匿名
ICLR 2024

利用 tFold 快速准确地建模与设计抗体-抗原复合物
吴凡迪、赵宇、吴家祥、姜彪斌、何兵、黄龙凯、秦晨晨、杨帆、黄宁乔、肖阳、王汝波、贾华贤、荣宇、刘宇义、赖厚廷、徐挺洋、刘伟、赵培琳、姚建华
bioRxiv 2024.02.05.578892 • 官网

PocketGen：生成全原子配体结合蛋白质口袋
张在熙、沈万翔、刘琪、马林卡·齐特尼克
bioRxiv 2024.02.25.581968/Nature Machine Intelligence, 2024 • 代码 • 官网

用语言模型模拟五亿年的进化
托马斯·海耶斯、罗山·拉奥、哈利尔·阿金、尼古拉斯·詹姆斯·索弗罗涅夫、德尼兹·奥克泰、林泽明、罗伯特·维尔库伊尔、文森特·奎·陈、乔纳森·迪顿、马里乌斯·维格特、罗希尔·巴德昆德里、伊鲁姆·沙夫卡特、龚俊、亚历山大·德里、劳尔·圣地亚哥·莫利纳、尼尔·托马斯、优素福·汗、切坦·米什拉、卡罗琳·金、利亚姆·J·巴蒂、帕特里克·D·许、汤姆·塞尔库、萨尔瓦托雷·坎迪多、亚历山大·里夫斯
预印本/bioRxiv 2024.07.01.600583/Science (2025): eads0018 • 官网 • 代码 • Colab • 新闻

迈向基于多模态语言模型的蛋白质序列与结构协同设计
卢哲文、Stephen_Zhewen_Lu、陆嘉睿、郭洪宇、唐健
ICLR 2025 工作坊 LMRL • 基于 ESM3

利用 ProteinZen 进行 SE(3) 流匹配的全原子蛋白质设计
亚历克斯·J·李、坦雅·科尔特梅
bioRxiv 2025.10.18.683228 • 代码

基于蛋白质文本描述从头设计氨基酸序列——ProtDAT
郭晓宇、李一凡、刘源、潘晓勇及沈鸿彬
Nat Commun 16, 10544 (2025) • 代码 • 官网

配体指导的从头功能性酶序列—结构协同设计
宋振桥、刘慧冲、赵云龙、杨阳、李磊
bioRxiv 2026.03.02.709205 • 代码

6.7 基于 MLP 的方法

具有交叉门控 MLP 的蛋白质复合物不变性嵌入是一次性抗体设计师
陈诚、高章阳、Stan Z. Li
arXiv:2305.09480

基于热点驱动的多片段自回归扩展肽段设计
李佳涵、陈彤、罗世通、程超然、关佳琪、郭瑞涵、王晟、刘戈、彭健、马建柱
arXiv:2411.18463

6.8 基于流的方法

离散状态空间上的生成流：实现多模态流并应用于蛋白质协同设计 Andrew Campbell、Jason Yim、Regina Barzilay、Tom Rainforth、Tommi Jaakkola arXiv:2402.04997 • 代码 • 讲座

PPFlow：基于扭转流匹配的靶向肽设计 Haitao Lin、Odin Zhang、Huifeng Zhao、Dejun Jiang、Lirong Wu、Zicheng Liu、Yufei Huang、Stan Z. Li bioRxiv 2024.03.07.583831/arXiv:2405.06642 • 补充材料 • 代码

基于多模态流匹配的全原子肽设计 Jiahan Li、Chaoran Cheng、Zuofan Wu、Ruihan Guo、Shitong Luo、Zhizhou Ren、Jian Peng、Jianzhu Ma arXiv:2406.00735 • 代码

AntibodyFlow：用于设计抗体互补决定区的归一化流模型 Bohao Xu、Yanbo Wang、Wenyu Chen、Shimin Shan arXiv:2406.13162

基于先验信息流匹配的通用蛋白质口袋生成 Zaixi Zhang、Marinka Zitnik、Qi Liu arXiv:2409.19520

D-Flow：用于D-肽设计的多模态流匹配 Fang Wu、Tinson Xu、Shuting Jin、Xiangru Tang、Zerui Xu、James Zou、Brian Hie arXiv:2411.10618 • 代码

FlowDesign：通过流匹配和更优的先验分布改进抗体CDR的设计 Jun Wu、Xiangzhe Kong、Ningguan Sun、Jing Wei、Sisi Shan、Fuli Feng、Feng Wu、Jian Peng、Linqi Zhang、Yang Liu、Jianzhu Ma bioRxiv 2024.11.07.622422/Cell Systems (2025) • 代码

反应条件驱动的从头酶设计与GENzyme Chenqing Hua、Jiarui Lu、Yong Liu、Odin Zhang、Jian Tang、Rex Ying、Wengong Jin、Guy Wolf、Doina Precup、Shuangjia Zheng arXiv:2411.16694 • 代码

ProteinZen：结合潜在空间与SE(3)流匹配，用于全原子蛋白质生成 Alex Li、Tanja Kortemme 2024年NeurIPS结构生物学机器学习研讨会

HelixFlow：SE(3)等变的全原子肽设计，采用流匹配模型 Xuezhi Xie、Pedro A Valiente、Jisun Kim、Jin Sub Lee、Philip Kim 2024年NeurIPS结构生物学机器学习研讨会

IgFlow：用于从头抗体设计的流匹配 Sanjay Nagaraj、Amir Shanehsazzadeh、Hyun Park、Jonathan King、Simon Levine 2024年NeurIPS结构生物学机器学习研讨会

基于表面的多模态流匹配肽设计 Fang Wu、Shuting Jin、xiangxiang Zeng、Jure Leskovec、Jinbo Xu ICLR 2025

用于全原子肽设计的非线性流匹配 Dengdeng Huang、Shikui Tu arXiv:2502.15855

dyAb：基于AlphaFold驱动的抗原预结合，用于柔性抗体设计的流匹配 Cheng Tan、Yijie Zhang、Zhangyang Gao、Yufei Huang、Haitao Lin、Lirong Wu、Fandi Wu、Mathieu Blanchette、Stan. Z. Li arXiv:2503.01910 • 代码

GeoFlow-V2：统一的原子扩散模型，用于蛋白质结构预测和从头设计 BioGeometry团队预印本 • 网站 • 商业化

通过离散流匹配进行全原子逆向蛋白质折叠 Kai Yi、Kiarash Jamali、Sjors HW Scheres ICML 2025海报

通过生成流在离散空间中协同设计蛋白质序列和结构 Sen Yang、Lingli Ju、Cheng Peng、JiangLin Zhou、Yamin Cai、Dawei Feng Bioinformatics, 2025 • 代码 • 模型

La-Proteina：通过部分潜在流匹配进行原子级蛋白质生成 Tomas Geffner、Kieran Didi、Zhonglin Cao、Danny Reidenbach、Zuobai Zhang、Christian Dallago、Emine Kucukbenli、Karsten Kreis、Arash Vahdat arXiv:2507.09466 • 网站

利用流匹配设计含有非经典氨基酸的肽 Jin Sub Lee、Philip M Kim bioRxiv 2025.07.31.667780

探究侧链对从头蛋白质设计的影响 Cooper Svajda、Joshua Yuan bioRxiv 2025.08.08.669410

基于潜在靶点ATP5A的胶质母细胞瘤治疗性肽的生成设计与验证 Hao Qian、Pu You、Lin Zeng、Jingyuan Zhou、Dengdeng Huang、Kaicheng Li、Shikui Tu、Lei Xu arXiv:2512.02030

AbFlow：基于交互增强流匹配的端到端互补位中心抗体设计 Wenda Wang、Yang Zhang、Zhewei Wei、Wenbing Huang arXiv:2602.07084 • 代码

面向蛋白质设计与构象集合的刚性感知几何预训练 Zhanghan Ni、Yanjing Li、Zeju Qiu、Bernhard Schölkopf、Hongyu Guo、Weiyang Liu、Shengchao Liu arXiv:2603.02406

通过生成式预训练与测试时计算扩展原子级蛋白质结合剂设计 Kieran Didi、Zuobai Zhang、Guoqing Zhou、Danny Reidenbach、Zhonglin Cao、Sooyoung Cha、Tomas Geffner、Christian Dallago、Jian Tang、Michael M. Bronstein、Martin Steinegger、Emine Kucukbenli、Arash Vahdat、Karsten Kreis ICLR 2026口头报告/湿实验论文 • 代码 • 网站

6.9 基于AlphaFold

CarbonNovo：基于统一能量模型的蛋白质结构与序列联合设计 Ren、Milong、Tian Zhu 和 Haicang Zhang ICML 2024 • 代码

P（全原子）正在为蛋白质设计开辟新路径 Wei Qu、Jiawei Guan、Rui Ma、Ke Zhai、Weikun Wu、Haobo Wang bioRxiv 2024.08.16.608235 • 代码 • 新闻

EnzymeFlow：通过流匹配和共进化动力学生成反应特异性酶催化口袋 Chenqing Hua 论文暂未公开 • 代码

IgGM：用于功能性抗体和纳米抗体设计的生成模型 Rubo Wang、Fandi Wu、Xingyu Gao、Jiaxiang Wu、Peilin Zhao、Jianhua Yao bioRxiv 2024.09.19.613838 • 代码

一种用于设计蛋白质复合物的全原子生成模型 Ruizhe Chen、Dongyu Xue、Xiangxin Zhou、Zaixiang Zheng、Xiangxiang Zeng、Quanquan Gu arXiv:2504.13075 • 代码

将类似AlphaFold3的蛋白质折叠模型重新用于抗体序列与结构的协同设计 Nianzu Yang、Nianzu_Yang、Jian Ma、Songlin Jiang、Huaijin Wu、Shuangjia Zheng、Wengong Jin、Junchi Yan OpenReview

针对治疗性单域抗体定制化设计的协同生成-排序框架 Yu Kong、Jiale Shi、Fandi Wu、Ting Zhao、Rubo Wang、Xiaoyi Zhu、Qingyuan Xu、Yidong Song、Quanxiao Li、Yulu Wang、Xingyu Gao、Yuedong Yang、Yi Feng、Zifei Wang、Weifeng Ge、Yanling Wu、Zhenlin Yang、Jianhua Yao 和 Tianlei Ying Cell Discovery 11, 85 (2025)

CONFIDE：用于可靠生物分子结构预测与设计的幻觉评估 Zijun Gao、Mutian He、Shijia Sun、Hanqun Cao、Jingjie Zhang、Zihao Luo、Xiaorui Wang、Xiaojun Yao、Chang-Yu Hsieh、Chunbin Gu、Pheng Ann Heng arXiv:2512.02033 • 代码

7. 其他任务

7.1 突变效应与适应度景观

遗传变异的深度生成模型能够捕捉突变效应 Adam J. Riesselman、John B. Ingraham 和 Debora S. Marks Nature Methods • 代码：DeepSequence • 2018年10月

利用潜在空间模型解析蛋白质进化与适应度景观 Xinqiang Ding、Zhengting Zou 和 Charles L. Brooks III Nature Communications • 代码：PEVAE • 2019年12月

蛋白质景观预测是否需要迁移学习？ Shanehsazzadeh、Amir、David Belanger 和 David Dohan arXiv 预印本 arXiv:2011.03443 (2020)

Epistatic Net 可实现深度神经网络的稀疏谱正则化，用于推断适应度函数 Amirali Aghazadeh、Hunter Nisonoff、Orhan Ocal、David H. Brookes、Yijie Huang、O. Ozan Koyluoglu、Jennifer Listgarten 和 Kannan Ramchandran Nature Communications • 代码 • 2021年9月

概率型蛋白质序列模型的生成能力 Francisco McGee、Sandro Hauri、Quentin Novinger、Slobodan Vucetic、Ronald M. Levy、Vincenzo Carnevale 和 Allan Haldane Nature Communications • 代码：generation_capacity_metrics • 代码：sVAE • 2021年11月

利用卷积神经网络学习蛋白质结构的局部景观 Anastasiya V. Kulikova、Daniel J. Diaz、James M. Loy、Andrew D. Ellington 和 Claus O. Wilke 生物物理学杂志 47.4 (2021)

基于深度突变扫描数据学习蛋白质序列-功能关系的神经网络 Sam Gelman、Sarah A. Fahlberg、Pete Heinzelman、Philip A. Romero 和 Anthony Gitter 美国国家科学院院刊 • 代码 • 2021年11月

从进化数据和实验标记数据中学习蛋白质适应度模型 Chloe Hsu、Hunter Nisonoff、Clara Fannjiang、Jennifer Listgarten Nature Biotechnology (2022) • 补充信息 • 代码

基于模型指导的蛋白质序列设计中的近端探索 Zhizhou Ren、Jiahan Li、Fan Ding、Yuan Zhou、Jianzhu Ma、Jian Peng BioRxiv (2022) • 代码 • 商业用途

仅凭通用蛋白质语言模型和序列信息即可高效进化人类抗体 Brian L. Hie、Duo Xu、Varun R. Shanker、Theodora U.J. Bruun、Payton A. Weidenbacher、Shaogeng Tang、Peter S. Kim bioRxiv (2022) • 代码

Tranception：基于自回归Transformer和推理时检索的蛋白质适应度预测 Notin、P.、Dias、M.、Frazer、J.、Marchena-Hurtado、J.、Gomez、A.、Marks、D.S.、Gal、Y ICML (2022)/arXiv:2205.13760 • 代码 • Hugging Face

通过贝叶斯优化引导的进化算法和机器人实验进行蛋白质工程 Ruyun Hu、Lihao Fu、Yongcan Chen、Junyu Chen、Yu Qiao、Tong Si bioRxiv 2022.08.11.503535

基于人工智能预测结合亲和力和自然性的抗体优化 Sharrol Bachas、Goran Rakocevic、David Spencer、Anand V. Sastry、Robel Haile、John M. Sutton、George Kasun、Andrew Stachyra、Jahir M. Gutierrez、Edriss Yassine、Borka Medjo、Vincent Blay、Christa Kohnert、Jennifer T. Stanton、Alexander Brown、Nebojsa Tijanic、Cailen McCloskey、Rebecca Viazzo、Rebecca Consbruck、Hayley Carter、Simon Levine、Shaheed Abdulhaqq、Jacob Shaul、Abigail B. Ventura、Randal S. Olson、Engin Yapici、Joshua Meier、Sean McClain、Matthew Weinstock、Gregory Hannum、Ariel Schwartz、Miles Gander、Roberto Spreafico bioRxiv 2022.08.16.504181 • 海报

用于蛋白质物理的深度神经网络能量函数构建 Yang、Huan、Xiong Zhaoping 和 Francesco Zonta 《化学理论与计算杂志》（2022）

从实验室进化实验中推断蛋白质适应度景观 Sameer D’Costa、Emily C. Hinds、Chase R. Freschlin、Hyebin Song、Philip A. Romero bioRxiv 2022.09.01.506224 • 补充材料

BayeStab：利用不确定性量化预测突变对蛋白质稳定性的影响 Shuyu Wang、Hongzhou Tang、Yuliang Zhao、Lei Zuo 《蛋白质科学》（2022） • 代码 • 网站

用于基准测试模型引导蛋白质设计的调谐适应度景观 Neil Thomas、Atish Agarwala、David Belanger、Yun S. Song、Lucy Colwell bioRxiv 2022.10.28.514293 • 代码

基于结构的残基偏好进行蛋白质设计 David Ding、Ada Y Shaw、Sam Sinai、Nathan J Rollins、Noam Prywes、David Savage、Michael T Laub、Debora S Marks bioRxiv 2022.10.31.514613 • 代码

利用RoseTTAFold准确预测突变效应 Sanaa Mansoor、Minkyung Baek、David Juergens、Joseph L Watson、David Baker bioRxiv 2022.11.04.515218

用全息卷积神经网络学习蛋白质微环境的形状 Michael N. Pun、Andrew Ivanov、Quinn Bellamy、Zachary Montague、Colin LaMont、Philip Bradley、Jakub Otwinowski、Armita Nourmohammad bioRxiv（2022） • 代码

全局推断，局部预测：基于序列数据的蛋白质适应度预测中的数量-质量权衡 Lorenzo Posani、Francesca Rizzato、Rémi Monasson、Simona Cocco bioRxiv 2022.12.12.520004

通过计算机模拟折叠和熔解验证从头设计的水溶性和跨膜蛋白 Alvaro Martin、Carolin Berner、Sergey Ovchinnikov、Anastassia Andreevna Vorobieva bioRxiv 2023.06.06.543955 • Colab

PoET：作为序列序列的蛋白质家族生成模型 Timothy F. Truong Jr、Tristan Bepler arXiv:2306.06156 • 代码

利用深度学习表征快速预测蛋白质稳定性 Lasse M Blaabjerg、Maher M Kassem、Lydia L Good、Nicolas Jonsson、Matteo Cagiada、Kristoffer E Johansson、Wouter Boomsma、Amelie Stein、Kresten Lindorff-Larsen eLife 12:e82593 • 代码

一种通用的温度引导语言模型，用于工程化增强蛋白质的稳定性和活性 Pan Tan、Mingchen Li、Yuanxi Yu、Fan Jiang、Lirong Zheng、Banghao Wu、Xinyu Sun、Liqi Kang、Jie Song、Liang Zhang、Yi Xiong、Wanli Ouyang、Zhiqiang Hu、Guisheng Fan、Yufeng Pei、Liang Hong arXiv:2307.12682

迁移学习以利用更大数据集改进蛋白质稳定性变化的预测 Henry Dieckhaus、Michael Brocidiacono、Nicholas Randolph、Brian Kuhlman bioRxiv 2023.07.27.550881 • 代码 • 补充材料

基于结构的自监督学习可在蛋白质宇宙尺度上超快速预测突变引起的稳定性变化 Jinyuan Sun、Tong Zhu、Yinglu Cui、Bian Wu bioRxiv 2023.08.09.552725 • 代码

提升基于AND/OR的计算蛋白质设计：动态启发式与可泛化的UFO Bobak Pezeshki、Radu Marinescu、Alexander Ihler、Rina Dechter arXiv:2309.00408

使用RoseTTAFold进行蛋白质稳定性和功能的零样本突变效应预测 Sanaa Mansoor、Minkyung Baek、David Juergens、Joseph L. Watson、David Baker 《蛋白质科学》 • 学位论文

利用AlphaMissense准确预测全蛋白质组错义突变效应 Jun Cheng、Guido Novati、Joshua Pan、Clare Bycroft、Akvile Žemgulyte、Taylor Applebaum、Alexander Pritzel、Lai Hong Wong、Michal Zielinski、Tobias Sargeant、Rosalia G. Schneider、Andrew W. Senior、John Jumper、Demis Hassabis、Pushmeet Kohli、Žiga Avsec 《科学》0,eadg7492DOI:10.1126/science.adg7492 • 代码 • 数据

酶结构与突变效应的可预测性相关 Floris Julian van der Flier、Dave Estell、Sina Pricelius、Lydia Dankmeyer、Sander van Stigt Thans、Harm Mulder、Rei Otsuka、Frits Goedegebuur、Laurens Lammerts、Diego Staphorst、Aalt D.J. van Dijk、Dick de Ridder、Henning Redestig bioRxiv 2023.09.25.559319/《计算与结构生物技术杂志》（2024） • 代码

利用结构建模快速、准确地按靶标结合倾向对工程化蛋白质进行排序 丁晓哲、陈欣红、艾琳·E·沙利文、蒂莫西·F·谢伊、维维安娜·格拉迪纳鲁 bioRxiv 2023.01.11.523680/分子治疗（2024） • 代码 • Colab

神经网络外推至蛋白质适应度景观的遥远区域 萨拉·A·法尔贝格、切斯·R·弗雷斯克林、皮特·海因策尔曼、菲利普·A·罗梅罗 bioRxiv 2023.11.08.566287 • 补充材料

利用适应度景观建模与强化学习加速蛋白质工程 孙浩然、何亮、邓攀、刘国清、刘海光、曹川、鞠福松、吴立军、秦涛、刘铁燕 bioRxiv 2023.11.16.565910

由大型语言模型引导的定向进化进行蛋白质设计 Trong Thanh Tran、Truong Son Hy bioRxiv 2023.11.29.568945 • 补充材料 • 代码

高通量机器学习指导下的多样化单域抗体设计，用于对抗SARS-CoV-2 克里斯托夫·安格尔穆勒、泽尔达·玛丽、本杰明·杰斯特、艾米丽·恩格尔哈特、瑞安·埃默森、巴巴克·阿里帕纳希、扎卡里·瑞安·麦考、吉姆·罗伯茨、兰多夫·M·洛佩兹、大卫·扬格、露西·科尔韦尔 bioRxiv 2023.12.01.569227

利用大型语言模型高效预测单点突变引起的蛋白质稳定性变化 张一杰、高章阳、谭成、Stan Z.Li arXiv预印本 arXiv:2312.04019（2023）

DSMBind：SE(3)去噪分数匹配用于无监督结合能预测和纳米抗体设计 金文功、陈迅、阿米塔·维蒂卡登、西拉努什·萨尔齐科娃、拉克蒂玛·雷乔德胡里、卡罗琳·乌勒、尼尔·哈科亨 bioRxiv 2023.12.10.570461 • 补充材料1 • 补充材料2

基于结构信息的语言模型进行蛋白质复合物逆折叠，实现无监督抗体进化 瓦伦·R·尚克、西奥多拉·U.J·布鲁恩、布莱恩·L·希、彼得·S·金 bioRxiv 2023.12.19.572475

EvolMPNN：通过进化编码预测同源蛋白上的突变效应 钟志强、达维德·莫廷 arXiv:2402.13418

通过对抗性学习生成亲和力单调递增、与更强蛋白质复合物结合的突变体 田岚、苏书泉、平鹏尧、久尔吉·胡特瓦格纳、刘涛、潘毅和李金燕 Nat Mach Intell 6, 315–325 (2024) • 代码

基于生物物理学的蛋白质语言模型用于蛋白质工程 萨姆·盖尔曼、布莱斯·约翰逊、切斯·弗雷斯克林、萨米尔·德科斯塔、安东尼·吉特和菲利普·A·罗梅罗 bioRxiv 2024.03.15.585128 • 代码

基于潜在空间的定向进化，以梯度上升加速蛋白质序列设计 / LatentDE：基于潜在空间的定向进化用于蛋白质序列设计 Nhat Khang Ngo、Thanh V. T. Tran、Viet Thanh Duy Nguyen、Truong Son Hy bioRxiv 2024.04.13.589381/NeurIPS 2024/机器学习：科学与技术（2025） • 代码

AAVDiff：通过扩散生成增强重组腺相关病毒（AAV）衣壳的存活率和多样性——实验验证 刘立军、杨佳莉、宋建飞、杨兴林、牛乐乐、蔡泽奇、施慧、侯廷俊、谢昌宇、沈伟然、邓亚峰 arXiv:2404.10573

使用轻量级图去噪神经网络进行蛋白质工程 周冰心、郑丽蓉、吴邦浩、谭洋、吕欧彤怡、易凯、范贵生和洪亮化学信息与建模杂志（2024） • 代码

VespaG：专家指导的蛋白质语言模型实现准确且极快的适应度预测 塞琳·马尔凯、尤利乌斯·施伦索克、玛丽娜·阿巴卡罗娃、布尔哈德·罗斯特、艾洛迪·莱恩 bioRxiv 2024.04.24.590982 • 代码

SARS-CoV-2对称nsp7二聚体的界面设计及机器学习指导下的nsp7序列预测揭示了nsp7稳定性和适应性的理化性质与热点，为治疗设计提供依据 阿马尔·吉特·亚达夫、希万克·库马尔、施韦塔·茂里亚、库什布·巴加特和阿迪提亚·K·帕迪物理化学化学物理（2024）

通过直接偏好优化将蛋白质生成模型与实验适应度对齐 塔拉勒·维达塔拉、拉斐尔·拉法伊洛夫、布莱恩·希 bioRxiv 2024.05.20.595026 • 代码

ProBASS——一种结合序列和结构特征的语言模型，用于预测突变对结合亲和力的影响 萨加拉·N.S. 古鲁辛格、吴义兵、威廉·德格拉多、朱莉娅·M·希夫曼 bioRxiv 2024.06.21.600041 • 代码

利用结构信息语言模型进行蛋白质和抗体复合物的无监督进化 瓦伦·R·尚克、西奥多拉·U.J·布鲁恩、布莱恩·L·希、彼得·S·金 Science385,46-53(2024) • 代码

通过少量样本学习，在极少湿实验室数据的情况下提升蛋白质语言模型效率 周子怡、张亮、于元熙、吴邦浩、李明晨、洪亮和谭攀 Nat Commun 15, 5566 (2024) • 代码

基于蛋白质语言模型的少样本学习实现蛋白质快速进化 姜凯毅、闫兆青、马泰奥·迪·贝尔纳多、萨曼莎·R·斯格里齐、卢卡斯·维利格、阿里桑·卡亚博伦、金炳志、约瑟芬·K·卡斯卡登、平泉昌弘、西政久、乔纳森·S·古滕贝格、奥马尔·O·阿布戴耶 bioRxiv 2024.07.17.604015 • 代码1、代码2

利用多模态深度表征学习进行零样本突变效应预测，指导蛋白质工程 程鹏、毛聪、唐进、杨森、程宇、王武科、顾秋曦、韩伟、陈浩、李思涵、陈耀峰、周江林、李五举、潘爱民、赵素文、黄兴旭、朱世强、张军、舒文杰和王圣奇 Cell Research (2024) • 代码

机器学习引导的适应度与多样性协同优化促进酶工程中的组合文库设计 丁克尔、迈克尔·秦、赵云龙、黄伟、梅彬康、王焕楠、刘鹏、杨洋和罗云安 Nature Communications 15.1 (2024) • 代码、模型

狄利克雷潜在建模实现功能性蛋白质设计空间的有效学习与采样 叶夫根尼·洛布扎耶夫、乔瓦尼·斯特拉夸达尼奥 Nat Commun 15, 9309 (2024) • 代码

MProt-DPO：通过直接偏好优化突破多模态蛋白质设计工作流的ExaFLOPS瓶颈 高塔姆·达鲁曼、凯尔·希佩、亚历山大·布雷斯、萨姆·福尔曼、韦诺·哈坦帕、瓦鲁尼·K·萨斯特里、郑辉霍、洛根·沃德、塞尔维什·穆拉利达兰、阿奇特·瓦桑、巴拉特·卡莱、卡拉·M·曼恩、马恒、程云轩、尤莉安娜·萨莫拉、刘盛超、肖朝伟、埃马尼·穆拉利、汤姆·吉布斯、马希达尔·塔蒂内尼、迪帕克·坎奇、杰罗姆·米切尔、山田浩一、玛丽亚·加尔萨兰、迈克尔·E·帕普卡、伊恩·福斯特、里克·史蒂文斯、阿尼玛·阿南德库马尔、文卡特拉姆·维什瓦纳特、阿尔温德·拉马纳坦国际高性能计算、网络、存储与分析大会 SC. IEEE计算机协会，2024年

基于评分辅助的蛋白质生成式探索（SAGE-Prot）：一种通过迭代序列生成与评估实现多目标蛋白质优化的框架 林浩哲、李健浩、卢京泰 arXiv:2505.01277 • 代码

人工智能与第一性原理方法在蛋白质重新设计中的应用：一场权宜之计？ 达米亚诺·钱费罗尼、大卫·比萨拉加、安娜·玛丽亚·费尔南德斯-埃斯卡米利亚、伊格纳西奥·菲塔、拉赫玛·哈姆达尼、劳尔·雷切、哈维尔·德尔加多、路易斯·塞拉诺 bioRxiv 2025.05.12.653318/Protein Science • 补充材料

基于似然的蛋白质语言模型微调用于少样本适应度预测和设计 亚历克斯·霍金斯-胡克、希卡·苏拉纳、杰克·西蒙斯、雅库布·克梅茨、奥利弗·本特、保罗·达克沃思 bioRxiv 2024.05.28.596156

ProSpero：超越野生型邻域的稳健蛋白质设计主动学习 米哈尔·克米奇基维奇、文森特·福图因、埃娃·什丘雷克 arXiv:2505.22494

使用掩码蛋白质语言模型进行蛋白质序列设计的启发式多位点优化 王丽娟、王宇泽、邱晨、肖立伟、刘宪亮、陈俊杰 bioRxiv 2025.07.31.668012

利用蛋白质语言模型设计不稳定型RNase A 加布里埃尔·翁基亚特·怀伊、孔思恩、冯天荣、吴益祺、萧温斯顿 ACS Synthetic Biology (2025)

零样本深度学习结合多目标优化提升玉米赤霉烯酮水解酶和木聚糖酶的热稳定性 吴凡、吴睿、陈玲慧、陈权、刘海燕 New Biotechnology (2026)

用于功能发现与设计的蛋白质词离散语言 郭正阳、王梓、柴永平、许凯明、李明、李伟、欧广硕 bioRxiv 2026.02.14.705947 • 代码

预训练嵌入在机器引导蛋白质设计中的极限探索：以预测AAV载体活性为例 安娜·F·罗德里格斯、卢卡斯·费拉兹、劳拉·巴尔比、佩德罗·吉埃斯特拉·科托维奥、卡蒂娅·佩斯基塔 arXiv:2602.14828 • 代码

深度学习引导的进化优化用于蛋白质设计 埃里克·哈特曼、唐迪、约翰·马尔姆斯特伦 arXiv:2603.02753

基于本体论强化迭代的功能性蛋白质设计与增强 毕亨、秦晨晨、赵宇、黄龙凯、吴子涵、王芳、吴范迪、杨帆和姚建华 Nat Commun (2026) • 代码

CombinGym：一个用于机器学习辅助设计组合蛋白变体的基准平台 陈勇灿、傅利浩、陆旭超、李文卓、高远、王一博、阮志成、宋彤 bioRxiv 2026.03.24.714074 • 代码 • 补充材料 • 网站

7.2 蛋白质语言模型（pLM）与表示学习

更详细的蛋白质表示学习列表： Lirong Wu 的 awesome-protein-representation-learning

基于序列的深度表示学习实现统一的理性蛋白质工程 Ethan C. Alley、Grigory Khimulya、Surojit Biswas、Mohammed AlQuraishi 和 George M. Church 《自然方法》16.12 (2019)

通过几何预训练进行蛋白质结构表示学习 Zuobai Zhang、Minghao Xu、Arian Jamasb、Vijil Chenthamarakshan、Aurelie Lozano、Payel Das、Jian Tang arXiv • 2022年1月

利用蛋白质语言模型研究进化速度 Brian L. Hie、Kevin K. Yang 和 Peter S. Kim bioRxiv

借助语言学推进蛋白质语言模型：提升可解释性的路线图 Mai Ha Vu、Rahmad Akbar、Philippe A. Robert、Bartlomiej Swiatczak、Victor Greiff、Geir Kjetil Sandve、Dag Trygve Truslew Haug arXiv:2207.00982

利用自监督学习破译抗体的语言 Jinwoo Leem、Laura S. Mitchell、James H.R. Farmery、Justin Barton、Jacob D. Galson Patterns (2022): 100513 • 代码

关于抗体的语言模型预训练 匿名（论文处于双盲评审中） ICLR 2023 • 补充材料

用于药物发现的抗体表示学习 Lin Li、Esther Gupta、John Spaeth、Leslie Shing、Tristan Bepler、Rajmonda Sulo Caceres arXiv:2210.02881

通过序列与结构的深度耦合学习完整的蛋白质表示 Bozhen Hu、Cheng Tan、Jun Xia、Jiangbin Zheng、Yufei Huang、Lirong Wu、Yue Liu、Yongjie Xu、Stan Z. Li bioRxiv 2023.07.05.547769

利用祖先序列重建进行蛋白质表示学习 D. S. Matthews、M. A. Spence、A. C. Mater、J. Nichols、S. B. Pulsford、M. Sandhu、J. A. Kaczmarski、C. M. Miton、N. Tokuriki、C. J. Jackson bioRxiv 2023.12.20.572683 • 代码

蛋白质语言模型因生命树上序列采样的不均衡而存在偏差 Frances Ding、Jacob Steinhardt bioRxiv 2024.03.07.584001

InstructPLM：使蛋白质语言模型遵循蛋白质结构指令 Jiezhong Qiu、Junde Xu、Jie Hu、Hanqun Cao、Liya Hou、Zijun Gao、Xinyi Zhou、Anni Li、Xiujuan Li、Bin Cui、Fei Yang、Shuang Peng、Ning Sun、Fangyu Wang、Aimin Pan、Jie Tang、Jieping Ye、Junyang Lin、Jin Tang、Xingxu Huang、Pheng Ann Heng、Guangyong Chen bioRxiv 2024.04.17.589642

7.3 分子设计模型

与蛋白质设计中的“功能-骨架-序列”范式不同，基于该范式的深度学习分子设计主要从三个层次展开：原子级、片段级和反应级。这些方法可以分为梯度优化和优化采样（无梯度）两类。点击此处查看详细综述为了更好地了解多样化的生成模型在设计中的应用，以下推荐的最新分子设计模型或许对蛋白质设计有所启发，甚至可以直接迁移应用。更多论文列表如下：

CondaPereira 的 GitHub 仓库：Essay_For_Molecular_Generation。

AspirinCode 的：papers-for-molecular-design-using-DL、awesome-AI4MolConformation-MD

Alex Morehead 的：awesome-molecular-generation

7.3.1 梯度优化

用于分子优化的可微骨架树 Fu, T., Gao, W., Xiao, C., Yasonik, J., Coley, C. W., & Sun, J arXiv 预印本 arXiv:2109.10469 • 代码 • 9月21日

等变能量引导的随机微分方程用于逆向分子设计 Fan Bao, Min Zhao, Zhongkai Hao, Peiyao Li, Chongxuan Li, Jun Zhu arXiv:2209.15408

基于配体的药物设计中，等变形状条件下的三维分子生成 Keir Adams, Connor W. Coley arXiv:2210.04893 • 代码

基于结构的药物设计与等变扩散模型 Arne Schneuing, Yuanqi Du, Charles Harris, Arian Jamasb, Ilia Igashov, Weitao Du, Tom Blundell, Pietro Lió, Carla Gomes, Max Welling, Michael Bronstein, Bruno Correia NeurIPS 2022/arXiv:2210.13695 • 代码

7.3.2 优化采样

针对靶蛋白结合的三维分子生成 Meng Liu, Youzhi Luo, Kanji Uchino, Koji Maruhashi, Shuiwang Ji 国际机器学习大会第39次会议 (2022) • GraphBP

Pocket2Mol：基于三维蛋白质口袋的高效分子采样 Peng, Xingang, 等国际机器学习大会第39次会议 (2022) • 代码

强化遗传算法用于结构基药物设计 Fu, Tianfan, 等 arXiv 预印本 arXiv:2211.16508 (2022)/ICML22 • 代码 • 网站

带有结构基元的靶蛋白结合分子生成 Zhang, Zaixi, 等国际表征学习大会第11次会议 (2023) • 代码

面向靶标的三维等变扩散及亲和力预测 Guan, Jiaqi, 等国际表征学习大会第11次会议 (2023) • 代码

7.4 未分类

针对可溶性和跨膜蛋白的表位特异性抗体从头设计，具有高特异性、可开发性和功能性 Nabla Bio 预印本 • 博客 • 新闻 • 商业化

JAM-2：完全计算驱动的药物类抗体设计，成功率极高 Nabla Bio 白皮书

Chai-2：在24孔板中实现零样本抗体发现 Chai Discovery 团队
技术报告 • 新闻 • 商业化

以原子精度针对挑战性靶点的药物类抗体设计 Chai Discovery 团队
技术报告 • 新闻

Latent-X：原子级别前沿模型，用于从头设计蛋白质结合剂 Latent Labs 团队
技术报告 • 官网 • 商业化

使用 Latent-X2 设计的低免疫原性人源抗体 Latent Labs 团队
技术报告 • 官网 • 商业化

Latent-Y：实验室验证的自主型从头药物设计代理 Latent Labs 团队
技术报告 • 官网 • 商业化

papers_for_protein_design_using_DL 快速上手指南

papers_for_protein_design_using_DL 并非一个可执行的软件工具或代码库，而是一个** curated（精选）的学术论文与资源列表**。它旨在为使用深度学习进行蛋白质设计的研究人员和开发者提供最新的文献索引、基准测试（Benchmarks）和数据集链接。

因此，本指南将指导你如何获取该资源列表，并如何利用其中链接的具体项目（如代码库、数据集）开始你的研究。

1. 环境准备

由于本项目主要是文档和资源索引，无需特定的运行时环境。但为了运行列表中链接的具体论文代码（通常基于 PyTorch 或 TensorFlow），建议准备以下基础环境：

操作系统: Linux (推荐 Ubuntu 20.04+) 或 macOS。Windows 用户建议使用 WSL2。
Python: 3.8 或更高版本。
包管理工具: pip 或 conda (推荐 Miniconda)。
GPU 支持: 大多数深度学习蛋白质设计模型需要 NVIDIA GPU，请确保已安装对应的 CUDA 驱动和 Toolkit。
Git: 用于克隆仓库及列表中提到的其他代码库。

2. 获取资源列表

你可以通过克隆 GitHub 仓库来获取最新的论文列表和本地浏览权限。

克隆仓库

git clone https://github.com/Peldom/papers_for_protein_design_using_DL.git
cd papers_for_protein_design_using_DL

国内加速方案

如果访问 GitHub 速度较慢，可以使用国内镜像源或加速服务进行克隆（以 Gitee 镜像为例，若存在）：

# 注意：需确认是否有同步的 Gitee 镜像，若无则直接使用上方官方命令
# 示例（假设存在镜像）：
# git clone https://gitee.com/mirror/papers_for_protein_design_using_DL.git

注：若无私有镜像，建议在终端配置代理或使用 GitHub 加速工具下载。

3. 基本使用与工作流

本项目的核心用法是查阅分类目录，找到你感兴趣的研究方向（如“抗体设计”、“扩散模型”等），然后点击链接跳转到具体的论文页面或代码仓库。

步骤一：浏览分类目录

打开本地克隆的 README.md 文件，或直接访问 GitHub 页面。资源按以下逻辑分类：

0) Benchmarks and datasets: 查找序列/结构数据集和评估基准（如 FLIP, ProteinGym）。
1) Reviews and surveys: 阅读综述，了解领域现状。
2) - 6) Design Paradigms: 根据技术路线查找论文，例如：
- Diffusion-based: 基于扩散模型的设计。
- Transformer-based: 基于 Transformer 架构的设计。
- Function to Structure: 从功能到结构的生成任务。

步骤二：运行具体项目示例

假设你在列表中对 "ProteinGym" (大规模蛋白质设计基准) 感兴趣，以下是基于该项目链接的典型启动流程：

获取项目代码 (从列表中的 code 链接获取):

git clone https://github.com/OATML-Markslab/ProteinGym.git
cd ProteinGym

创建虚拟环境并安装依赖:

conda create -n proteingym python=3.9
conda activate proteingym

# 推荐使用国内镜像源加速安装 (如清华源)
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

运行简单示例 (参考该项目具体的 README):

# 示例：运行一个简单的基准测试脚本
python run_benchmark.py --task fitness_prediction --model esm1b

步骤三：利用中文社区资源

该项目 README 特别提到了相关的中文笔记专栏，适合中国开发者深入理解论文细节：

知乎专栏: 访问项目中提到的 Zhihu Column 查看论文的中文解读和笔记。
RosettAI: 获取更多关于 Rosetta 和相关算法的建议笔记。

提示: 此仓库会每周更新（最新更新时间见 README 顶部），请定期执行 git pull 以获取最新的论文列表。

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

★ 349.3k|★★★☆☆|5天前

Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|6天前

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 150k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 108.3k|★★☆☆☆|昨天

开发框架图像Agent

gemini-cli

gemini-cli 是一款由谷歌推出的开源 AI 命令行工具，它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言，它提供了一条从输入提示词到获取模型响应的最短路径，无需切换窗口即可享受智能辅助。这款工具主要解决了开发过程中频繁上下文切换的痛点，让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用，还是执行复杂的 Git 操作，gemini-cli 都能通过自然语言指令高效处理。它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口，具备出色的逻辑推理能力；内置 Google 搜索、文件操作及 Shell 命令执行等实用工具；更独特的是，它支持 MCP（模型上下文协议），允许用户灵活扩展自定义集成，连接如图像生成等外部能力。此外，个人谷歌账号即可享受免费的额度支持，且项目基于 Apache 2.0 协议完全开源，是提升终端工作效率的理想助手。

★ 100.8k|★★☆☆☆|昨天

插件Agent图像

markitdown

MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器

★ 93.4k|★★☆☆☆|4天前

插件开发框架