[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-yangkky--Machine-learning-for-proteins":3,"tool-yangkky--Machine-learning-for-proteins":65},[4,23,32,40,49,57],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":22},2268,"ML-For-Beginners","microsoft\u002FML-For-Beginners","ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。\n\n无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。",85013,2,"2026-04-06T11:09:19",[13,14,15,16,17,18,19,20,21],"图像","数据工具","视频","插件","Agent","其他","语言模型","开发框架","音频","ready",{"id":24,"name":25,"github_repo":26,"description_zh":27,"stars":28,"difficulty_score":29,"last_commit_at":30,"category_tags":31,"status":22},3128,"ragflow","infiniflow\u002Fragflow","RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。\n\n在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。\n\n这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。",77062,3,"2026-04-04T04:44:48",[17,13,20,19,18],{"id":33,"name":34,"github_repo":35,"description_zh":36,"stars":37,"difficulty_score":29,"last_commit_at":38,"category_tags":39,"status":22},519,"PaddleOCR","PaddlePaddle\u002FPaddleOCR","PaddleOCR 是一款基于百度飞桨框架开发的高性能开源光学字符识别工具包。它的核心能力是将图片、PDF 等文档中的文字提取出来，转换成计算机可读取的结构化数据，让机器真正“看懂”图文内容。\n\n面对海量纸质或电子文档，PaddleOCR 解决了人工录入效率低、数字化成本高的问题。尤其在人工智能领域，它扮演着连接图像与大型语言模型（LLM）的桥梁角色，能将视觉信息直接转化为文本输入，助力智能问答、文档分析等应用场景落地。\n\nPaddleOCR 适合开发者、算法研究人员以及有文档自动化需求的普通用户。其技术优势十分明显：不仅支持全球 100 多种语言的识别，还能在 Windows、Linux、macOS 等多个系统上运行，并灵活适配 CPU、GPU、NPU 等各类硬件。作为一个轻量级且社区活跃的开源项目，PaddleOCR 既能满足快速集成的需求，也能支撑前沿的视觉语言研究，是处理文字识别任务的理想选择。",75097,"2026-04-07T22:51:14",[19,13,20,18],{"id":41,"name":42,"github_repo":43,"description_zh":44,"stars":45,"difficulty_score":46,"last_commit_at":47,"category_tags":48,"status":22},3215,"awesome-machine-learning","josephmisiti\u002Fawesome-machine-learning","awesome-machine-learning 是一份精心整理的机器学习资源清单，汇集了全球优秀的机器学习框架、库和软件工具。面对机器学习领域技术迭代快、资源分散且难以甄选的痛点，这份清单按编程语言（如 Python、C++、Go 等）和应用场景（如计算机视觉、自然语言处理、深度学习等）进行了系统化分类，帮助使用者快速定位高质量项目。\n\n它特别适合开发者、数据科学家及研究人员使用。无论是初学者寻找入门库，还是资深工程师对比不同语言的技术选型，都能从中获得极具价值的参考。此外，清单还延伸提供了免费书籍、在线课程、行业会议、技术博客及线下聚会等丰富资源，构建了从学习到实践的全链路支持体系。\n\n其独特亮点在于严格的维护标准：明确标记已停止维护或长期未更新的项目，确保推荐内容的时效性与可靠性。作为机器学习领域的“导航图”，awesome-machine-learning 以开源协作的方式持续更新，旨在降低技术探索门槛，让每一位从业者都能高效地站在巨人的肩膀上创新。",72149,1,"2026-04-03T21:50:24",[20,18],{"id":50,"name":51,"github_repo":52,"description_zh":53,"stars":54,"difficulty_score":46,"last_commit_at":55,"category_tags":56,"status":22},2234,"scikit-learn","scikit-learn\u002Fscikit-learn","scikit-learn 是一个基于 Python 构建的开源机器学习库，依托于 SciPy、NumPy 等科学计算生态，旨在让机器学习变得简单高效。它提供了一套统一且简洁的接口，涵盖了从数据预处理、特征工程到模型训练、评估及选择的全流程工具，内置了包括线性回归、支持向量机、随机森林、聚类等在内的丰富经典算法。\n\n对于希望快速验证想法或构建原型的数据科学家、研究人员以及 Python 开发者而言，scikit-learn 是不可或缺的基础设施。它有效解决了机器学习入门门槛高、算法实现复杂以及不同模型间调用方式不统一的痛点，让用户无需重复造轮子，只需几行代码即可调用成熟的算法解决分类、回归、聚类等实际问题。\n\n其核心技术亮点在于高度一致的 API 设计风格，所有估算器（Estimator）均遵循相同的调用逻辑，极大地降低了学习成本并提升了代码的可读性与可维护性。此外，它还提供了强大的模型选择与评估工具，如交叉验证和网格搜索，帮助用户系统地优化模型性能。作为一个由全球志愿者共同维护的成熟项目，scikit-learn 以其稳定性、详尽的文档和活跃的社区支持，成为连接理论学习与工业级应用的最",65697,"2026-04-07T23:34:58",[20,18,14],{"id":58,"name":59,"github_repo":60,"description_zh":61,"stars":62,"difficulty_score":10,"last_commit_at":63,"category_tags":64,"status":22},3364,"keras","keras-team\u002Fkeras","Keras 是一个专为人类设计的深度学习框架，旨在让构建和训练神经网络变得简单直观。它解决了开发者在不同深度学习后端之间切换困难、模型开发效率低以及难以兼顾调试便捷性与运行性能的痛点。\n\n无论是刚入门的学生、专注算法的研究人员，还是需要快速落地产品的工程师，都能通过 Keras 轻松上手。它支持计算机视觉、自然语言处理、音频分析及时间序列预测等多种任务。\n\nKeras 3 的核心亮点在于其独特的“多后端”架构。用户只需编写一套代码，即可灵活选择 TensorFlow、JAX、PyTorch 或 OpenVINO 作为底层运行引擎。这一特性不仅保留了 Keras 一贯的高层易用性，还允许开发者根据需求自由选择：利用 JAX 或 PyTorch 的即时执行模式进行高效调试，或切换至速度最快的后端以获得最高 350% 的性能提升。此外，Keras 具备强大的扩展能力，能无缝从本地笔记本电脑扩展至大规模 GPU 或 TPU 集群，是连接原型开发与生产部署的理想桥梁。",63927,"2026-04-04T15:24:37",[20,14,18],{"id":66,"github_repo":67,"name":68,"description_en":69,"description_zh":70,"ai_summary_zh":70,"readme_en":71,"readme_zh":72,"quickstart_zh":73,"use_case_zh":74,"hero_image_url":75,"owner_login":76,"owner_name":77,"owner_avatar_url":78,"owner_bio":79,"owner_company":79,"owner_location":80,"owner_email":79,"owner_twitter":81,"owner_website":82,"owner_url":83,"languages":79,"stars":84,"forks":85,"last_commit_at":86,"license":87,"difficulty_score":46,"env_os":88,"env_gpu":89,"env_ram":89,"env_deps":90,"category_tags":93,"github_topics":79,"view_count":10,"oss_zip_url":79,"oss_zip_packed_at":79,"status":22,"created_at":94,"updated_at":95,"faqs":96,"releases":136},5442,"yangkky\u002FMachine-learning-for-proteins","Machine-learning-for-proteins","Listing of papers about machine learning for proteins. ","Machine-learning-for-proteins 是一个专注于蛋白质领域机器学习研究的开源论文清单。鉴于该学科发展迅猛，传统静态综述难以及时覆盖最新成果，该项目旨在提供一个动态更新、社区协作的知识库，系统梳理从基础理论到工程应用的前沿文献。\n\n它有效解决了研究人员在海量学术资源中难以快速定位高质量论文的痛点。通过精细的分类体系，内容涵盖工具与数据集、定向进化、表示学习、生成模型、生物物理特性预测、结构序列互推以及分子相互作用等多个核心方向。所有条目均按时间倒序排列，确保用户能第一时间获取最新突破，且大部分条目附带直接链接，极大提升了文献检索效率。\n\n这一资源特别适合从事计算生物学、蛋白质工程及 AI for Science 领域的科研人员、算法开发者及相关专业的学生使用。其独特亮点在于采用了开放的协作模式，鼓励全球学者共同贡献与修正，不仅打破了单一团队的知识局限，更构建了一个持续生长的学术生态。无论是希望了解行业全景的初学者，还是深耕特定细分方向的专家，都能从中获得极具价值的参考指引，是探索蛋白质智能设计不可或缺的案头工具。","## Papers on machine learning for proteins\n\n### Background\n\nWe recently released a [review](https:\u002F\u002Farxiv.org\u002Fabs\u002F1811.10775) of machine learning methods in protein engineering, but the field changes so fast and there are so many new papers that any static document will inevitably be missing important work. This format also allows us to broaden the scope beyond engineering-specific applications. We hope that this will be a useful resource for people interested in the field.\n\nTo the best of our knowledge, this is the first public, collaborative list of machine learning papers on protein applications. We try to classify papers based on a combination of their applications and model type. If you have suggestions for other papers or categories, please make a pull request or issue!\n\n### Format\n\nWithin each category, papers are listed in reverse chronological order (newest first). Where possible, a link should be provided.\n\n### Categories\n\n[Reviews](#reviews)  \n[Tools and datasets](#tools-and-datasets)  \n[Machine-learning guided directed evolution](#machine-learning-guided-directed-evolution)  \n[Representation learning](#representation-learning)  \n[Unsupervised variant prediction](#unsupervised-variant-prediction)  \n[Generative models](#generative-models)  \n[Biophysics](#biophysics)  \n[Predicting stability](#predicting-stability)  \n[Predicting structure from sequence](#predicting-structure-from-sequence)  \n[Predicting sequence from structure](#predicting-sequence-from-structure)  \n[Classification, annotation, search, and alignments](#classification-annotation-search-and-alignments)  \n[Predicting interactions with other molecules](#predicting-interactions-with-other-molecules)  \n[Other supervised learning](#other-supervised-learning)\n\n### Reviews\n\n**Machine Learning for Protein Engineering.**  \nKadina E. Johnston, Clara Fannjiang, Bruce J. Wittmann, Brian L. Hie, Kevin K. Yang & Zachary Wu.  \n*Machine Learning in Molecular Sciences, October 2023.*  \n[[10.1007\u002F978-3-031-37196-7_9](https:\u002F\u002Fdoi.org\u002F10.1007\u002F978-3-031-37196-7_9)]\n\n**Harnessing Generative AI to Decode Enzyme Catalysis and Evolution for Enhanced Engineering.**  \nWen Jun Xie, Arieh Warshel.  \n*Preprint, October 2023.*  \n[[10.1101\u002F2023.10.10.561808](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.10.10.561808)]\n\n**Machine Learning-Guided Protein Engineering.**  \nPetr Kouba, Pavel Kohout, Faraneh Haddadi, Anton Bushuiev, Raman Samusevich, Jiri Sedlar, Jiri Damborsky, Tomas Pluskal, Josef Sivic, and Stanislav Mazurenko.  \n*ACS Catalysis, October 2023.*  \n[[10.1021\u002Facscatal.3c02743](https:\u002F\u002Fdoi.org\u002F10.1021\u002Facscatal.3c02743)]\n\n**Generative artificial intelligence for de novo protein design.**  \nAdam Winnifrith, Carlos Outeiral, Brian Hie.  \n*Preprint, October 2023.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2310.09685)]\n\n**Growing ecosystem of deep learning methods for modeling protein.**  \nJulia R. Rogers, Gergő Nikolényi, Mohammed AlQuraishi.  \n*Preprint, October 2023.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2310.06725)]\n\n**Exploring the Protein Sequence Space with Global Generative Models.**  \nSergio Romero-Romero, Sebastian Lindner, Noelia Ferruz.  \n*Preprint, May 2023.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2305.01941)]\n\n**Diffusion Models in Bioinformatics: A New Wave of Deep Learning Revolution in Action.**  \nZhiye Guo, Jian Liu, Yanli Wang, Mengrui Chen, Duolin Wang, Dong Xu, Jianlin Cheng.  \n*Preprint, February 2023.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2302.10907)]\n\n**Learning Epistasis and Residue Coevolution Patterns: Current Trends and Future Perspectives for Advancing Enzyme Engineering.**  \nMarcel Wittmund, Frederic Cadet and Mehdi D. Davari.  \n*ACS Catalysis, November 2022.*  \n[[10.1021\u002Facscatal.2c01426](https:\u002F\u002Fdoi.org\u002F10.1021\u002Facscatal.2c01426)]\n\n**From sequence to function through structure: deep learning for protein design.**  \nNoelia Ferruz, Michael Heinzinger, Mehmet Akdel, Alexander Goncearenco, Luca Naef, Christian Dallago.  \n*Preprint, September 2022.*  \n[[10.1101\u002F2022.08.31.505981](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.08.31.505981)]\n\n**Computational protein design with evolutionary-based and physics-inspired modeling: current and future synergies.**  \nCyril Malbranke, David Bikard, Simona Cocco, Rémi Monasson, Jérôme Tubiana.  \n*Preprint, August 2022.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2208.13616)]\n\n**Deep learning approaches for conformational flexibility and switching properties in protein design.**  \nLucas S. P. Rudde, Mahdi Hijazi, Patrick Barth.  \n*Front. Mol. Biosci., August 2022.*  \n[[10.3389\u002Ffmolb.2022.928534](https:\u002F\u002Fdoi.org\u002F10.3389\u002Ffmolb.2022.928534)]\n\n**Controllable protein design with language models.**  \nNoelia Ferruz, Birte Höker.  \n*Nature Machine Intelligence, June 2022.*  \n[[10.1038\u002Fs42256-022-00499-z](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs42256-022-00499-z)]\n\n**The road to fully programmable protein catalysis.**  \nSarah L. Lovelock, Rebecca Crawshaw, Sophie Basler, Colin Levy, David Baker, Donald Hilvert, Anthony P. Green.  \n*Nature, June 2022.*  \n[[10.1038\u002Fs41586-022-04456-z](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41586-022-04456-z)]\n\n**Efficient Exploration of Sequence Space by Sequence-Guided Protein Engineering and Design.**  \nBen E. Clifton, Dan Kozome, and Paola Laurino.  \n*Biochemistry, March 2022.*  \n[[10.1021\u002Facs.biochem.1c00757](https:\u002F\u002Fdoi.org\u002F10.1021\u002Facs.biochem.1c00757)]\n\n**Learning functional properties of proteins with language models.**  \nSerbulent Unsal, Heval Atas, Muammer Albayrak, Kemal Turhan, Aybar C. Acar & Tunca Doğan.  \n*Nature Machine Intelligence, March 2022.*  \n[[10.1038\u002Fs42256-022-00457-9](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs42256-022-00457-9)]\n\n**Applications of artificial intelligence to enzyme and pathway design for metabolic engineering.**  \nWoo Dae Jang, Gi Bae Kim, Yeji Kim, Sang Yup Lee.  \n*Current Opinion in Biotechnology, February 2022.*  \n[[10.1016\u002Fj.copbio.2021.07.024](https:\u002F\u002Fdoi.org\u002F10.1016\u002Fj.copbio.2021.07.024)]\n\n**Adaptive machine learning for protein engineering.**  \nBrian L. Hie, Kevin K. Yang.  \n*Current Opinion in Structural Biology, February 2022.*   \n[[10.1016\u002Fj.sbi.2021.11.002](https:\u002F\u002Fdoi.org\u002F10.1016\u002Fj.sbi.2021.11.002)]\n\n**Protein sequence design with deep generative models.**  \nZachary Wu, Kadina E. Johnston, Frances H. Arnold, Kevin K. Yang.  \n*Current Opinion in Chemical Biology, December 2021*.  \n[[10.1016\u002Fj.cbpa.2021.04.004](https:\u002F\u002Fdoi.org\u002F10.1016\u002Fj.cbpa.2021.04.004)]\n\n**AI challenges for predicting the impact of mutations on protein stability.**  \nFabrizio Pucci, Martin Schwersensky, Marianne Rooman.  \n*Preprint, November 2021.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2111.04208v1)]\n\n**Advances in machine learning for directed evolution.** \nBruce J Wittmann, Kadina E Johnston, Zachary Wu, Frances H Arnold.  \n*Current Opinion in Structural Biology, August 2021.*  \n[10.1016\u002Fj.sbi.2021.01.008](https:\u002F\u002Fdoi.org\u002F10.1016\u002Fj.sbi.2021.01.008)]\n\n**A Brief Review of Machine Learning Techniques for Protein Phosphorylation Sites Prediction.**  \nFarzaneh Esmaili, Mahdi Pourmirzaei, Shahin Ramazi, Elham Yavari.\n*Preprint, August 2021.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2108.04951v1)]\n\n**Learning the protein language: Evolution, structure, and function.**  \nTristan Bepler, Bonnie Berger.  \n*Cell Systems, June 2021.*  \n[[10.1016\u002Fj.cels.2021.05.017](https:\u002F\u002Fdoi.org\u002F10.1016\u002Fj.cels.2021.05.017)]\n\n**Representation learning applications in biological sequence analysis.**  \nHitoshi Iuchi, Taro Matsutani, Keisuke Yamada, Natsuki Iwano, Shunsuke Sumi, Shion Hosoda, Shitao Zhao, Tsukasa Fukunaga, Michiaki Hamada.  \n*Computational and Structural Biotechnology Journal, May 2021.*  \n[[10.1016\u002Fj.csbj.2021.05.039](https:\u002F\u002Fdoi.org\u002F10.1016\u002Fj.csbj.2021.05.039)]\n\n**Data-driven computational protein design.**  \nVincent Frappier, Amy E. Keating.  \n*Current Opinion in Structural Biology, May 2021.*  \n[\u002F10.1016\u002Fj.sbi.2021.03.009](https:\u002F\u002Fdoi.org\u002F10.1016\u002Fj.sbi.2021.03.009)]\n\n**Machine learning in protein structure prediction.**  \nMohammed AlQuraishi.  \n*Current Opinion in Chemical Biology, May 2021.*  \n[[10.1016\u002Fj.cbpa.2021.04.005](https:\u002F\u002Fdoi.org\u002F10.1016\u002Fj.cbpa.2021.04.005)]\n\n**Protein sequence-to-structure learning: Is this the end(-to-end revolution)?.**  \nElodie Laine, Stephan Eismann, Arne Elofsson, Sergei Grudinin.  \n*Preprint, May 2021.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2105.07407v1)]\n\n**Revolutionizing enzyme engineering through artificial intelligence and machine learning.**  \nNitu Singh, Sunny Malik, Anvita Gupta, Kinshuk Raj Srivastava.  \n*Emerging topics in life sciences, April 2021.*  \n[[10.1042\u002FETLS20200257](https:\u002F\u002Fdoi.org\u002F10.1042\u002FETLS20200257)]\n\n**The language of proteins: NLP, machine learning & protein sequences.**  \nDan Ofer, Nadav Brandes, Michal Linial.  \n*Computational and Structural Biotechnology Journal, January 2021.*  \n[[10.1016\u002Fj.csbj.2021.03.022](https:\u002F\u002Fdoi.org\u002F10.1016\u002Fj.csbj.2021.03.022)]\n\n**Chapter Twelve - Machine learning-assisted enzyme engineering.**  \nNiklas E. Siedhoff, Ulrich Schwaneberg and Mehdi D. Davari.  \n*Methods in Enzymology, November 2020.*  \n[[10.1016\u002Fbs.mie.2020.05.005](https:\u002F\u002Fdoi.org\u002F10.1016\u002Fbs.mie.2020.05.005)]\n\n**Machine learning and AI-based approaches for bioactive ligand discovery and GPCR-ligand recognition.**  \nSebastian Raschka, Benjamin Kaufman.  \n*Preprint, January 2020.*  \n[[arXiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2001.06545v2)]\n\n**Machine Learning in Enzyme Engineering.**   \nStanislav Mazurenko, Zbynek Prokop, Jiri Damborsky.   \n*ACS Catalysis, December 2019.*   \n[[10.1021\u002Facscatal.9b04321](https:\u002F\u002Fdoi.org\u002F10.1021\u002Facscatal.9b04321)]  \n\n**Machine learning-guided directed evolution for protein engineering.**  \nKevin K. Yang, Zachary Wu, Frances H. Arnold.   \n*Nature Methods, July 2019.*   \n[[10.1038\u002Fs41592-019-0496-6](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41592-019-0496-6)]  \nPreprint available on [arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F1811.10775). \n\n**Evaluating Protein Transfer Learning with TAPE.**   \nRoshan Rao, Nicholas Bhattacharya, Neil Thomas, Yan Duan, Xi Chen, John Canny, Pieter Abbeel, Yun S. Song.   \n*Preprint, June 2019.*   \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F1906.08230)]\n\n**Can Machine Learning Revolutionize Directed Evolution of Selective Enzymes?**  \nGuangyue Li, Yijie Dong, Manfred T. Reetz.  \n*Advanced Synthesis & Catalysis, March 2019.*  \n[[10.1002\u002Fadsc.201900149](https:\u002F\u002Fdoi.org\u002F10.1002\u002Fadsc.201900149)]\n\n### Tools and datasets\n\n**Scaffold-Lab: Critical Evaluation and Ranking of Protein Backbone Generation Methods in A Unified Framework.**  \nZhuoqi Zheng, Bo Zhang, Bozitao Zhong, Kexin Liu, Zhengxin Li, Junjie Zhu, Jinyu Yu, Ting Wei, Hai-Feng Chen.  \n*Preprint, May 2024.*  \n[[10.1101\u002F2024.02.10.579743](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2024.02.10.579743)]\n\n**Computational Scoring and Experimental Evaluation of Enzymes Generated by Neural Networks.**  \nSean R. Johnson, Xiaozhi Fu, Sandra Viknander, Clara Goldin, Sarah Monaco, Aleksej Zelezniak, Kevin K. Yang.  \n*Nature Biotechnology, April 2024.*  \n[[10.1038\u002Fs41587-024-02214-2](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41587-024-02214-2)]\n\n**Deep indel mutagenesis reveals the impact of insertions and deletions on protein stability and function.**  \nMagdalena Topolska, Antoni Beltran, Ben Lehner.  \n*Preprint, October 2023.*  \n[[10.1101\u002F2023.10.06.561180](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.10.06.561180)]\n\n**OpenProteinSet: Training data for structural biology at scale.**  \nGustaf Ahdritz, Nazim Bouatta, Sachin Kadyan, Lukas Jarosch, Daniel Berenberg, Ian Fisk, Andrew M. Watkins, Stephen Ra, Richard Bonneau, Mohammed AlQuraishi.  \n*Preprint, August 2023.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2308.05326)]\n\n**Mega-scale experimental analysis of protein folding stability in biology and design.**  \nKotaro Tsuboyama, Justas Dauparas, Jonathan Chen, Elodie Laine, Yasser Mohseni Behbahani, Jonathan J. Weinstein, Niall M. Mangan, Sergey Ovchinnikov & Gabriel J. Rocklin.  \n*Nature, July 2023.*  \n[[10.1038\u002Fs41586-023-06328-6](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41586-023-06328-6)]\n\n**FLOP: Tasks for Fitness Landscapes Of Protein wildtypes.**  \nPeter Mørch Groth, Richard Michael, Jesper Salomon, Pengfei Tian, Wouter Boomsma.  \n*Preprint, June 2023.*  \n[[10.1101\u002F2023.06.21.545880](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.06.21.545880)]\n\n\n**PDBench: Evaluating Computational Methods for Protein-Sequence Design.**  \nLeonardo V Castorina, Rokas Petrenas, Kartic Subr, Christopher W Wood.  \n*Bioinformatics, January 2023.*  \n[[10.1093\u002Fbioinformatics\u002Fbtad027](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbtad027)]]\n\n\n**The energetic and allosteric landscape for KRAS inhibition.**  \nChenchun Weng, Andre J. Faure, Ben Lehner.  \n*Preprint, December 2022.*  \n[[10.1101\u002F2022.12.06.519122](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.12.06.519122)]\n\n**ManyFold: an efficient and flexible library for training and validating protein folding models.**  \nAmelia Villegas-Morcillo, Louis Robinson, Arthur Flajolet, Thomas D Barrett.  \n*Bioinformatics, December 2022.*  \n[[10.1093\u002Fbioinformatics\u002Fbtac773](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbtac773)]\n\n**Mega-scale experimental analysis of protein folding stability in biology and protein design.**  \nKotaro Tsuboyama, Justas Dauparas, Jonathan Chen, Elodie Laine, Yasser Mohseni Behbahani, Jonathan J. Weinstein, Niall M. Mangan, Sergey Ovchinnikov, Gabriel J. Rocklin.  \n*Preprint, December 2022.*  \n[[10.1101\u002F2022.12.06.519132](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.12.06.519132)]\n\n**Tuned Fitness Landscapes for Benchmarking Model-Guided Protein Design.**  \nNeil Thomas, Atish Agarwala, David Belanger, Yun S. Song, Lucy J. Colwell.  \n*Preprint, October 2022.*  \n[[10.1101\u002F2022.10.28.514293](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.10.28.514293)]\n\n**Deep mutational scanning and machine learning reveal structural and molecular rules governing allosteric hotspots in homologous proteins.**  \nMegan Leander, Zhuang Liu, Qiang Cui, Srivatsan Raman.  \n*Elife, October 2022.*  \n[[10.7554\u002FeLife.79932](https:\u002F\u002Fdoi.org\u002F10.7554\u002FeLife.79932)]\n\n**Randomized gates eliminate bias in sort-seq assays.**  \nBrian L. Trippe, Buwei Huang, Erika A. DeBenedictis, Brian Coventry, Nicholas Bhattacharya, Kevin K. Yang, David Baker, Lorin Crawford.  \n*Protein Science, August 2022.*   \n[[10.1002\u002Fpro.4401](https:\u002F\u002Fdoi.org\u002F10.1002\u002Fpro.4401)]\n\n**Uni-Fold: An Open-Source Platform for Developing Protein Folding Models beyond AlphaFold.**  \nZiyao Li, Xuyang Liu, Weijie Chen, Fan Shen, Hangrui Bi, Guolin Ke, Linfeng Zhang.  \n*Preprint, August 2022.*  \n[[10.1101\u002F2022.08.04.502811](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.08.04.502811)]\n\n**PEER: A Comprehensive and Multi-Task Benchmark for Protein Sequence Understanding.**  \nMinghao Xu, Zuobai Zhang, Jiarui Lu, Zhaocheng Zhu, Yangtian Zhang, Chang Ma, Runcheng Liu, Jian Tang.  \n*Preprint, June 2022.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2206.02096)]\n\n**FLIP: Benchmark tasks in fitness landscape inference for proteins.**  \nChristian Dallago, Jody Mou, Kadina E. Johnston, Bruce J. Wittmann, Nicholas Bhattacharya, Samuel Goldman, Ali Madani, Kevin K. Yang.  \n*NeurIPS 2021 Datasets and Benchmarks Track, December 2021.*  \n[[10.1101\u002F2021.11.09.467890](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.11.09.467890)]\n\n**evSeq: Cost-Effective Amplicon Sequencing of Every Variant in a Protein Library.**  \nBruce J. Wittmann, Kadina E. Johnston, Patrick J. Almhjell, Frances H. Arnold.  \n*Preprint, November 2021.*  \n[[10.1101\u002F2021.11.18.469179](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.11.18.469179)]\n\n**The immuneML ecosystem for machine learning analysis of adaptive immune receptor repertoires.**  \nMilena Pavlović, Lonneke Scheffer, Keshav Motwani, Chakravarthi Kanduri, Radmila Kompova, Nikolay Vazov, Knut Waagan, Fabian L. M. Bernal, Alexandre Almeida Costa, Brian Corrie, Rahmad Akbar, Ghadi S. Al Hajj, Gabriel Balaban, Todd M. Brusko, Maria Chernigovskaya, Scott Christley, Lindsay G. Cowell, Robert Frank, Ivar Grytten, Sveinung Gundersen, Ingrid Hobæk Haff, Eivind Hovig, Ping-Han Hsieh, Günter Klambauer, Marieke L. Kuijjer, Christin Lund-Andersen, Antonio Martini, Thomas Minotto, Johan Pensar, Knut Rand, Enrico Riccardi, Philippe A. Robert, Artur Rocha, Andrei Slabodkin, Igor Snapkov, Ludvig M. Sollid, Dmytro Titov, Cédric R. Weber, Michael Widrich, Gur Yaari, Victor Greiff & Geir Kjetil Sandve.  \n*Nature Machine Intelligence, November 2021.*  \n[[10.1038\u002Fs42256-021-00413-z](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs42256-021-00413-z)]\n\n**Learned embeddings from deep learning to visualize and predict protein sets.**  \nChristian Dallago, Konstantin Schütze, Michael Heinzinger, Tobias Olenyi, Maria Littmann, Amy X Lu, Kevin K Yang, Seonwoo Min, Sungroh Yoon, James T Morton, Burkhard Rost.  \n*Current Protocols, May 2021.*  \n[[10.1002\u002Fcpz1.113](https:\u002F\u002Fdoi.org\u002F10.1002\u002Fcpz1.113)]\n\n**Population-Based Black-Box Optimization for Biological Sequence Design.**  \nChristof Angermueller, David Belanger, Andreea Gane, Zelda Mariet, David Dohan, Kevin Murphy, Lucy Colwell, D Sculley.  \nICML, July 2020.  \n[[ICML](https:\u002F\u002Fproceedings.icml.cc\u002Fstatic\u002Fpaper_files\u002Ficml\u002F2020\u002F6338-Paper.pdf)]\n\n**Selene: a PyTorch-based deep learning library for sequence data.**  \nKathleen M. Chen, Evan M. Cofer, Jian Zhou, Olga G. Troyanskaya.  \n*Nature Methods, March 2019.*  \n[[10.1038\u002Fs41592-019-0360-8](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41592-019-0360-8)]\n\n### Machine-learning guided directed evolution\n\n**Enhanced Sequence-Activity Mapping and Evolution of Artificial Metalloenzymes by Active Learning.**  \nTobias Vornholt, Mojmír Mutný, Gregor W. Schmidt, Christian Schellhaas, Ryo Tachibana, Sven Panke, Thomas R. Ward, Andreas Krause*, and Markus Jeschek.  \n*ACS Central Science, May 2024.*  \n[[10.1021\u002Facscentsci.4c00258](https:\u002F\u002Fdoi.org\u002F10.1021\u002Facscentsci.4c00258)]\n\n**Machine Learning and Directed Evolution of Base Editing Enzymes.**  \nRamiro M. Perrotta, Svenja Vinke, Raphaël Ferreira, Michaël Moret, Ahmed Mahas, Anush Chiappino-Pepe, Lisa M. Riedmayr, Anna-Thérèse Mehra, Louisa S. Lehmann, George M. Church.  \n*Preprint, May 2024.*  \n[[10.1101\u002F2024.05.17.594556](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2024.05.17.594556)]\n\n**Aligning protein generative models with experimental fitness via Direct Preference Optimization.**  \nTalal Widatalla, Rafael Rafailov, Brian Hie.  \n*Preprint, May 2024.*  \n[[10.1101\u002F2024.05.20.595026](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2024.05.20.595026)]\n\n**Computational stabilization of a non-heme iron enzyme enables efficient evolution of new function.**  \nBrianne R. King, Kiera H. Sumida, Jessica L. Caruso, David Baker, Jesse G. Zalatan.  \n*Preprint, May 2024.*  \n[[10.1101\u002F2024.04.18.590141](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2024.04.18.590141)]\n\n**Microdroplet screening rapidly profiles a biocatalyst to enable its AI-assisted engineering.**  \nMaximilian Gantz, Simon V. Mathis, Friederike E. H. Nintzel, Paul J. Zurek, Tanja Knaus, Elie Patel, Daniel Boros, Friedrich-Maximilian Weberling, Matthew R. A. Kenneth, Oskar J. Klein, Elliot J. Medcalf, Jacob Moss, Michael Herger, Tomasz S. Kaminski, Francesco G. Mutti, Pietro Lio, Florian Hollfelder.  \n*Preprint, April 2024.*   \n[[10.1101\u002F2024.04.08.588565](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2024.04.08.588565)]\n\n**Automated in vivo enzyme engineering accelerates biocatalyst optimization.**  \nEnrico Orsi, Lennart Schada von Borzyskowski, Stephan Noack, Pablo I. Nikel & Steffen N. Lindner.  \n*Nature Communications, April 2024.*  \n[[10.1038\u002Fs41467-024-46574-4](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41467-024-46574-4)]\n\n**Engineering highly active and diverse nuclease enzymes by combining machine learning and ultra-high-throughput screening.**  \nNeil Thomas, David Belanger, Chenling Xu, Hanson Lee, Kathleen Hirano, Kosuke Iwai, Vanja Polic, Kendra D Nyberg, Kevin Hoff, Lucas Frenz, Charlie A Emrich, Jun W Kim, Mariya Chavarha, Abi Ramanan, Jeremy J Agresti, Lucy J Colwell.  \n*Preprint, April 2024.*  \n[[10.1101\u002F2024.03.21.585615](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2024.03.21.585615)]\n\n**Interpretable and explainable predictive machine learning models for data-driven protein engineering.**  \nDavid Medina-Ortiz, Ashkan Khalifeh, Hoda Anvari-Kazemabad and Mehdi D. Davari.  \n*Preprint, March 2024.*  \n[[arxiv](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2024.02.18.580860)]\n\n**Machine Learning-Assisted Engineering of Light, Oxygen, Voltage Photoreceptor Adduct Lifetime.**  \nStefanie Hemmer, Niklas Erik Siedhoff, Sophia Werner, Gizem Ölçücü, Ulrich Schwaneberg, Karl-Erich Jaeger, Mehdi D. Davari, and Ulrich Krauss\n*JACS Au, November 2023.*  \n[[10.1021\u002Fjacsau.3c00440](https:\u002F\u002Fdoi.org\u002F10.1021\u002Fjacsau.3c00440)]\n\n**Biophysics-based protein language models for protein engineering.**  \nSam Gelman, Bryce Johnson, Chase Freschlin, Sameer D'Costa, Anthony Gitter, Philip A. Romero.  \n*Preprint, March 2024.*  \n[[10.1101\u002F2024.03.15.585128](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2024.03.15.585128)]\n\n**Improving protein expression, stability, and function with ProteinMPNN.**  \nKiera H. Sumida, Reyes Núñez-Franco, Indrek Kalvet, Samuel J. Pellock, Basile I. M. Wicky, Lukas F. Milles, Justas Dauparas, Jue Wang, Yakov Kipnis, Noel Jameson, Alex Kang, Joshmyn De La Cruz, Banumathi Sankaran, Asim K. Bera, Gonzalo Jiménez-Osés, David Baker.  \n*Preprint, October 2023.*  \n[[10.1101\u002F2023.10.03.560713](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.10.03.560713)]\n\n**Deploying synthetic coevolution and machine learning to engineer protein-protein interactions.**  \nAerin Yang, Kevin M Jude, Ben Lai, Mason Minot, Anna M Kocyla, Caleb R Glassman, Daisuke Nishimiya, Yoon Seok Kim, Sai T Reddy, Aly A Khan, K Christopher Garcia.  \n*Science, July 2023*  \n[[10.1126\u002Fscience.adh1720](https:\u002F\u002Fdoi.org\u002F10.1126\u002Fscience.adh1720)]\n\n**Bidirectional Learning for Offline Model-based Biological Sequence Design.**  \nCan Chen, Yingxue Zhang, Xue Liu, Mark Coates.  \n*Preprint, January 2023.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2301.02931)]\n\n**Plug & Play Directed Evolution of Proteins with Gradient-based Discrete MCMC.**  \nPatrick Emami, Aidan Perreault, Jeffrey Law, David Biagioni, Peter C. St. John.  \n*Preprint, December 2022.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2212.09925)]\n\n**Combinatorial assembly and design of enzymes.**  \nRosalie Lipsh-Sokolik, Olga Khersonsky, Sybrin P. Schröder, Casper de Boer, Shlomo-Yakir Hoch, Gideon J. Davies, Hermen S. Overkleeft, Sarel J. Fleishman.  \n*Preprint, December 2022.*  \n[[10.1101\u002F2022.09.17.508230](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.09.17.508230)]\n\n**Forecasting labels under distribution-shift for machine-guided sequence design.**  \nLauren Berk Wheelock, Stephen Malina, Jeffrey Gerold, Sam Sinai.  \n*Preprint, November 2022*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2211.10422)]\n\n**PropertyDAG: Multi-objective Bayesian optimization of partially ordered, mixed-variable properties for biological sequence design.**  \nJi Won Park, Samuel Stanton, Saeed Saremi, Andrew Watkins, Henri Dwyer, Vladimir Gligorijevic, Richard Bonneau, Stephen Ra, Kyunghyun Cho.  \n*Preprint, October 2022.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2210.04096)]\n\n**Designed active-site library reveals thousands of functional GFP variants.**  \nJonathan Yaacov Weinstein, Carlos Marti Gomez Aldaravi, Rosalie Lipsh-Sokolik, Shlomo Yakir Hoch, Demian Liebermann, Reinat Nevo, Haim Weissman, Ekaterina Petrovich-Kopitman, David Margulies, Dmitry Ivankov, David McCandlish, Sarel Jacob Fleishman.  \n*Preprint, October 2022.*  \n[[10.1101\u002F2022.10.11.511732](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.10.11.511732)]\n\n**Accelerated rational PROTAC design via deep learning and molecular simulations.**  \nShuangjia Zheng, Youhai Tan, Zhenyu Wang, Chengtao Li, Zhiqing Zhang, Xu Sang, Hongming Chen & Yuedong Yang.  \n*Nature Machine Intelligence, September 2022.*  \n[[10.1038\u002Fs42256-022-00527-y](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs42256-022-00527-y)]\n\n**Inferring protein fitness landscapes from laboratory evolution experiments.**  \nSameer D’Costa, Emily C. Hinds, Chase R. Freschlin, Hyebin Song, Philip A. Romero.  \n*Preprint, September 2022.*  \n[[10.1101\u002F2022.09.01.506224](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.09.01.506224)]\n\n**Antibody optimization enabled by artificial intelligence predictions of binding affinity and naturalness.**  \nSharrol Bachas, Goran Rakocevic, David Spencer, Anand V. Sastry, Robel Haile, John M. Sutton, George Kasun, Andrew Stachyra, Jahir M. Gutierrez, Edriss Yassine, Borka Medjo, Vincent Blay, Christa Kohnert, Jennifer T. Stanton, Alexander Brown, Nebojsa Tijanic, Cailen McCloskey, Rebecca Viazzo, Rebecca Consbruck, Hayley Carter, Simon Levine, Shaheed Abdulhaqq, Jacob Shaul, Abigail B. Ventura, Randal S. Olson, Engin Yapici, Joshua Meier, Sean McClain, Matthew Weinstock, Gregory Hannum, Ariel Schwartz, Miles Gander, Roberto Spreafico.  \n*Preprint, August 2022.*  \n[[10.1101\u002F2022.08.16.504181](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.08.16.504181)]\n\n**Co-optimization of therapeutic antibody affinity and specificity using machine learning models that generalize to novel mutational space.**  \nEmily K. Makowski, Patrick C. Kinnunen, Jie Huang, Lina Wu, Matthew D. Smith, Tiexin Wang, Alec A. Desai, Craig N. Streu, Yulei Zhang, Jennifer M. Zupancic, John S. Schardt, Jennifer J. Linderman, Peter M. Tessier.  \n*Nature communications, July 2022.*  \n[[10.1038\u002Fs41467-022-31457-3](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41467-022-31457-3)]\n\n**A hybrid model combining evolutionary probability and machine learning leverages data-driven protein engineering.**  \nAlexander-Maurice Illig, Niklas E. Siedhoff, Ulrich Schwaneberg and Mehdi D. Davari.  \n*Preprint, June 2022.*  \n[[arxiv](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.06.07.495081 )]\n\n**Heterogeneity of the GFP fitness landscape and data-driven protein design.**  \nLouisa Gonzalez Somermeyer, Aubin Fleiss, Alexander S Mishin, Nina G Bozhanova, Anna A Igolkina, Jens Meiler, Maria-Elisenda Alaball Pujol, Ekaterina V Putintseva, Karen S Sarkisyan.  \n*eLife, May 2022.*  \n[[10.7554\u002FeLife.75842](https:\u002F\u002Fdoi.org\u002F10.7554\u002FeLife.75842)]\n\n**De novo protein design by deep network hallucination.**  \nIvan Anishchenko, Samuel J. Pellock, Tamuka M. Chidyausiku, Theresa A. Ramelot, Sergey Ovchinnikov, Jingzhou Hao, Khushboo Bafna, Christoffer Norn, Alex Kang, Asim K. Bera, Frank DiMaio, Lauren Carter, Cameron M. Chow, Gaetano T. Montelione & David Baker.  \n*Nature, December 2021.*  \n[[10.1038\u002Fs41586-021-04184-w](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41586-021-04184-w)]\n\n**Informed training set design enables efficient machine learning-assisted directed protein evolution.**  \nBruce J. Wittmann, Yisong Yue, Frances H. Arnold.  \n*Cell Systems, November 2021.*  \n[[10.1016\u002Fj.cels.2021.07.008](https:\u002F\u002Fdoi.org\u002F10.1016\u002Fj.cels.2021.07.008)]\n\n\n\n**Machine learning-based library design improves packaging and diversity of adeno-associated virus (AAV) libraries.**  \nDanqing Zhu, David H. Brookes, Akosua Busia, Ana Carneiro, Clara Fannjiang, Galina Popova, David Shin, Edward F. Chang, Tomasz J. Nowakowski, Jennifer Listgarten, David. V. Schaffer.  \n*Preprint, November 2021.*  \n[[10.1101\u002F2021.11.02.467003](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.11.02.467003)]\n\n**Optimal Design of Stochastic DNA Synthesis Protocols based on Generative Sequence Models.**  \nEli N. Weinstein, Alan N. Amin, Will Grathwohl, Daniel Kassler, Jean Disset, Debora S. Marks.  \n*Preprint, October 2021.*  \n[[10.1101\u002F2021.10.28.466307](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.10.28.466307)]\n\n**Unifying Likelihood-free Inference with Black-box Sequence Design and Beyond.**  \nDinghuai Zhang, Jie Fu, Yoshua Bengio, Aaron Courville.  \n*Preprint, October 2021.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2110.03372)]\n\n**Machine-Directed Evolution of an Imine Reductase for Activity and Stereoselectivity.**  \nEric J. Ma, Elina Siirola, Charles Moore, Arkadij Kummer, Markus Stoeckli, Michael Faller, Caroline Bouquet, Fabian Eggimann, Mathieu Ligibel, Dan Huynh, Geoffrey Cutler, Luca Siegrist, Richard A. Lewis, Anne-Christine Acker, Ernst Freund, Elke Koch, Markus Vogel, Holger Schlingensiepen, Edward J. Oakeley, and Radka Snajdrova.  \n*ACS Catalysis, September 2021.*  \n[[10.1021\u002Facscatal.1c02786](https:\u002F\u002Fdoi.org\u002F10.1021\u002Facscatal.1c02786)]\n\n**PyPEF—An Integrated Framework for Data-Driven Protein Engineering.**  \nNiklas E. Siedhoff, Alexander-Maurice Illig, Ulrich Schwaneberg, and Mehdi D. Davari*\n*J. Chem. Inf. Model, July 2021.*  \n[[10.1021\u002Facs.jcim.1c00099](https:\u002F\u002Fdoi.org\u002F10.1021\u002Facs.jcim.1c00099)]\n\n**Conservative Objective Models for Effective Offline Model-Based Optimization.**  \nBrandon Trabucco, Aviral Kumar, Xinyang Geng, Sergey Levine.  \n*Preprint, July 2021.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2107.06882v1)]\n\n**Deep Extrapolation for Attribute-Enhanced Generation.**  \nAlvin Chan, Ali Madani, Ben Krause, Nikhil Naik.  \n*Preprint, July 2021.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2107.02968)]\n\n**Effective Surrogate Models for Protein Design with Bayesian Optimization.**  \nNate Gruver, Samuel Stanton,  Polina Kirichenko,  Marc Finzi, Phillip Maffettone, Vivek Myers,\nEmily Delaney, Peyton Greenside, Andrew Gordon Wilson.  \n*2021 ICML Workshop on Computational Biology, July 2021.*  \n[[pdf](https:\u002F\u002Ficml-compbio.github.io\u002F2021\u002Fpapers\u002FWCBICML2021_paper_61.pdf)] \n\n**Bayesian optimization with evolutionary and structure-based regularization for directed protein evolution.**  \nTrevor S. Frisby, Christopher James Langmead.  \n*Algorithms for Molecular Biology, July 2021.*  \n[[10.1186\u002Fs13015-021-00195-4](https:\u002F\u002Fdoi.org\u002F10.1186\u002Fs13015-021-00195-4)]\n\n**Deep Adaptive Design: Amortizing Sequential Bayesian Experimental Design.**  \nAdam Foster, Desi R. Ivanova, Ilyas Malik, Tom Rainforth.  \n*Preprint, July 2021.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2103.02438)]\n\n**In silico proof of principle of machine learning-based antibody design at unconstrained scale.**  \nRahmad Akbar,Philippe A. Robert,Cédric R. Weber,Michael Widrich,Robert Frank,Milena Pavlović,Lonneke Scheffer,Maria Chernigovskaya,Igor Snapkov,Andrei Slabodkin,Brij Bhushan Mehta,Enkelejda Miho,Fridtjof Lund-Johansen,Jan Terje Andersen,Sepp Hochreiter, Ingrid Hobæk Haff,Günter Klambauer,Geir Kjetil Sandve,Victor Greiff.  \n*Preprint, July 2021.*  \n[[10.1101\u002F2021.07.08.451480](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.07.08.451480)]\n\n**Deep diversification of an AAV capsid protein by machine learning.**  \nDrew H. Bryant, Ali Bashir, Sam Sinai, Nina K. Jain, Pierce J. Ogden, Patrick F. Riley, George M. Church, Lucy J. Colwell & Eric D. Kelsic.  \n*Nature Biotechnology, February 2021.*  \n[[10.1038\u002Fs41587-020-00793-4](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41587-020-00793-4)]\n\n**Deep Uncertainty and the Search for Proteins.**  \nZelda Mariet, Ghassen Jerfel, Zi Wang, Christof Angermüller, David Belanger, Suhani Vora, Maxwell Bileschi, Lucy Colwell, D Sculley, Dustin Tran, Jasper Snoek.  \n*NeurIPS 2020 ML for Molecules Workshop, December 2020.*   \n[[pdf](https:\u002F\u002Fml4molecules.github.io\u002Fpapers2020\u002FML4Molecules_2020_paper_23.pdf)]\n\n**Machine learning-guided acyl-ACP reductase engineering for improved in vivo fatty alcohol production.**  \nJonathan C. Greenhalgh, Sarah A. Fahlberg, Brian F. Pfleger, Philip A. Romero.  \n*Preprint, May 2021.*  \n[[10.1101\u002F2021.05.21.445192](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.05.21.445192)]\n\n**Large-scale design and refinement of stable proteins using sequence-only models.**  \nJedediah M. Singer, Scott Novotney, Devin Strickland, Hugh K. Haddox, Nicholas Leiby, Gabriel J. Rocklin, Cameron M. Chow, Anindya Roy, Asim K. Bera, Francis C. Motta, … Eric Klavins.  \n*Preprint, March 2021.*  \n[[10.1101\u002F2021.03.12.435185](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.03.12.435185)]\n\n**AdaLead: A simple and robust adaptive greedy search algorithm for sequence design.**  \nSam Sinai, Richard Wang, Alexander Whatley, Stewart Slocum, Elina Locane, Eric D. Kelsic. \n*Preprint, October 2020.*  \n[[arxiv](http:\u002F\u002Farxiv.org\u002Fabs\u002F2010.02141)] \n\n**The NK Landscape as a Versatile Benchmark for Machine Learning Driven Protein Engineering.**  \nAdam C. Mater, Mahakaran Sandhu, Colin Jackson.  \n *Preprint, October 2020.*  \n[[10.1101\u002F2020.09.30.319780](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.09.30.319780)]\n\n**Learning with uncertainty for biological discovery and design.**  \nBrian Hie, Bryan Bryson, Bonnie Berger.  \n*Preprint, August 2020.*  \n[[10.1101\u002F2020.08.11.247072](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.08.11.247072)]\n\n**Population-Based Black-Box Optimization for Biological Sequence Design.**  \nChristof Angermueller, David Belanger, Andreea Gane, Zelda Mariet, David Dohan, Kevin Murphy, Lucy Colwell, D Sculley.  \n*ICML, July 2020.*  \n[[ICML](https:\u002F\u002Fproceedings.icml.cc\u002Fstatic\u002Fpaper_files\u002Ficml\u002F2020\u002F6338-Paper.pdf)]\n\n**Autofocused oracles for model-based design.**  \nClara Fannjiang, Jennifer Listgarten.  \n*Preprint, June 2020.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2006.08052)]\n\n**Domain Extrapolation via Regret Minimization.**  \nWengong Jin, Regina Barzilay, Tommi Jaakkola.  \n*Preprint, June 2020.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2006.03908)]\n\n**Fast differentiable DNA and protein sequence optimization for molecular design.**  \nJohannes Linder, Georg Seelig.  \n*Preprint, May 2020.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2005.11275)]\n\n**A Deep Dive into Machine Learning Models for Protein Engineering.**  \nYuting Xu, Deeptak Verma, Robert P Sheridan, Andy Liaw, Junshui Ma, Nicholas\nMarshall, John McIntosh, Edward C. Sherer, Vladimir Svetnik, Jennifer Johnston.  \n*Journal of Chemical Information and Modeling, April 2020.*  \n[[10.1021\u002Facs.jcim.0c00073](https:\u002F\u002Fdoi.org\u002F10.1021\u002Facs.jcim.0c00073)]\n\n**Evolutionary context-integrated deep sequence modeling for protein engineering.**  \nYunan Luo, Lam Vo, Hantian Ding, Yufeng Su, Yang Liu, Wesley Wei Qian, Huimin Zhao, Jian Peng.  \n*Preprint, January 2020.*  \n[[10.1101\u002F2020.01.16.908509](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.01.16.908509)]\n\n**Biological Sequence Design using Batched Bayesian Optimization.**  \nDavid Belanger, Suhani Vora, Zelda Mariet, Ramya Deshpande, David Dohan, Christof Angermueller, Kevin Murphy, Olivier Chapelle, Lucy Colwell.  \n*NeurIPS Workshop on Machine Learning and the Physical Sciences, December 2019.*  \n[[ML4PS](https:\u002F\u002Fml4physicalsciences.github.io\u002Ffiles\u002FNeurIPS_ML4PS_2019_141.pdf)]\n\n**Model Inversion Networks for Model-Based Optimization.**  \nAviral Kumar, Sergey Levine\n*Preprint, December 2019.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F1912.13464v1)]\n\n**Interpreting mutational effects predictions, one substitution at a time.**  \nC. K. Sruthi, Meher K. Prakash.  \n*bioRxiv, December 2019*  \n[[10.1101\u002F867812](https:\u002F\u002Fdoi.org\u002F10.1101\u002F867812)]\n\n**A structure-based deep learning framework for protein engineering.**  \nRaghav Shroff, Austin W. Cole, Barrett R. Morrow, Daniel J. Diaz, Isaac Donnell, Jimmy Gollihar, Andrew D. Ellington, Ross Thyer.  \n*Preprint, November 2019.*  \n[[10.1101\u002F833905](https:\u002F\u002Fdoi.org\u002F10.1101\u002F833905)]\n\n**Comprehensive AAV capsid fitness landscape reveals a viral gene and enables machine-guided design.**  \nPierce J. Ogden, Eric D. Kelsic, Sam Sinai, George M. Church.  \n*Science, November 2019.*  \n[[10.1126\u002Fscience.aaw2900](https:\u002F\u002Fdoi.org\u002F10.1126\u002Fscience.aaw2900)]\n\n**Machine learning-guided channelrhodopsin engineering enables minimally-invasive optogenetics.**  \nClaire N. Bedbrook, Kevin K. Yang, J. Elliott Robinson, Viviana Gradinaru, Frances H Arnold.    \n*Nature Methods, October 2019.*  \n[[10.1038\u002Fs41592-019-0583-8](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41592-019-0583-8)]   \nPreprint available on [[bioRxiv](https:\u002F\u002Fwww.biorxiv.org\u002Fcontent\u002F10.1101\u002F565606v1)]\n\n**Batched Stochastic Bayesian Optimization via Combinatorial Constraints Design**.   \nKevin K. Yang, Yuxin Chen, Alycia Lee, Yisong Yue.   \n*International Conference on Artificial Intelligence and Statistics (AISTATS), April 2019.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F1904.08102)] [[PMLR](http:\u002F\u002Fproceedings.mlr.press\u002Fv89\u002Fyang19c.html)]\n\n**Machine learning-assisted directed protein evolution with combinatorial libraries.**  \nZachary Wu, S. B. Jennifer Kan, Russell D. Lewis, Bruce J. Wittmann, Frances H. Arnold.  \n*PNAS, April 2019.*  \n[[10.1073\u002Fpnas.1901979116](https:\u002F\u002Fdoi.org\u002F10.1073\u002Fpnas.1901979116)]\n\n**Conditioning by adaptive sampling for robust design.**  \nDavid H. Brookes, Hahnbeom Park, Jennifer Listgarten.  \n*Preprint, January 2019.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F1901.10060)]\n\n**A machine learning approach for reliable prediction of amino acid interactions and its application in the directed evolution of enantioselective enzymes.**  \nFrédéric Cadet, Nicolas Fontaine, Guangyue Li, Joaquin Sanchis, Matthieu Ng Fuk Chong, Rudy Pandjaitan, Iyanar Vetrivel, Bernard Offmann, Manfred T. Reetz.  \n*Scientific Reports, November 2018.*  \n[[10.1038\u002Fs41598-018-35033-y](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41598-018-35033-y)]\n\n**Design by adaptive sampling.**  \nDavid H. Brookes, Jennifer Listgarten.  \n*Preprint, October 2018.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F1810.03714)]\n\n**Machine-Learning-Guided Mutagenesis for Directed Evolution of Fluorescent Proteins.**  \nYutaka Saito, Misaki Oikawa, Hikaru Nakazawa, Teppei Niide, Tomoshi Kameda, Koji Tsuda, and Mitsuo Umetsu.  \n*ACS Synthetic Biology, August 2018.*  \n[[10.1021\u002Facssynbio.8b00155](https:\u002F\u002Fdoi.org\u002F10.1021\u002Facssynbio.8b00155)]\n\n**Toward machine-guided design of proteins.**  \nSurojit Biswas,  Gleb Kuznetsov, Pierce J. Ogden, Nicholas J. Conway, Ryan P. Adams, George M. Church.  \n*Preprint, June 2018.*  \n[[10.1101\u002F337154](https:\u002F\u002Fdoi.org\u002F10.1101\u002F337154)] [[bioRxiv](https:\u002F\u002Fwww.biorxiv.org\u002Fcontent\u002F10.1101\u002F337154v1)]\n\n**Feedback GAN (FBGAN) for DNA: a Novel Feedback-Loop Architecture for Optimizing Protein Functions.**  \nAnvita Gupta, James Zou.  \n*Preprint, April 2018.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F1804.01694)]\n\n**Machine learning to design integral membrane channelrhodopsins for efficient eukaryotic expression and plasma membrane localization.**  \nClaire N. Bedbrook, Kevin K. Yang, Austin J. Rice, Viviana Gradinaru, Frances H. Arnold.  \n*PLOS Computational Biology, October 2017.*  \n[[10.1371\u002Fjournal.pcbi.1005786](https:\u002F\u002Fdoi.org\u002F10.1371\u002Fjournal.pcbi.1005786)]\n\n**Exploring sequence-function space of a poplar glutathione transferase using designed information-rich gene variants.**  \nYaman Musdal, Sridhar Govindarajan, Bengt Mannervik.  \n*Protein Engineering, Design, and Selection, August 2017.*  \n[[10.1093%2Fprotein%2Fgzx045](https:\u002F\u002Fdx.doi.org\u002F10.1093%2Fprotein%2Fgzx045)]\n\n**Navigating the protein fitness landscape with Gaussian processes.**  \nPhilip A. Romero, Andreas Krause, Frances H. Arnold.  \n*PNAS, January 2013.*  \n[[10.1073\u002Fpnas.1215251110](https:\u002F\u002Fdoi.org\u002F10.1073\u002Fpnas.1215251110)]\n\n**Engineering proteinase K using machine learning and synthetic genes.**  \nJun Liao, Manfred K. Warmuth, Sridhar Govindarajan, Jon E. Ness, Rebecca P Wang, Claes Gustafsson, Jeremy Minshull.  \n*BMC Biotechnology, March 2007.*  \n[[10.1186\u002F1472-6750-7-16](https:\u002F\u002Fdoi.org\u002F10.1186\u002F1472-6750-7-16)]\n\n**Improving catalytic function by ProSAR-driven enzyme evolution.**  \nRichard J. Fox, S. Christopher Davis, Emily C. Mundorff, Lisa M. Newman, Vesna Gavrilovic, Steven K. Ma, Loleta M. Chung, Charlene Ching, Sarena Tam, Sheela Muley, John Grate, John Gruber, John C. Whitman, Roger A. Sheldon, Gjalt W. Huisman.  \n*Nature Biotechnology, February 2007.*  \n[[Nature Biotechnology](https:\u002F\u002Fwww.nature.com\u002Farticles\u002Fnbt1286)]\n\n### Representation learning\n\n**Feature Reuse and Scaling: Understanding Transfer Learning with Protein Language Models.**  \nFrancesca-Zhoufan Li, Ava P. Amini, Yisong Yue, Kevin K. Yang, Alex X. Lu. \n*ICML, July 2024.*  \n[[10.1101\u002F2024.02.05.578959](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2024.02.05.578959)] \n\n**ProSST: Protein Language Modeling with Quantized Structure and Disentangled Attention.**  \nMingchen Li, Yang Tan, Xinzhu Ma, Bozitao Zhong, Huiqun Yu, Ziyi Zhou, Wanli Ouyang, Bingxin Zhou, Liang Hong, Pan Tan.  \n*Preprint, May 2024.*  \n[[10.1101\u002F2024.04.15.589672](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2024.04.15.589672)]\n\n**Biophysics-based protein language models for protein engineering.**  \nSam Gelman, Bryce Johnson, Chase Freschlin, Sameer D’Costa, Anthony Gitter, Philip A. Romero.  \n*Preprint, March 2024.*  \n[[10.1101\u002F2024.03.15.585128](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2024.03.15.585128)]\n\n**Convolutions are competitive with transformers for protein sequence pretraining.**  \nKevin K. Yang, Nicolo Fusi, Alex X. Lu.  \n*Cell Systems, February 2024.*  \n[[10.1016\u002Fj.cels.2024.01.008](https:\u002F\u002Fdoi.org\u002F10.1016\u002Fj.cels.2024.01.008)]\n\n**Two sequence- and two structure-based ML models have learned different aspects of protein biochemistry.**  \nAnastasiya V. Kulikova, Daniel J. Diaz, Tianlong Chen, T. Jeffrey Cole, Andrew D. Ellington & Claus O. \n*Scientific reports, August 2023.*  \n[[10.1038\u002Fs41598-023-40247-w](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41598-023-40247-w)]\n\n**Domain-PFP: Protein Function Prediction Using Function-Aware Domain Embedding Representations.**  \nNabil Ibtehaz, Yuki Kagaya, Daisuke Kihara.  \n*Preprint, August 2023.*  \n[[10.1101\u002F2023.08.23.554486](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.08.23.554486)]\n\n**Contextual protein and antibody encodings from equivariant graph transformers.**  \nSai Pooja Mahajan, Jeffrey A. Ruffolo, Jeffrey J. Gray.  \n*Preprint, July 2023.*  \n[[10.1101\u002F2023.07.15.549154](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.07.15.549154)]\n\n**Ankh: Optimized Protein Language Model Unlocks General-Purpose Modelling.**  \nAhmed Elnaggar, Hazem Essam, Wafaa Salah-Eldin, Walid Moustafa, Mohamed Elkerdawy, Charlotte Rochereau, Burkhard Rost.  \n*Preprint, June 2023.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2301.06568)]\n\n**Structure-aware protein self-supervised learning.**  \nCan (Sam) Chen, Jingbo Zhou, Fan Wang, Xue Liu, Dejing Dou.  \n*Bioinformatics, April 2023.*  \n[[10.1093\u002Fbioinformatics\u002Fbtad189](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbtad189)]\n\n**Lightweight Contrastive Protein Structure-Sequence Transformation.**  \nJiangbin Zheng, Ge Wang, Yufei Huang, Bozhen Hu, Siyuan Li, Cheng Tan, Xinwen Fan, Stan Z. Li.  \n*Preprint, March 2023.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2303.11783)]\n\n**A Systematic Study of Joint Representation Learning on Protein Sequences and Structures.**  \nZuobai Zhang, Chuanrui Wang, Minghao Xu, Vijil Chenthamarakshan, Aurélie Lozano, Payel Das, Jian Tang.  \n*Preprint, March 2023.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2303.06275)]\n\n**Structure-informed Language Models Are Protein Designers.**  \nZaixiang Zheng, Yifan Deng, Dongyu Xue, Yi Zhou, Fei Ye, Quanquan Gu.  \n*Preprint, Feb 2023.*  \n[[10.1101\u002F2023.02.03.526917](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.02.03.526917)]\n\n**Retrieved Sequence Augmentation for Protein Representation Learning.**  \nChang Ma, Haiteng Zhao, Lin Zheng, Jiayi Xin, Qintong Li, Lijun Wu, Zhihong Deng, Yang Lu, Qi Liu, Lingpeng Kong.  \n*Preprint, Feb 2023.*  \n[[10.1101\u002F2023.02.22.529597](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.02.22.529597)]\n\n**ProtST: Multi-Modality Learning of Protein Sequences and Biomedical Texts.**  \nMinghao Xu, Xinyu Yuan, Santiago Miret, Jian Tang.  \n*Preprint, January 2023.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2301.12040)]\n\n**Codon language embeddings provide strong signals for protein engineering.**  \nCarlos Outeiral, Charlotte M. Deane.  \n*Preprint, December 2022.*  \n[[10.1101\u002F2022.12.15.519894](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.12.15.519894)]\n\n**When Geometric Deep Learning Meets Pretrained Protein Language Models.**  \nFang Wu, Yu Tao, Dragomir Radev, Jinbo Xu.  \n*Preprint, December 2022.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2212.03447)]\n\n**Contrastive learning of protein representations with graph neural networks for structural and functional annotations.**  \nJiaqi Luo, Yunan Luo.  \n*Preprint, December 2022.*  \n[[10.1101\u002F2022.11.29.518451](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.11.29.518451)]\n\n**Training self-supervised peptide sequence models on artificially chopped proteins\n.**  \nGil Sadeh, Zichen Wang, Jasleen Grewal, Huzefa Rangwala, Layne Price.  \n*Preprint, November 2022.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2211.06428)]\n\n**Masked inverse folding with sequence transfer for protein representation learning.**  \nKevin K. Yang, Niccolò Zanichelli, Hugh Yeh.  \n*Protein Engineering, Design, and Selection, October 2022.*  \n[[10.1093\u002Fprotein\u002Fgzad015](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fprotein\u002Fgzad015)]\n\n**Language models of protein sequences at the scale of evolution enable accurate structure prediction.**  \nZeming Lin, Halil Akin, Roshan Rao, Brian Hie, Zhongkai Zhu, Wenting Lu, Allan dos Santos Costa, Maryam Fazel-Zarandi, Tom Sercu, Sal Candido, Alexander Rives.  \n*Preprint, July 2022.*  \n[[10.1101\u002F2022.07.20.500902](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.07.20.500902)]\n\n**Advancing protein language models with linguistics: a roadmap for improved interpretability.**  \nMai Ha Vu, Rahmad Akbar, Philippe A. Robert, Bartlomiej Swiatczak, Victor Greiff, Geir Kjetil Sandve, Dag Trygve Truslew Haug.  \n*Preprint, July 2022.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2207.00982)]\n\n**Self-supervised deep learning encodes high-resolution features of protein subcellular localization.**  \nHirofumi Kobayashi, Keith C. Cheveralls, Manuel D. Leonetti & Loic A. Royer.  \n*Nature Methods, July 2022.*  \n[[10.1038\u002Fs41592-022-01541-z](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41592-022-01541-z)]\n\n**COLLAPSE: A representation learning framework for identification and characterization of protein structural sites.**  \nAlexander Derry, Russ B. Altman.  \n*Preprint, July 2022.*  \n[[10.1101\u002F2022.07.20.500713](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.07.20.500713)]\n\n**CoSP: Co-supervised pretraining of pocket and ligand.**  \nZhangyang Gao, Cheng Tan, Lirong Wu, Stan Z. Li.  \n*Preprint, June 2022.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2206.12241)]\n\n**Pre-training Protein Models with Molecular Dynamics Simulations for Drug Binding.**  \nWu F, Zhang Q, Radev D, Wang Y, Jin X, Jiang Y, Li SZ, Niu Z.  \n*Preprint, June 2022.*  \n[[10.21203\u002Frs.3.rs-1566483\u002Fv1](https:\u002F\u002Fdoi.org\u002F10.21203\u002Frs.3.rs-1566483\u002Fv1)]\n\n**Exploring evolution-based &-free protein language models as protein function predictors.**  \nMingyang Hu, Fajie Yuan, Kevin K. Yang, Fusong Ju, Jin Su, Hui Wang, Fei Yang, Qiuyang Ding.  \n*Preprint, June 2022.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2206.06583)]\n\n**Evolutionary velocity with protein language models.**  \nBrian L. Hie, Kevin K. Yang, Peter S. Kim.  \n*Cell Systems, April 2022.*  \n[[10.1016\u002Fj.cels.2022.01.003](https:\u002F\u002Fdoi.org\u002F10.1016\u002Fj.cels.2022.01.003)]\n\n**Identification of Enzymatic Active Sites with Unsupervised Language Modeling.**  \nLoïc Kwate Dassi, Matteo Manica, Daniel Probst, Philippe Schwaller, Yves Gaetan Nana Teukam, Teodoro Laino.  \n*Preprint, November 2021.*  \n[[10.33774\u002Fchemrxiv-2021-m20gg](https:\u002F\u002Fdoi.org\u002F10.33774\u002Fchemrxiv-2021-m20gg)]\n\n**Artificial Intelligence Guided Conformational Mining of Intrinsically Disordered Proteins.**  \nAayush Gupta, Souvik Dey,  Huan-Xiang Zhou.  \n*Preprint, November 2021.*  \n[[10.1101\u002F2021.11.21.469457](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.11.21.469457)]\n\n**Deciphering the language of antibodies using self-supervised learning.**  \nJinwoo Leem,  Laura S. Mitchell,  James H.R. Farmery,  Justin Barton,  Jacob D. Galson.  \n*Preprint, November 2021.*  \n[[10.1101\u002F2021.11.10.468064](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.11.10.468064)]\n\n**Pre-training Co-evolutionary Protein Representation via A Pairwise Masked Language Model.**  \nLiang He, Shizhuo Zhang, Lijun Wu, Huanhuan Xia, Fusong Ju, He Zhang, Siyuan Liu, Yingce Xia, Jianwei Zhu, Pan Deng, Bin Shao, Tao Qin, Tie-Yan Liu.  \n*Preprint, October 2021.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2110.15527)]\n\n**Neural Distance Embeddings for Biological Sequences.**  \nGabriele Corso, Rex Ying, Michal Pándy, Petar Veličković, Jure Leskovec, Pietro Liò.  \n*Preprint, September 2021.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2109.09740)]\n\n**Biologically relevant transfer learning improves transcription factor binding prediction.**  \nGherman Novakovsky, Manu Saraswat, Oriol Fornes, Sara Mostafavi & Wyeth W. Wasserman.  \n*Genome Biology, September 2021.*  \n[[10.1186\u002Fs13059-021-02499-5](https:\u002F\u002Fdoi.org\u002F10.1186\u002Fs13059-021-02499-5)]\n\n**Toward More General Embeddings for Protein Design: Harnessing Joint Representations of Sequence and Structure.**  \nSanaa Mansoor, Minkyung Baek, Umesh Madan, Eric Horvitz.  \n*Preprint, September 2021.*  \n[[10.1101\u002F2021.09.01.458592](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.09.01.458592)]\n\n**Hydrogen bonds meet self-attention: all you need for general-purpose protein structure embedding.**  \nCheng Chen, Yuguo Zha, Daming Zhu, Kang Ning, Xuefeng Cui.  \n*Preprint, August 2021.*  \n[[10.1101\u002F2021.01.31.428935](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.01.31.428935)]\n\n**Discovering molecular features of intrinsically disordered regions by using evolution for contrastive learning.**  \nAlex X Lu, Amy X Lu, Iva Pritišanac, Taraneh Zarin, Julie D Forman-Kay, Alan M Moses.  \n*Preprint, July 2021.*  \n[[10.1101\u002F2021.07.29.454330](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.07.29.454330)] \n\n**Inferring a Continuous Distribution of Atom Coordinates from Cryo-EM Images using VAEs.**  \nDan Rosenbaum, Marta Garnelo, Michal Zielinski, Charlie Beattie, Ellen Clancy, Andrea Huber, Pushmeet Kohli, Andrew W. Senior, John Jumper, Carl Doersch, S. M. Ali Eslami, Olaf Ronneberger, Jonas Adler.  \n*Preprint, June 2021.*. \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2106.14108)]\n\n**Pretraining model for biological sequence data.**  \nBosheng Song, Zimeng Li, Xuan Lin, Jianmin Wang, Tian Wang, Xiangzheng Fu.  \n*Briefings in Functional Genomics, May 2021*.  \n[[10.1093\u002Fbfgp\u002Felab025](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbfgp\u002Felab025)]\n\n**ProteinBERT: A universal deep-learning model of protein sequence and function.**  \nNadav Brandes, Dan Ofer, Yam Peleg, Nadav Rappoport, Michal Linial.  \n*Preprint, May 2021.*  \n[[10.1101\u002F2021.05.24.445464](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.05.24.445464)]\n\n**Random Embeddings and Linear Regression can Predict Protein Function.**  \nTianyu Lu, Alex X. Lu, Alan M. Moses.  \n*Preprint, April 2021.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2104.14661)]\n\n**Combining evolutionary and assay-labelled data for protein fitness prediction.**  \nChloe Hsu, Hunter Nisonoff, Clara Fannjiang, Jennifer Listgarten.  \n*Preprint, March 2021.*  \n[[10.1101\u002F2021.03.28.437402](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.03.28.437402)]\n\n**MSA Transformer.**  \nRoshan Rao, Jason Liu, Robert Verkuil, Joshua Meier, John F. Canny, Pieter Abbeel, Tom Sercu, Alexander Rives.  \n*Preprint, February 2021.*  \n[[10.1101\u002F2021.02.12.430858](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.02.12.430858)]\n\n**Improving Generalizability of Protein Sequence Models with Data Augmentations.**  \nHongyu Shen, Layne C. Price, Taha Bahadori, Franziska Seeger.  \n*Preprint, February 2021.*  \n[[10.1101\u002F2021.02.18.431877](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.02.18.431877)]\n\n**Capturing Protein Domain Structure and Function Using Self-Supervision on Domain Architectures.**  \nDamianos P. Melidis, Wolfgang Nejdl.  \n*Algorithms, January 2021.*  \n[[10.3390\u002Fa14010028](https:\u002F\u002Fdoi.org\u002F10.3390\u002Fa14010028)]\n\n**Adversarial Contrastive Pre-training for Protein Sequences.**  \nMatthew B. A. McDermott, Brendan Yap, Harry Hsu, Di Jin, Peter Szolovits. \n*Preprint, January 2021.*  \n[[arxiv](http:\u002F\u002Farxiv.org\u002Fabs\u002F2102.00466)] \n\n**Fast end-to-end learning on protein surfaces.**  \nFreyr Sverrisson, Jean Feydy, Bruno E. Correia, Michael M. Bronstein.  \n*Preprint, December 2020.*  \n[[10.1101\u002F2020.12.28.424589](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.12.28.424589)]\n\n**Transformer protein language models are unsupervised structure learners.**  \nRoshan Rao, Sergey Ovchinnikov, Joshua Meier, Alexander Rives, Tom Sercu.  \n*Preprint, December 2020.*  \n[[10.1101\u002F2020.12.15.422761](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.12.15.422761)]\n\n**Self-Supervised Representation Learning of Protein Tertiary Structures (PtsRep): Protein Engineering as A Case Study.**  \nJunwen Luo, Yi Cai, Jialin Wu, Hongmin Cai, Xiaofeng Yang, Zhanglin Lin.  \n*Preprint, December 2020.*  \n[[10.1101\u002F2020.12.22.423916](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.12.22.423916)]\n\n**What is a meaningful representation of protein sequences?.**\nNicki Skafte Detlefsen, Søren Hauberg, Wouter Boomsma.  \n*Preprint, November 2020.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2012.02679v3)]\n\n**Profile Prediction: An Alignment-Based Pre-Training Task for Protein Sequence Models.**  \nPascal Sturmfels, Jesse Vig, Ali Madani, Nazneen Fatema Rajani. \n*Preprint, November 2020.*  \n[[arxiv](http:\u002F\u002Farxiv.org\u002Fabs\u002F2012.00195)] \n\n**Fixed-Length Protein Embeddings using Contextual Lenses.**  \nAmir Shanehsazzadeh, David Belanger, David Dohan. \n*Preprint, October 2020.*  \n[[arxiv](http:\u002F\u002Farxiv.org\u002Fabs\u002F2010.15065)] \n\n**Evaluation of Methods for Protein Representation Learning: A Quantitative Analysis.**  \nSerbulent Unsal, Heval Ataş, Muammer Albayrak, Kemal Turhan, Aybar C. Acar, Tunca Doğan.  \n*Preprint, October 2020.*  \n[[10.1101\u002F2020.10.28.359828](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.10.28.359828)]\n\n**Self-Supervised Contrastive Learning of Protein Representations By Mutual Information Maximization.**  \nAmy X. Lu, Haoran Zhang, Marzyeh Ghassemi, Alan Moses.  \n*Preprint, September 2020.*  \n[[10.1101\u002F2020.09.04.283929](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.09.04.283929)]\n\n**ProtTrans: Towards Cracking the Language of Life’s Code Through Self-Supervised Deep Learning and High Performance Computing.**  \nAhmed Elnaggar, Michael Heinzinger, Christian Dallago, Ghalia Rehawi, Yu Wang, Llion Jones, Tom Gibbs, Tamas Feher, Christoph Angerer, Martin Steinegger, Debsindhu Bhowmik, Burkhard Rost.  \n*Preprint, July 2020.*  \n[[10.1101\u002F2020.07.12.199554](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.07.12.199554)]\n\n**Unsupervised protein embeddings outperform hand-crafted sequence and structure features at predicting molecular function.**  \nAmelia Villegas-Morcillo, Stavros Makrodimitris, Roeland van Ham, Angel M. Gomez, Victoria Sanchez, Marcel Reinders.  \n*Preprint, April 2020.*  \n[[10.1101\u002F2020.04.07.028373](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.04.07.028373)]\n\n**Site2Vec: a reference frame invariant algorithm for vector embedding of protein-ligand binding sites.**  \nArnab Bhadra, Kalidas Y.  \n*Preprint, March 2020.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2003.08149v1)]\n\n**Evolutionary context-integrated deep sequence modeling for protein engineering.**  \nYunan Luo, Lam Vo, Hantian Ding, Yufeng Su, Yang Liu, Wesley Wei Qian, Huimin Zhao, Jian Peng.  \n*Preprint, January 2020.*  \n[[10.1101\u002F2020.01.16.908509](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.01.16.908509)]\n\n**Sequence representations and their utility for predicting protein-protein interactions.**  \nDhananjay Kimothi, Pravesh Biyani, James M Hogan.  \n*Preprint, December 2019.*  \n[[10.1101\u002F2019.12.31.890699](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2019.12.31.890699)]\n\n**Language modelling for biological sequences – curated datasets and baselines.**  \nJose Juan Almagro Armenteros, Alexander Rosenberg Johansen, Ole Winther, Henrik Nielsen.  \n*Preprint, December 2019*.  \n[[alrojo.github.io](https:\u002F\u002Falrojo.github.io\u002Fmedia\u002Fpublications\u002FLMProteins\u002Fpreprint.pdf)]\n\n**Deciphering protein evolution and fitness landscapes with latent space models**  \nXinqiang Ding, Zhengting Zou, Charles L. Brooks III.  \n*Nature Communications, December 2019.*  \n[[10.1038\u002Fs41467-019-13633-0](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41467-019-13633-0)]\n\n**End-to-end multitask learning, from protein language to protein features without alignments.**  \nAhmed Elnaggar, Michael Heinzinger, Christian Dallago, Burkhard Rost.  \n*Preprint, December 2019.*  \n[[10.1101\u002F864405](https:\u002F\u002Fdoi.org\u002F10.1101\u002F864405)]\n\n**Unified rational protein engineering with sequence-only deep representation learning.**  \nEthan C. Alley, Grigory Khimulya, Surojit Biswas, Mohammed AlQuraishi, George M. Church.  \n*Nature Methods, October 2019*  \n[[10.1038\u002Fs41592-019-0598-1](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41592-019-0598-1)]\n\n**Structure-Based Function Prediction using Graph Convolutional Networks.**  \nVladimir Gligorijevic, P. Douglas Renfrew, Tomasz Kosciolek, Julia Koehler Leman, Kunghyun Cho, Tommi Vatanen, Daniel Berenberg, Bryn Taylor, Ian M. Fisk, Ramnik J. Xavier, Rob Knight, Richard Bonneau.  \n*Preprint, October 2019*.  \n[[0.1101\u002F786236](https:\u002F\u002Fdoi.org\u002F10.1101\u002F786236)]\n\n**Modeling the language of life – Deep Learning Protein Sequences.**  \nMichael Heinzinger, Ahmed Elnaggar, Yu Wang, Christian Dallago, Dmitrii Nechaev, Florian Matthes, Burkhard Rost.  \n*Preprint, September 2019.*  \n[[10.1101\u002F614313](https:\u002F\u002Fdoi.org\u002F10.1101\u002F614313)]\n\n**Augmenting Protein Network Embeddings with Sequence Information.**  \nHassan Kane, Mohamed K. Coulibali, Pelkins Ajanoh, Ali Abdallah.  \n*Preprint, August 2019.*  \n[[10.1101\u002F730481](https:\u002F\u002Fdoi.org\u002F10.1101\u002F730481)]\n\n**Universal Deep Sequence Models for Protein Classification.**  \nNils Strodthoff, Patrick Wagner, Markus Wenzel, Wojciech Samek.  \n*Preprint, July 2019.*  \n[[10.1101\u002F704874](https:\u002F\u002Fdoi.org\u002F10.1101\u002F704874)]\n\n**DeepPrime2Sec: Deep Learning for Protein Secondary Structure Prediction from the Primary Sequences.**  \nEhsaneddin Asgari, Nina Poerner, Alice C. McHardy,  Mohammad R.K. Mofrad.  \n*Preprint, July 2019.*  \n[[10.1101\u002F705426](https:\u002F\u002Fdoi.org\u002F10.1101\u002F705426)]\n\n**A Self-Consistent Sonification Method to Translate Amino Acid Sequences into Musical Compositions and Application in Protein Design Using Artificial Intelligence.**  \nChi-Hua Yu, Zhao Qin, Francisco J. Martin-Martinez, Markus J. Buehler.  \n*ACS Nano, June 2019.*  \n[[10.1021\u002Facsnano.9b02180](https:\u002F\u002Fdoi.org\u002F10.1021\u002Facsnano.9b02180)]\n\n**Evaluating Protein Transfer Learning with TAPE.**  \nRoshan Rao, Nicholas Bhattacharya, Neil Thomas, Yan Duan, Xi Chen, John Canny, Pieter Abbeel, Yun S. Song.  \n*Preprint, June 2019.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F1906.08230)]\n\n**Leveraging implicit knowledge in neural networks for functional dissection and engineering of proteins.**  \nJulius Upmeier zu Belzen, Thore Bürgel, Stefan Holderbach, Felix Bubeck, Lukas Adam, Catharina Gandor, Marita Klein, Jan Mathony, Pauline Pfuderer, Lukas Platz, Moritz Przybilla, Max Schwendemann, Daniel Heid, Mareike Daniela Hoffmann, Michael Jendrusch, Carolin Schmelas, Max Waldhauer, Irina Lehmann, Dominik Niopek, Roland Eils.  \n*Nature Machine Intelligence, May 2019.*  \n[[Nature Machine Intelligence](https:\u002F\u002Fwww.nature.com\u002Farticles\u002Fs42256-019-0049-9)]\n\n**Modeling the Language of Life – Deep Learning Protein Sequences.**   \nMichael Heinzinger, Ahmed Elnaggar, Yu Wang, Christian Dallago, Dmitrii Nechaev, Florian Matthes, Burkhard Rost.  \n*Preprint, May 2019.*  \n[[10.1101\u002F614313](https:\u002F\u002Fdoi.org\u002F10.1101\u002F614313)] [[bioRxiv](https:\u002F\u002Fwww.biorxiv.org\u002Fcontent\u002F10.1101\u002F614313v2)]\n\n**Biological Structure and Function Emerge from Scaling Unsupervised Learning to 250 Million Protein Sequences.**  \nAlexander Rives, Siddharth Goyal, Joshua Meier, Demi Guo, Myle Ott, C. Lawrence Zitnick, Jerry Ma, Rob Fergus.  \n*Preprint, April 2019.*  \n[[10.1101\u002F622803](https:\u002F\u002Fdoi.org\u002F10.1101\u002F622803)] [[bioRxiv](https:\u002F\u002Fwww.biorxiv.org\u002Fcontent\u002F10.1101\u002F622803v1)]\n\n**Learning protein constitutive motifs from sequence data.**  \nJérôme Tubiana, Simona Cocco, Rémi Monasson.  \n*eLife, March 2019.*  \n[[10.7554\u002FeLife.39397](https:\u002F\u002Fdoi.org\u002F10.7554\u002FeLife.39397)]\n\n**Probabilistic variable-length segmentation of protein sequences for discriminative motif discovery (DiMotif) and sequence embedding (ProtVecX).**  \nEhsaneddin Asgari, Alice C. McHardy, Mohammad R. K. Mofrad.  \n*Scientific Reports, March 2019.*  \n[[10.1038\u002Fs41598-019-38746-w](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41598-019-38746-w)]\n\n**Learning protein sequence embeddings using information from structure.**  \nTristan Bepler, Bonnie Berger.  \n*International Conference on Learning Representations, February 2019.*  \n[[ICLR](https:\u002F\u002Farxiv.org\u002Fabs\u002F1902.08661)] \n\n**Application of fourier transform and proteochemometrics principles to protein engineering.**  \nFrédéric Cadet, Nicolas Fontaine, Iyanar Vetrivel, Matthieu Ng Fuk Chong, Olivier Savriama, Xavier Cadet, Philippe Charton.  \n*BMC Bioinformatics, October 2018.*  \n[[10.1186\u002Fs12859-018-2407-8](https:\u002F\u002Fdoi.org\u002F10.1186\u002Fs12859-018-2407-8)]\n\n**Learned protein embeddings for machine learning.**  \nKevin K Yang, Zachary Wu, Claire N Bedbrook, Frances H Arnold  \n*Bioinformatics, August 2018*  \n[[10.1093\u002Fbioinformatics\u002Fbty178](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbty178)] \n\n**Deep Semantic Protein Representation for Annotation, Discovery, and Engineering.**  \nAriel S Schwartz, Gregory J Hannum, Zach R Dwiel, Michael E Smoot, Ana R Grant, Jason M Knight, Scott A Becker, Jonathan R Eads, Matthew C LaFave, Harini Eavani, Yinyin Liu, Arjun K Bansal, Toby H Richardson   \n*Preprint, July 2018*   \n[[10.1101\u002F365965](https:\u002F\u002Fdoi.org\u002F10.1101\u002F365965)]  \n\n**Improved Descriptors for the Quantitative Structure–Activity Relationship Modeling of Peptides and Proteins.**  \nMark H. Barley, Nicholas J. Turner, Royston Goodacre.  \n*Journal of Chemical Information and Modeling, January 2018.*  \n[[10.1021\u002Facs.jcim.7b00488](https:\u002F\u002Fdoi.org\u002F10.1021\u002Facs.jcim.7b00488)]\n\n**Variational auto-encoding of protein sequences.**  \nSam Sinai, Eric Kelsic, George M. Church, Martin A. Nowak  \n*Preprint, December 2017*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F1712.03346)]\n\n**Predicting Protein Binding Affinity With Word Embeddings and Recurrent Neural Networks.**  \nCarlo Mazzaferro.  \n*Preprint, April 2017.*  \n[[10.1101\u002F128223](https:\u002F\u002Fdoi.org\u002F10.1101\u002F128223)] [[bioRxiv](https:\u002F\u002Fwww.biorxiv.org\u002Fnode\u002F37703.abstract)]\n\n**dna2vec: Consistent vector representations of variable-length k-mers.**  \nPatrick Ng  \n*Preprint, January 2017*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F1701.06279)]  \n\n**Distributed Representations for Biological Sequence Analysis.**  \nDhananjay Kimothi, Akshay Soni, Pravesh Biyani, James M. Hogan  \n*Preprint, August 2016*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F1608.05949)]  \n\n**ProFET: Feature engineering captures high-level protein functions.**  \nDan Ofer, Michal Linial.  \n*Bioinformatics, June 2015.*  \n[[10.1093\u002Fbioinformatics\u002Fbtv345](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbtv345)]\n\n**AAindex: amino acid index database, progress report 2008.**  \nShuichi Kawashima, Piotr Pokarowski, Maria Pokarowska, Andrzej Kolinski, Toshiaki Katayama, Minoru Kanehisa.  \n*Nucleic Acids Research, January 2008.*  \n[[10.1093\u002Fnar\u002Fgkm998](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fnar\u002Fgkm998)] \n\n### Unsupervised variant prediction\n\n**Predicted mechanistic impacts of human protein missense variants.**  \nJurgen Janes, Marc Muller, Senthil Selvaraj, Diogo Manoel, James Stephenson, Catarina Goncalves, Aleix Lafita, Benjamin Polacco, Kirsten Obernier, Kaur Alasoo, Manuel C Lemos, Nevan Krogan, Maria Martin, Luis R. Saraiva, David Burke, Pedro Beltrao.  \n*Preprint, May 2024.*  \n[[10.1101\u002F2024.05.29.596373](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2024.05.29.596373)]\n\n**Decoding molecular mechanisms for loss of function variants in the human proteome.**  \nMatteo Cagiada, Nicolas Jonsson, Kresten Lindorff-Larsen.  \n*Preprint, May 2024.*  \n[[10.1101\u002F2024.05.21.595203](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2024.05.21.595203)]\n\n**AlphaFold2 can predict single-mutation effects.**  \nJohn M. McBride, Konstantin Polev, Amirbek Abdirasulov, Vladimir Reinharz, Bartosz A. Grzybowski, Tsvi Tlusty.  \n*Nature, October 2023.*  \n[[10.1101\u002F2022.04.14.488301](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.04.14.488301)]\n\n**Learning from prepandemic data to forecast viral escape.**  \nNicole N. Thadani, Sarah Gurev, Pascal Notin, Noor Youssef, Nathan J. Rollins, Daniel Ritter, Chris Sander, Yarin Gal & Debora S. Marks.  \n*Nature, October 2023.*  \n[[10.1038\u002Fs41586-023-06617-0](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41586-023-06617-0)]\n\n**Genome-wide prediction of disease variant effects with a deep protein language model.**  \nNadav Brandes, Grant Goldman, Charlotte H. Wang, Chun Jimmie Ye & Vasilis Ntranos.  \n*Nature Genetics, August 2023.*  \n[[10.1038\u002Fs41588-023-01465-0](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41588-023-01465-0)]\n\n**Protein Fitness Prediction is Impacted by the Interplay of Language Models, Ensemble Learning, and Sampling Methods.**  \nMehrsa Mardikoraem, Daniel Woldring.  \n*Preprint, February 2023.*  \n[[10.1101\u002F2023.02.09.527362](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.02.09.527362)]\n\n**Predicting Immune Escape with Pretrained Protein Language Model Embeddings.**  \nKyle Swanson, Howard Chang, James Zou.  \n*Preprint, December 2022.*  \n[[10.1101\u002F2022.11.30.518466](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.11.30.518466)]\n\n**Protein language model rescue mutations highlight variant effects and structure in clinically relevant genes.**  \nOnuralp Soylemez, Pablo Cordero.  \n*Preprint, November 2022.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2211.10000)]\n\n**Updated benchmarking of variant effect predictors using deep mutational scanning.**  \nBenjamin J. Livesey, Joseph A. Marsh.  \n*Preprint, November 2022.*  \n[[10.1101\u002F2022.11.19.517196](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.11.19.517196)]\n\n**Accurate Mutation Effect Prediction using RoseTTAFold.**  \nSanaa Mansoor, Minkyung Baek, David Juergens, Joseph L. Watson, David Baker.  \n*Preprint, November 2022.*  \n[[10.1101\u002F2022.11.04.515218](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.11.04.515218)]\n\n**Evotuning protocols for Transformer-based variant effect prediction on multi-domain proteins.**  \nHideki Yamaguchi, Yutaka Saito.  \n*Briefings in Bioinformatics, November 2021.*  \n[[10.1093\u002Fbib\u002Fbbab234](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbib\u002Fbbab234)]\n\n**Disease variant prediction with deep generative models of evolutionary data.**  \nJonathan Frazer, Pascal Notin, Mafalda Dias, Aidan Gomez, Joseph K Min, Kelly Brock, Yarin Gal, Debora S Marks.  \n*Nature, November 2021.*  \n[[10.1038\u002Fs41586-021-04043-8](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41586-021-04043-8)]\n\n**Language models enable zero-shot prediction of the effects of mutations on protein function.**  \nJoshua Meier, Roshan Rao, Robert Verkuil, Jason Liu, Tom Sercu, Alexander Rives.  \n*Preprint, July 2021.*  \n[[10.1101\u002F2021.07.09.450648](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.07.09.450648)]\n\n**Unsupervised inference of protein fitness landscape from deep mutational scan.**  \nJorge Fernandez-de-Cossio-Diaz, Guido Uguzzoni, Andrea Pagnani.  \n*Preprint, March 2020.*  \n[[10.1101\u002F2020.03.18.996595](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.03.18.996595)]\n\n**Deep generative models of genetic variation capture the effects of mutations.**  \nAdam J. Riesselman, John B. Ingraham, Debora S. Marks.   \n*Nature Methods, September 2018*  \n[[10.1038\u002Fs41592-018-0138-4](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41592-018-0138-4)] \n\n**Variational auto-encoding of protein sequences.**  \nSam Sinai, Eric Kelsic, George M. Church, Martin A. Nowak  \n*Preprint, December 2017*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F1712.03346)] \n\n### Generative models\n\n**Cramming Protein Language Model Training in 24 GPU Hours.**  \nNathan C. Frey, Taylor Joren, Aya Abdelsalam Ismail, Allen Goodman, Richard Bonneau, Kyunghyun Cho, Vladimir Gligorijević.  \n*Preprint, May 2024.*  \n[[10.1101\u002F2024.05.14.594108](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2024.05.14.594108)]\n\n**Learning the Language of Protein Structure.**  \nBenoit Gaujac, Jérémie Donà, Liviu Copoiu, Timothy Atkinson, Thomas Pierrot, Thomas D. Barrett.  \n*Preprint, May 2024.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2405.15840)]\n\n**Out of Many, One: Designing and Scaffolding Proteins at the Scale of the Structural Universe with Genie 2.**  \nYeqing Lin, Minji Lee, Zhao Zhang, Mohammed AlQuraishi\n*Preprint, May 2024.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2405.15489)]\n\n**ProtMamba: a homology-aware but alignment-free protein state space model.**  \nDamiano Sgarbossa, Cyril Malbranke, Anne-Florence Bitbol.  \n*Preprint, May 2024.*  \n[[10.1101\u002F2024.05.24.595730](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2024.05.24.595730)]\n\n**ProtT3: Protein-to-Text Generation for Text-based Protein Understanding.**   \nZhiyuan Liu, An Zhang, Hao Fei, Enzhi Zhang, Xiang Wang, Kenji Kawaguchi, Tat-Seng Chua.  \n*Preprint, May 2024.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2405.12564)]\n\n**The Continuous Language of Protein Structure.**  \nLukas Billera, Anton Oresten, Aron Stålmarck, Kenta Sato, Mateusz Kaduk, Ben Murrell.  \n*Preprint, May 2024.*  \n[[10.1101\u002F2024.05.11.593685](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2024.05.11.593685)]\n\n**Design of highly functional genome editors by modeling the universe of CRISPR-Cas sequences.**  \nJeffrey A. Ruffolo, Stephen Nayfach, Joseph Gallagher, Aadyot Bhatnagar, Joel Beazer, Riffat Hussain, Jordan Russ, Jennifer Yip, Emily Hill, Martin Pacesa, Alexander J. Meeske, Peter Cameron, Ali Madani.  \n*Preprint, April 2024.*  \n[[10.1101\u002F2024.04.22.590591](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2024.04.22.590591)]\n\n**Diffusion on language model embeddings for protein sequence generation.**  \nViacheslav Meshchaninov, Pavel Strashnov, Andrey Shevtsov, Fedor Nikolaev, Nikita Ivanisenko, Olga Kardymon, Dmitry Vetrov.  \n*Preprint, March 2024.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2403.03726)]\n\n**Protein structure generation via folding diffusion.**  \nKevin E. Wu, Kevin K. Yang, Rianne van den Berg, James Y. Zou, Alex X. Lu, Ava P. Amini.  \n*Nature Communications, February 2024.*  \n[[10.1038\u002Fs41467-024-45051-2](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41467-024-45051-2)]\n\n**Proteus: exploring protein structure generation for enhanced designability and efficiency.**  \nChentong Wang, Yannan Qu, Zhangzhi Peng, Yukai Wang, Hongli Zhu, Dachuan Chen, Longxing Cao.  \n*Preprint, February 2024.*  \n[[10.1101\u002F2024.02.10.579791](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2024.02.10.579791)]\n\n**Diffusion Language Models Are Versatile Protein Learners.**  \nXinyou Wang, Zaixiang Zheng, Fei Ye, Dongyu Xue, Shujian Huang, Quanquan Gu.  \n*Preprint, February 2024.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2402.18567)]\n\n**Harmonic Self-Conditioned Flow Matching for Multi-Ligand Docking and Binding Site Design.**  \nHannes Stärk, Bowen Jing, Regina Barzilay, Tommi Jaakkola.  \n*Preprint, November 2023.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2310.05764)]\n\n**Fast protein backbone generation with SE(3) flow matching.**  \nJason Yim, Andrew Campbell, Andrew Y. K. Foong, Michael Gastegger, José Jiménez-Luna, Sarah Lewis, Victor Garcia Satorras, Bastiaan S. Veeling, Regina Barzilay, Tommi Jaakkola, Frank Noé.  \n*Preprint, October 2023.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2310.05297v2)]\n\n**SE(3)-Stochastic Flow Matching for Protein Backbone Generation.**  \nAvishek Joey Bose, Tara Akhound-Sadegh, Kilian Fatras, Guillaume Huguet, Jarrid Rector-Brooks, Cheng-Hao Liu, Andrei Cristian Nica, Maksym Korablyov, Michael Bronstein, Alexander Tong.  \n*Preprint, October 2023.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2310.02391)]\n\n**Joint Design of Protein Sequence and Structure based on Motifs.**  \nZhenqiao Song, Yunlong Zhao, Yufei Song, Wenxian Shi, Yang Yang, Lei Li.  \n*Preprint, October 2023.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2310.02546)]\n\n**PepMLM: Target Sequence-Conditioned Generation of Peptide Binders via Masked Language Modeling.**  \nTianlai Chen, Sarah Pertsemlidis, Rio Watson, Venkata Srikar Kavirayuni, Ashley Hsu, Pranay Vure, Rishab Pulugurta, Sophia Vincoff, Lauren Hong, Tian Wang, Vivian Yudistyra, Elena Haarer, Lin Zhao, Pranam Chatterjee.  \n*Preprint, October 2023.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2310.03842)]\n\n**Enhancing Luciferase Activity and Stability through Generative Modeling of Natural Enzyme Sequences.**  \nWen Jun Xie, Dangliang Liu, Xiaoya Wang, Aoxuan Zhang, Qijia Wei, Ashim Nandi, Suwei Dong, Arieh Warshel.  \n*Preprint, October 2023.*  \n[[10.1101\u002F2023.09.18.558367](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.09.18.558367)]\n\n**Protein generation with evolutionary diffusion: sequence is all you need.**  \nSarah Alamdari, Nitya Thakkar, Rianne van den Berg, Alex Xijie Lu, Nicolo Fusi, Ava Pardis Amini, Kevin K Yang.  \n*Preprint, September 2023.*  \n[[10.1101\u002F2023.09.11.556673](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.09.11.556673)]\n\n**Efficient and accurate sequence generation with small-scale protein language models.**  \nYaiza Serrano, Sergi Roda, Victor Guallar, Alexis Molina.  \n*Preprint, August 2023.*  \n[[10.1101\u002F2023.08.04.551626](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.08.04.551626)]\n\n**SE(3) diffusion model with application to protein backbone generation**.  \nJason Yim, Brian L. Trippe, Valentin De Bortoli, Emile Mathieu, Arnaud Doucet, Regina Barzilay, Tommi Jaakkola.  \n*ICML, July 2023.*  \n[ACM](https:\u002F\u002Fdl.acm.org\u002Fdoi\u002F10.5555\u002F3618408.3620080)\n\n**De novo design of protein structure and function with RFdiffusion.**  \nJoseph L. Watson, David Juergens, Nathaniel R. Bennett, Brian L. Trippe, Jason Yim, Helen E. Eisenach, Woody Ahern, Andrew J. Borst, Robert J. Ragotte, Lukas F. Milles, Basile I. M. Wicky, Nikita Hanikel, Samuel J. Pellock, Alexis Courbet, William Sheffler, Jue Wang, Preetham Venkatesh, Isaac Sappington, Susana Vázquez Torres, Anna Lauko, Valentin De Bortoli, Emile Mathieu, Sergey Ovchinnikov, Regina Barzilay, Tommi S. Jaakkola, Frank DiMaio, Minkyung Baek & David Baker.  \n*Nature, July 2023.*  \n[[10.1038\u002Fs41586-023-06415-8](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41586-023-06415-8)]\n\n**PoET: A generative model of protein families as sequences-of-sequences.**  \nTimothy F. Truong Jr, Tristan Bepler.  \n*Preprint, June 2023.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2306.06156)]\n\n**Protein Sequence and Structure Co-Design with Equivariant Translation.**  \nChence Shi, Chuanrui Wang, Jiarui Lu, Bozitao Zhong, Jian Tang.  \n*ICLR, May 2023.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2210.08761)]\n\n**Generative design of de novo proteins based on secondary-structure constraints using an attention-based diffusion model.**  \nBo Ni, David L. Kaplan, Markus J. Buehler.  \n*Cell Chem, April 2023.*  \n[[10.1016\u002Fj.chempr.2023.03.020](https:\u002F\u002Fdoi.org\u002F10.1016\u002Fj.chempr.2023.03.020)]\n\n**ProtWave-VAE: Integrating autoregressive sampling with latent-based inference for data-driven protein design.**  \nNiksa Praljak, Xinran Lian, Rama Ranganathan, Andrew L. Ferguson.  \n*Preprint, April 2023.*  \n[[10.1101\u002F2023.04.23.537971](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.04.23.537971)]\n\n**ProtFIM: Fill-in-Middle Protein Sequence Design via Protein Language Models.**  \nYouhan Lee, Hasun Yu.  \n*Preprint, March 2023.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2303.16452)]\n\n**Extrapolative Controlled Sequence Generation via Iterative Refinement.**  \nVishakh Padmakumar, Richard Yuanzhe Pang, He He, Ankur P. Parikh.  \n*Preprint, March 2023.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2303.04562)]\n\n**ProteinVAE: Variational AutoEncoder for Translational Protein Design.**  \nSuyue Lyu, Shahin Sowlati-Hashjin, Michael Garton.  \n*Preprint, March 2023.*  \n[[10.1101\u002F2023.03.04.531110](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.03.04.531110)]\n\n**Generative power of a protein language model trained on multiple sequence alignments.**  \nDamiano Sgarbossa, Umberto Lupo, Anne-Florence Bitbol.  \n*eLife, Februrary 2023.*  \n[[10.7554\u002FeLife.79854](https:\u002F\u002Fdoi.org\u002F10.7554\u002FeLife.79854)]\n\n**Evaluating Prompt Tuning for Conditional Protein Sequence Generation.**  \nAndrea Nathansen, Kevin Klein, Bernhard Y. Renard, Melania Nowicka, Jakub M. Bartoszewicz.  \n*Preprint, February 2023.*  \n[[10.1101\u002F2023.02.28.530492](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.02.28.530492)]\n\n**De novo design of luciferases using deep learning.**  \nAndy Hsien-Wei Yeh, Christoffer Norn, Yakov Kipnis, Doug Tischer, Samuel J. Pellock, Declan Evans, Pengchen Ma, Gyu Rie Lee, Jason Z. Zhang, Ivan Anishchenko, Brian Coventry, Longxing Cao, Justas Dauparas, Samer Halabiya, Michelle DeWitt, Lauren Carter, K. N. Houk & David Baker.  \n*Nature, February 2023.*  \n[[10.1038\u002Fs41586-023-05696-3](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41586-023-05696-3)]\n\n**A Text-guided Protein Design Framework.**  \nShengchao Liu, Yutao Zhu, Jiarui Lu, Zhao Xu, Weili Nie, Anthony Gitter, Chaowei Xiao, Jian Tang, Hongyu Guo, Anima Anandkumar.  \n*Preprint, February 2023.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2302.04611)]\n\n**Large language models generate functional protein sequences across diverse families.**  \nAli Madani, Ben Krause, Eric R. Greene, Subu Subramanian, Benjamin P. Mohr, James M. Holton, Jose Luis Olmos Jr., Caiming Xiong, Zachary Z. Sun, Richard Socher, James S. Fraser & Nikhil Naik.  \n*Nature Biotechnology, January 2023.*  \n[[10.1038\u002Fs41587-022-01618-2](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41587-022-01618-2)]\n\n**Unlocking de novo antibody design with generative artificial intelligence.**  \nAmir Shanehsazzadeh, Sharrol Bachas, George Kasun, John M. Sutton, Andrea K. Steiger, Richard Shuai, Christa Kohnert, Alex Morehead, Amber Brown, Chelsea Chung, Breanna K. Luton, Nicolas Diaz, Matt McPartlon, Bailey Knight, Macey Radach, Katherine Bateman, David A. Spencer, Jovan Cejovic, Gaelin Kopec-Belliveau, Robel Haile, Edriss Yassine, Cailen McCloskey, Monica Natividad, Dalton Chapman, Luka Stojanovic, Goran Rakocevic, Gregory Hannum, Engin Yapici, Katherine Moran, Rodante Caguiat, Shaheed Abdulhaqq, Zheyuan Guo, Lillian R. Klug, Miles Gander, Joshua Meier.  \n*Preprint, January 2023.*  \n[[10.1101\u002F2023.01.08.523187](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.01.08.523187)]\n\n**De novo design of high-affinity protein binders to bioactive helical peptides.**  \nSusana Vázquez Torres, Philip J. Y. Leung, Isaac D. Lutz, Preetham Venkatesh, Joseph L. Watson, Fabian Hink, Huu-Hien Huynh, Andy Hsien-Wei Yeh, David Juergens, Nathaniel R. Bennett, Andrew N. Hoofnagle, Eric Huang, Michael J MacCoss, Marc Expòsit, Gyu Rie Lee, Paul M. Levine, Xinting Li, Mila Lamb, Elif Nihal Korkmaz, Jeff Nivala, Lance Stewart, Joseph M. Rogers, David Baker.  \n*Preprint, December 2022.*  \n[[10.1101\u002F2022.12.10.519862](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.12.10.519862)]\n\n**Deep learning-enabled design of synthetic orthologs of a signaling protein.**  \nXinran Lian, Niksa Praljak, Subu K. Subramanian, Sarah Wasinger, Rama Ranganathan, Andrew L. Ferguson.  \n*Preprint, December 2022.*  \n[[10.1101\u002F2022.12.21.521443](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.12.21.521443)]\n\n**A high-level programming language for generative protein design.**  \nBrian Hie, Salvatore Candido, Zeming Lin, Ori Kabeli, Roshan Rao, Nikita Smetanin, Tom Sercu, Alexander Rives.  \n*Preprint, December 2022.*  \n[[10.1101\u002F2022.12.21.521526](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.12.21.521526)]\n\n**Language models generalize beyond natural proteins.**  \nRobert Verkuil, Ori Kabeli, Yilun Du, Basile I. M. Wicky, Lukas F. Milles, Justas Dauparas, David Baker, Sergey Ovchinnikov, Tom Sercu, Alexander Rives.  \n*Preprint, December 2022.*  \n[[10.1101\u002F2022.12.21.521521](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.12.21.521521)]\n\n**Deep Generative Design of Epitope-Specific Binding Proteins by Latent Conformation Optimization.**  \nRaphael R. Eguchi, Christian A. Choe, Udit Parekh, Irene S. Khalek, Michael D. Ward, Neha Vithani, Gregory R. Bowman, Joseph G. Jardine, Po-Ssu Huang.  \n*Preprint, December 2022.*  \n[[10.1101\u002F2022.12.22.521698](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.12.22.521698)]\n\n**Illuminating protein space with a programmable generative model.**  \nJohn Ingraham, Max Baranov, Zak Costello, Vincent Frappier, Ahmed Ismail, Shan Tie, Wujie Wang, Vincent Xue, Fritz Obermeyer, Andrew Beam, Gevorg Grigoryan.  \n*Preprint, December 2022.*  \n[[10.1101\u002F2022.12.01.518682](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.12.01.518682)]\n\n**Broadly applicable and accurate protein design by integrating structure prediction networks and diffusion generative models.**  \nJoseph L. Watson, David Juergens, Nathaniel R. Bennett, Brian L. Trippe, Jason Yim, Helen E. Eisenach, Woody Ahern, Andrew J. Borst, Robert J. Ragotte, Lukas F. Milles, Basile I. M. Wicky, Nikita Hanikel, Samuel J. Pellock, Alexis Courbet, William Sheffler, Jue Wang, Preetham Venkatesh, Isaac Sappington, Susana Vázquez Torres, Anna Lauko, Valentin De Bortoli, Emile Mathieu, Regina Barzilay, Tommi S. Jaakkola, Frank DiMaio, Minkyung Baek, David Baker.  \n*Preprint, December 2022.*  \n[[10.1101\u002F2022.12.09.519842](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.12.09.519842)]\n\n**De novo PROTAC design using graph-based deep generative models.**  \nDivya Nori, Connor W. Coley, Rocío Mercado.  \n*Preprint, November 2022.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2211.02660)]\n\n**Latent Space Diffusion Models of Cryo-EM Structures.**  \nKarsten Kreis, Tim Dockhorn, Zihao Li, Ellen Zhong.  \n*Preprint, November 2022.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2211.14169)]\n\n**Protein Sequence and Structure Co-Design with Equivariant Translation.**  \nChence Shi, Chuanrui Wang, Jiarui Lu, Bozitao Zhong, Jian Tang.  \n*Preprint, October 2022.* \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2210.08761)] \n\n**Deep Generative Models of Protein Structure Uncover Distant Relationships Across a Continuous Fold Space.**  \nEli J. Draizen, Stella Veretnik, Cameron Mura, Philip E. Bourne.  \n*Preprint, August 2022.*  \n[[10.1101\u002F2022.07.29.501943](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.07.29.501943)]\n\n**Neural Network-Derived Potts Models for Structure-Based Protein Design using Backbone Atomic Coordinates and Tertiary Motifs.**  \nAlex J. Li, Mindren Lu, Israel Desta, Vikram Sundar, Gevorg Grigoryan, Amy E. Keating.  \n*Preprint, August 2022.*  \n[[10.1101\u002F2022.08.02.501736](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.08.02.501736)]\n\n**ProtGPT2 is a deep unsupervised language model for protein design.**  \nNoelia Ferruz, Steffen Schmidt & Birte Höcker.  \n*Nature Communications, July 2022.*. \n[[10.1038\u002Fs41467-022-32007-7](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41467-022-32007-7)]\n\n**ProteinSGM: Score-based generative modeling for de novo protein design.**  \nJin Sub Lee, Philip M. Kim.  \n *Preprint, July 2022.*  \n[[10.1101\u002F2022.07.13.499967](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.07.13.499967)]\n\n**Antigen-Specific Antibody Design and Optimization with Diffusion-Based Generative Models.**\nShitong Luo, Yufeng Su, Xingang Peng, Sheng Wang, Jian Peng, Jianzhu Ma.  \n*Preprint, July 2022.*  \n[[10.1101\u002F2022.07.10.499510](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.07.10.499510)]\n\n**End-to-End deep structure generative model for protein design.**  \nBoqiao Lai, Matthew McPartlon, Jinbo Xu.  \n*Preprint, July 2022.*  \n[[10.1101\u002F2022.07.09.499440](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.07.09.499440)]\n\n**Predicting the antigenic evolution of SARS-COV-2 with deep learning.**  \nWenkai Han, Ningning Chen, Shiwei Sun, Xin Gao.  \n*Preprint, June 2022.*  \n[[10.1101\u002F2022.06.23.497375](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.06.23.497375)]\n\n**Hallucinating protein assemblies.**  \nB. I. M. Wicky, L. F. Milles, A. Courbet, R. J. Ragotte, J. Dauparas, E. Kinfu, S. Tipps, R. D. Kibler, M. Baek, F. DiMaio, X. Li, L. Carter, A. Kang, H. Nguyen, A. K. Bera, D. Baker.  \n*Preprint, June 2022.*  \n[[10.1101\u002F2022.06.09.493773](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.06.09.493773)]\n\n**ProGen2: Exploring the Boundaries of Protein Language Models.**  \nErik Nijkamp, Jeffrey Ruffolo, Eli N. Weinstein, Nikhil Naik, Ali Madani.  \n*Preprint, June 2022.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2206.13517)]\n\n**DiffMD: A Geometric Diffusion Model for Molecular Dynamics Simulations.**  \nFang Wu, Stan Z. Li.  \n*Preprint, April 2022.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2204.08672)]\n\n**Fragment-Based Ligand Generation Guided By Geometric Deep Learning On Protein-Ligand Structure.**  \nAlexander S. Powers, Helen H. Yu, Patricia Suriana, Ron O. Dror.  \n*Preprint, March 2022.*  \n[[10.1101\u002F2022.03.17.484653](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.03.17.484653)]\n\n**Design in the DARK: Learning Deep Generative Models for De Novo Protein Design.**  \nLewis Moffat, Shaun M. Kandathil, David T. Jones.  \n*Preprint, January 2022.*  \n[[10.1101\u002F2022.01.27.478087](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.01.27.478087)]\n\n**Sampling the conformational landscapes of transporters and receptors with AlphaFold2.**  \nDiego del Alamo, Davide Sala, Hassane S. Mchaourab, Jens Meiler.  \n*Preprint, November 2021.*  \n[[10.1101\u002F2021.11.22.469536](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.11.22.469536)]\n\n**Benchmarking deep generative models for diverse antibody sequence design.**  \nIgor Melnyk, Payel Das, Vijil Chenthamarakshan, Aurelie Lozano.  \n*Preprint, November 2021.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2111.06801v1)]\n\n**Efficient generative modeling of protein sequences using simple autoregressive models.**  \nJeanne Trinquier, Guido Uguzzoni, Andrea Pagnani, Francesco Zamponi & Martin Weigt.  \n*Nature Communications, October 2021.*  \n[[10.1038\u002Fs41467-021-25756-4](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41467-021-25756-4)]\n\n**Navigating the amino acid sequence space between functional proteins using a deep learning framework.**  \nTristan Bitard-Feildel​.  \n*PeerJ Computer Science, September 2021.*  \n[[10.7717\u002Fpeerj-cs.684](https:\u002F\u002Fdoi.org\u002F10.7717\u002Fpeerj-cs.684)]\n\n**BioPhi: A platform for antibody design, humanization and humanness evaluation based on natural antibody repertoires and deep learning.**  \nDavid Prihoda, Jad Maamary, Andrew Waight, Veronica Juan, Laurence Fayadat-Dilman, Daniel Svozil, Danny A. Bitton.  \n*Preprint, August 2021.*  \n[[10.1101\u002F2021.08.08.455394](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.08.08.455394)]\n\n**Ancestral Sequence Reconstruction for Co-evolutionary models.**  \nEdwin Rodríguez Horta, Alejandro Lage-Castellanos, Roberto Mulet.  \n*Preprint, August 2021.*. \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2108.03801)]\n\n**AMaLa: Analysis of Directed Evolution Experiments via Annealed Mutational approximated Landscape.**  \nLuca Sesta, Guido Uguzzoni, Jorge Fernandez-de-Cossio Diaz, Andrea Pagnani.  \n*International Journal of Molecular Sciences, August 2021.*  \n[[10.3390\u002Fijms222010908](https:\u002F\u002Fdoi.org\u002F10.3390\u002Fijms222010908)]\n\n**Modeling sequence-space exploration and emergence of epistatic signals in protein evolution.**  \nMatteo Bisardi, Juan Rodriguez-Rivas, Francesco Zamponi, Martin Weigt.  \n*Preprint, June 2021.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2106.02441)]\n\n**Generative AAV capsid diversification by latent interpolation.**  \nSam Sinai, Nina Jain, George M Church, Eric D Kelsic.  \n*Preprint, April 2021.*  \n[[10.1101\u002F2021.04.16.440236](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.04.16.440236)]\n\n**Protein design and variant prediction using autoregressive generative models.**  \nJung-Eun Shin, Adam Riesselman, Kollasch, Conor McMahon, Elana Simon, Chris Sander, Aashish Manglik, Andrew Kruse,  Debora Marks.  \n*Nature Communications, April 2021.*  \n[[10.1038\u002Fs41467-021-22732-w](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41467-021-22732-w)] \n\n**Expanding functional protein sequence spaces using generative adversarial networks.**  \nDonatas Repecka, Vykintas Jauniskis, Laurynas Karpus, Elzbieta Rembeza, Jan Zrimec, Simona Poviloniene, Irmantas Rokaitis, Audrius Laurynenas, Wissam Abuajwa, Otto Savolainen, Rolandas Meskys, Martin K. M. Engqvist, Aleksej Zelezniak.  \n*Nature Machine Intelligence, March 2021.*  \n[[10.1038\u002Fs42256-021-00310-5](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs42256-021-00310-5)]\n\n**Generating functional protein variants with variational autoencoders.**  \nAlex Hawkins-Hooker, Florence Depardieu, Sebastien Baur, Guillaume Couairon, Arthur Chen, David Bikard.  \n*PLOS Computational Biology, February 2021.*  \n[[10.1371\u002Fjournal.pcbi.1008736](https:\u002F\u002Fdoi.org\u002F10.1371\u002Fjournal.pcbi.1008736)]\n\n**Generating novel protein sequences using Gibbs sampling of masked language models.**  \nSean R. Johnson, Sarah Monaco, Kenneth Massie, Zaid Syed.  \n*Preprint, January 2021.*  \n[[10.1101\u002F2021.01.26.428322](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.01.26.428322)]\n\n**The structure-fitness landscape of pairwise relations in generative sequence models.**  \n*Preprint, November 2020.*  \nDylan Marshall, Haobo Wang, Michael Stiffler, Justas Dauparas, Peter Koo, Sergey Ovchinnikov.  \n[[10.1101\u002F2020.11.29.402875](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.11.29.402875)]\n\n**De Novo Protein Design for Novel Folds Using Guided Conditional Wasserstein Generative Adversarial Networks.**  \nMostafa Karimi, Shaowen Zhu, Yue Cao, Yang Shen.  \n*Journal of Chemical Information and Modeling, September 2020.*  \n[[10.1021\u002Facs.jcim.0c00593](https:\u002F\u002Fdoi.org\u002F10.1021\u002Facs.jcim.0c00593)]\n\n**Deep learning enables the design of functional de novo antimicrobial proteins.**  \nJavier Caceres-Delpiano, Roberto Ibañez, Patricio Alegre, Cynthia Sanhueza, Romualdo Paz-Fiblas, Simon Correa, Pedro Retamal, Juan Cristóbal Jiménez, Leonardo Álvarez.  \n*Preprint, August 2020.*  \n[[10.1101\u002F2020.08.26.266940](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.08.26.266940)]\n\n**Generative probabilistic biological sequence models that account for mutational variability.**  \nEli N. Weinstein, Debora S. Marks.  \n*Preprint, August 2020.*  \n[[10.1101\u002F2020.07.31.231381](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.07.31.231381)]\n\n**IG-VAE: Generative Modeling of Immunoglobulin Proteins by Direct 3D Coordinate Generation.**  \nRaphael R. Eguchi, Namrata Anand, Christian A. Choe, Po-Ssu Huang.  \n*Preprint, August 2020.*  \n[[10.1101\u002F2020.08.07.242347](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.08.07.242347)]\n\n**A Generative Neural Network for Maximizing Fitness and Diversity of Synthetic DNA and Protein Sequences.**\nJohannes Linder, Nicholas Bogard, Alexander B. Rosenberg, Georg Seelig\n*Cell Systems, July 2020*\n[[10.1016\u002Fj.cels.2020.05.007](https:\u002F\u002Fdoi.org\u002F10.1016\u002Fj.cels.2020.05.007)]\n\n**Signal Peptides Generated by Attention-Based Neural Networks.**  \nZachary Wu, Kevin Kaichuang Yang, Michael Liszka, Alycia Lee, Alina Batzilla, David Wernick, David P Weiner, Frances H Arnold.  \n*ACS Synthetic Biology, July 2020.*  \n[[10.1021\u002Facssynbio.0c00219](https:\u002F\u002Fdoi.org\u002F10.1021\u002Facssynbio.0c00219)]\n\n**Bio-informed Protein Sequence Generation for Multi-class Virus Mutation Prediction.**  \nYuyang Wang, Prakarsh Yadav, Rishikesh Magar, Amir Barati Farimani.  \n*Preprint, June 2020.*  \n[[10.1101\u002F2020.06.11.146167](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.06.11.146167)]\n\n**Designing Feature-Controlled Humanoid Antibody Discovery Libraries Using Generative Adversarial Networks.**  \nTileli Amimeur, Jeremy M. Shaver, Randal R. Ketchem, J. Alex Taylor, Rutilio H. Clark, Josh Smith, Danielle Van Citters, Christine C. Siska, Pauline Smidt, Megan Sprague, Bruce A. Kerwin, Dean Pettit.\n*Preprint, April 2020.*\n[[10.1101\u002F2020.04.12.024844](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.04.12.024844)]\n\n**ProGen: Language Modeling for Protein Generation.**  \nAli Madani, Bryan McCann, Nikhil Naik, Nitish Shirish Keskar, Namrata Anand, Raphael R. Eguchi, Po-Ssu Huang, Richard Socher.  \n*Preprint, March 2020.*  \n[[10.1101\u002F2020.03.07.982272](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.03.07.982272)]\n\n**De Novo Protein Design for Novel Folds using Guided Conditional Wasserstein Generative Adversarial Networks (gcWGAN).**  \nMostafa Karimi, Shaowen Zhu, Yue Cao, Yang Shen.  \n*Preprint, September 2019.*  \n[[10.1101\u002F769919](https:\u002F\u002Fdoi.org\u002F10.1101\u002F769919)]\n\n**Reconstructing continuous distributions of 3D protein structure from cryo-EM images.**  \nEllen D. Zhong, Tristan Bepler, Joseph H. Davis, Bonnie Berger.  \n*Preprint, September 2019.*\n[[arXiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F1909.05215)]\n\n**Deep generative models for T cell receptor protein sequences.**  \nKristian Davidsen, Branden J. Olson, William S. DeWitt III, Jean Feng, Elias Harkins, Philip Bradley, Frederick A. Matsen IV.  \n*eLife, September 2019*.  \n[[10.7554\u002FeLife.46935.001](https:\u002F\u002Fdoi.org\u002F10.7554\u002FeLife.46935.001)]\n\n**Generative Models for Graph-Based Protein Design.**  \nJohn Ingraham, Vikas K. Garg, Regina Barzilay, Tommi Jaakkola.  \n*ICLR workshop on Deep Generative Models for Highly Structured Data, May 2019.*  \n[[OpenReview](https:\u002F\u002Fopenreview.net\u002Fpdf?id=SJgxrLLKOE)]\n\n**How to Hallucinate Functional Proteins.**  \nZak Costello, Hector Garcia Martin  \n*Preprint, March 2019*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F1903.00458)]  \n\n**Conditioning by adaptive sampling for robust design.**  \nDavid H. Brookes, Hahnbeom Park, Jennifer Listgarten.  \n*Preprint, January 2019.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F1901.10060)]\n\n**Generative modeling for protein structures.**  \nNamrata Anand, Po-Ssu Huang.  \n*NeurIPS, December 2018.*  \n[[NeurIPS](https:\u002F\u002Fpapers.nips.cc\u002Fpaper\u002F7978-generative-modeling-for-protein-structures.pdf)]\n\n**Design of metalloproteins and novel protein folds using variational autoencoders.**  \nJoe G. Greener, Lewis Moffat, David T Jones.  \n*Scientific Reports, November 2018.*  \n[[10.1038\u002Fs41598-018-34533-1](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41598-018-34533-1)]\n\n**Design by adaptive sampling.**  \nDavid H. Brookes, Jennifer Listgarten.  \n*Preprint, October 2018.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F1810.03714)]\n\n**Deep generative models of genetic variation capture the effects of mutations.**  \nAdam J Riesselman, John B Ingraham, Debora S. Marks   \n*Nature Methods, September 2018*  \n[[10.1038\u002Fs41592-018-0138-4](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41592-018-0138-4)] \n\n**Feedback GAN (FBGAN) for DNA: a Novel Feedback-Loop Architecture for Optimizing Protein Functions.**  \nAnvita Gupta, James Zou.  \n*Preprint, April 2018.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F1804.01694)]\n\n**Recurrent Neural Network Model for Constructive Peptide Design.**  \nAlex T. Müller, Jan A. Hiss, and Gisbert Schneider.  \n*Journal of Chemical Information and Modeling, January 2018*  \n[[10.1021\u002Facs.jcim.7b00414](https:\u002F\u002Fdoi.org\u002F10.1021\u002Facs.jcim.7b00414)]\n\n**Variational auto-encoding of protein sequences.**  \nSam Sinai, Eric Kelsic, George M. Church, Martin A. Nowak  \n*Preprint, December 2017*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F1712.03346)]\n\n### Biophysics\n\n**Accurate Conformation Sampling via Protein Structural Diffusion.**  \nJiahao Fan, Ziyao Li, Eric Alcaide, Guolin Ke, Huaqing Huang, E Weinan. \n*Preprint, May 2024.*  \n[[10.1101\u002F2024.05.20.594916](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2024.05.20.594916)] \n\n**ForceGen: End-to-end de novo protein generation based on nonlinear mechanical unfolding responses using a protein language diffusion model.**  \nBo Ni, David L. Kaplan, Markus J. Buehler.  \n*Preprint, October 2023.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2310.10605)]\n\n**Chemically Transferable Generative Backmapping of Coarse-Grained Proteins.**   \nSoojung Yang, Rafael Gómez-Bombarelli.  \n*Preprint, March 2023.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2303.01569)]\n\n**Direct generation of protein conformational ensembles via machine learning.**  \nGiacomo Janson, Gilberto Valdes-Garcia, Lim Heo & Michael Feig.  \n*Nature Communications, February 2023.*  \n[[10.1038\u002Fs41467-023-36443-x](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41467-023-36443-x)]Matching receptor to odorant with protein language and graph neural networks\n\n**Machine Learning Coarse-Grained Potentials of Protein Thermodynamics.**  \nMaciej Majewski, Adrià Pérez, Philipp Thölke, Stefan Doerr, Nicholas E. Charron, Toni Giorgino, Brooke E. Husic, Cecilia Clementi, Frank Noé, Gianni De Fabritiis.  \n*Preprint, December 2022.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2212.07492)]\n\n**Skipping the Replica Exchange Ladder with Normalizing Flows.**  \nMichele Invernizzi, Andreas Krämer, Cecilia Clementi, Frank Noé.  \n*Preprint, October 2022.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2210.14104)]\n\n**From data to noise to data for mixing physics across temperatures with generative artificial intelligence.**  \nYihang Wang, Lukas Herron, and Pratyush Tiwary.  \n*PNAS, August 2022.*  \n[[10.1073\u002Fpnas.2203656119](https:\u002F\u002Fdoi.org\u002F10.1073\u002Fpnas.2203656119)]\n\n**Molecular dynamics without molecules: searching the conformational space of proteins with generative neural networks.**  \nGregory Schwing, Luigi L. Palese, Ariel Fernández, Loren Schwiebert, Domenico L. Gatti.  \n*Preprint, June 2022.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2206.04683)]\n\n### Predicting stability\n\n**The genetic architecture of protein stability.**  \nAndre J. Faure, Aina Martí-Aranda, Cristina Hidalgo-Carcedo, Jörn M. Schmiedel, Ben Lehner.  \n*Preprint, October 2023.*  \n[[10.1101\u002F2023.10.27.564339](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.10.27.564339)]\n\n**New mega dataset combined with deep neural network makes a progress in predicting impact of mutation on protein stability.**  \nMarina A Pak, Nikita V Dovidchenko, Satyarth Mishra Sharma, Dmitry N Ivankov.  \n*Preprint, January 2023.*  \n[[10.1101\u002F2022.12.31.522396](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.12.31.522396)]\n\n**PROSTATA: Protein Stability Assessment using Transformers.**  \nDmitriy Umerenkov, Tatiana I. Shashkova, Pavel V. Strashnov, Fedor Nikolaev, Maria Sindeeva, Nikita V. Ivanisenko, Olga L. Kardymon.  \n*Preprint, December 2022.*  \n[[10.1101\u002F2022.12.25.521875](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.12.25.521875)]\n\n**Rapid protein stability prediction using deep learning representations.**  \nLasse M. Blaabjerg, Maher M. Kassem, Lydia L. Good, Nicolas Jonsson, Matteo Cagiada, Kristoffer E. Johansson, Wouter Boomsma, Amelie Stein, Kresten Lindorff-Larsen.  \n*Preprint, August 2022.*  \n[[10.1101\u002F2022.07.14.500157](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.07.14.500157)]\n\n**Artificial Neural Network to Predict Structure-based Protein-protein Free Energy of Binding from Rosetta-calculated Properties.**  \nMatheus Ferraz, José Neto, Roberto Lins, Erico Teixeira.  \n*Preprint, August 2022.*  \n[[10.26434\u002Fchemrxiv-2022-zhd87](https:\u002F\u002Fdoi.org\u002F10.26434\u002Fchemrxiv-2022-zhd87)]\n\n**Construction of a Deep Neural Network Energy Function for Protein Physics.**  \nHuan Yang, Zhaoping Xiong, Francesco Zonta.  \n*J. Chem. Theory Comput., August 2008.*  \n[[10.1021\u002Facs.jctc.2c00069](https:\u002F\u002Fdoi.org\u002F10.1021\u002Facs.jctc.2c00069)]\n\n**Towards generalizable prediction of antibody thermostability using machine learning on sequence and structure features.**  \nAmeya Harmalkar, Roshan Rao, Jonas Honer, Wibke Deisting, Jonas Anlahr, Anja Hoenig, Julia Czwikla, Eva Sienz-Widmann, Doris Rau, Austin Rice, Timothy P. Riley, Danqing Li, Hannah B. Catterall, Christine E. Tinberg, Jeffrey J. Gray, Kathy Y. Wei.  \n*Preprint, June 2022.*  \n[[10.1101\u002F2022.06.03.494724](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.06.03.494724)]\n\n**Learning deep representations of enzyme thermal adaptation.**  \nGang Li, Filip Buric, Jan Zrimec, Sandra Viknander, Jens Nielsen, Aleksej Zelezniak, Martin K. M. Engqvist.  \n*Preprint, March 2022.*  \n[[10.1101\u002F2022.03.14.484272](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.03.14.484272)]\n\n**Evaluating Protein Engineering Thermostability Prediction Tools Using an Independently Generated Dataset.**\nPeishan Huang, Simon K. S. Chu, Henrique N. Frizzo, Morgan P. Connolly, Ryan W. Caster, and Justin B. Siegel.  \n*ACS Omega, March 2020.*  \n[[10.1021\u002Facsomega.9b04105](https:\u002F\u002Fdoi.org\u002F10.1021\u002Facsomega.9b04105)]\n\n**Predicting changes in protein thermostability upon point mutation with deep 3D convolutional neural networks.**  \nBian Li, Yucheng T. Yang, John A. Capra, Mark B. Gerstein.  \n*Preprint, February 2020.*  \n[[10.1101\u002F2020.02.28.959874](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.02.28.959874)]\n\n**Machine Learning for Prioritization of Thermostabilizing Mutations for G-protein Coupled Receptors.**  \nS. Muk, S. Ghosh, S. Achuthan, X. Chen, X. Yao, M. Sandhu, M. C. Griffor, K. F. Fennell, Y. Che, V. Shanmugasundaram, X. Qiu, C. G. Tate, N. Vaidehi.  \n*Preprint, July 2019.*  \n[[10.1101\u002F715375](https:\u002F\u002Fdoi.org\u002F10.1101\u002F715375)]\n\n**Machine Learning Applied to Predicting Microorganism Growth Temperatures and Enzyme Catalytic Optima**\nGang Li, Kersten S. Rabe, Jens Nielsen, Martin K. M. Engqvist.  \n*ACS Synthetic Biology, May 2019*  \n[[10.1021\u002Facssynbio.9b00099](https:\u002F\u002Fdoi.org\u002F10.1021\u002Facssynbio.9b00099)]\n\n**mGPfusion: predicting protein stability changes with Gaussian process kernel learning and data fusion.**\nEmmi Jokinen, Markus Heinonen, Harri Lähdesmäki.  \n*Bioinformatics, July 2018.*  \n[[10.1093\u002Fbioinformatics\u002Fbty238](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbty238)]\n\n**Structure Based Thermostability Prediction Models for Protein Single Point Mutations with Machine Learning Tools.**  \nLei Jia , Ramya Yarlagadda, Charles C. Reed.  \n*PLOS One, September 2015.*  \n[[10.1371\u002Fjournal.pone.0138022](https:\u002F\u002Fdoi.org\u002F10.1371\u002Fjournal.pone.0138022)]\n\n**NeEMO: a method using residue interaction networks to improve prediction of protein stability upon mutation.**  \nManuel Giollo, Alberto J. M. Martin†, Ian Walsh, Carlo Ferrari, Silvio C. E. Tosatto.  \n*BMC Genomics, May 2014.*  \n[[10.1186\u002F1471-2164-15-S4-S7](https:\u002F\u002Fdoi.org\u002F10.1186\u002F1471-2164-15-S4-S7)]\n\n**mCSM: predicting the effects of mutations in proteins using graph-based signatures.**  \nDouglas E. V. Pires, David B. Ascher, Tom L. Blundell.  \n*Bioinformatics, February 2014.*  \n[[10.1093\u002Fbioinformatics\u002Fbtt691](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbtt691)]\n\n**PROTS-RF: A Robust Model for Predicting Mutation-Induced Protein Stability Changes.**  \nYunqi Li, Jianwen Fang.  \n*PLOS One, October 2012.*  \n[[10.1371\u002Fjournal.pone.0047247](https:\u002F\u002Fdoi.org\u002F10.1371\u002Fjournal.pone.0047247)]\n\n**Predicting changes in protein thermostability brought about by single- or multi-site mutations.**  \nJian Tian, Ningfeng Wu, Xiaoyu Chu, Yunliu Fan.  \n*BMC Bioinformatics, July 2010.*  \n[[10.1186\u002F1471-2105-11-370](https:\u002F\u002Fdoi.org\u002F10.1186\u002F1471-2105-11-370)]\n\n**Fast and accurate predictions of protein stability changes upon mutations using statistical potentials and neural networks: PoPMuSiC-2.0.**  \nYves Dehouck, Aline Grosfils, Benjamin Folch, Dimitri Gilis, Philippe Bogaerts, Marianne Rooman.  \n*Bioinformatics, October 2009.*  \n[[10.1093\u002Fbioinformatics\u002Fbtp445](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbtp445)]\n\n**Prediction of protein stability changes for single‐site mutations using support vector machines.**  \nJianlin Cheng, Arlo Randall, Pierre Baldi.  \n*Proteins, December 2005*.  \n[[10.1002\u002Fprot.20810](https:\u002F\u002Fdoi.org\u002F10.1002\u002Fprot.20810)]\n\n**Predicting protein stability changes from sequences using support vector machines.**  \nEmidio Capriotti, Piero Fariselli, Remo Calabrese, Rita Casadio.  \n*Bioinformatics, September 2005.*  \n[[10.1093\u002Fbioinformatics\u002Fbti1109](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbti1109)]\n\n**I-Mutant2.0: predicting stability changes upon mutation from the protein sequence or structure.**  \nEmidio Capriotti, Piero Fariselli, Rita Casadio.  \n*Nucleic Acids Research, July 2005.*  \n[[10.1093\u002Fnar\u002Fgki375](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fnar\u002Fgki375)]\n\n**A neural-network-based method for predicting protein stability changes upon single point mutations.**  \nEmidio Capriotti, Piero Fariselli, Rita Casadio.  \n*Bioinformatics, August 2004.*  \n[[10.1093\u002Fbioinformatics\u002Fbth928](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbth928)]\n\n**Mismatch string kernels for discriminative protein classification.**  \nChristina S. Leslie, Eleazar Eskin, Adiel Cohen, Jason Weston, William Stafford Noble.  \n*Bioinformatics, March 2004.*  \n[[10.1093\u002Fbioinformatics\u002Fbtg431](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbtg431)]\n\n### Predicting structure from sequence\n\n**Accurate structure prediction of biomolecular interactions with AlphaFold 3.**    \nJosh Abramson, Jonas Adler, Jack Dunger, Richard Evans, Tim Green, Alexander Pritzel, Olaf Ronneberger, Lindsay Willmore, Andrew J. Ballard, Joshua Bambrick, Sebastian W. Bodenstein, David A. Evans, Chia-Chun Hung, Michael O’Neill, David Reiman, Kathryn Tunyasuvunakool, Zachary Wu, Akvilė Žemgulytė, Eirini Arvaniti, Charles Beattie, Ottavia Bertolli, Alex Bridgland, Alexey Cherepanov, Miles Congreve, …John M. Jumper.  \n*Nature, May 2024.*  \n[[10.1038\u002Fs41586-024-07487-w](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41586-024-07487-w)]\n\n\n**ScaleFold: Reducing AlphaFold Initial Training Time to 10 Hours.**  \nFeiwen Zhu, Arkadiusz Nowaczynski, Rundong Li, Jie Xin, Yifei Song, Michal Marcinkiewicz, Sukru Burc Eryilmaz, Jun Yang, Michael Andersch.  \n*Preprint, April 2024.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2404.11068)]\n\n**Generalized Biomolecular Modeling and Design with RoseTTAFold All-Atom.**  \nRohith Krishna, Jue Wang, Woody Ahern, Pascal Sturmfels, Preetham Venkatesh, Indrek Kalvet, Gyu Rie Lee, Felix S Morey-Burrows, Ivan Anishchenko, Ian R Humphreys, Ryan McHugh, Dionne Vafeados, Xinting Li, George A Sutherland, Andrew Hitchcock, C Neil Hunter, Minkyung Baek, Frank DiMaio, David Baker.  \n*Preprint, October 2023.*  \n[[10.1101\u002F2023.10.09.561603](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.10.09.561603)]\n\n**Accurate Prediction of Antibody Function and Structure Using Bio-Inspired Antibody Language Model.**  \nHongtai Jing, Zhengtao Gao, Sheng Xu, Tao Shen, Zhangzhi Peng, Shwai He, Tao You, Shuang Ye, Wei Lin, Siqi Sun.  \n*Preprint, August 2023.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2308.16713)]\n\n**Systematic identification of conditionally folded intrinsically disordered regions by AlphaFold2.**  \nT. Reid Alderson, Iva Pritišanac, Đesika Kolarić, and Julie D. Forman-Kay.  \n*PNAS, August 2023.*  \n[[10.1073\u002Fpnas.2304302120](https:\u002F\u002Fdoi.org\u002F10.1073\u002Fpnas.2304302120)]\n\n**Highfold: accurately predicting cyclic peptide monomers and complexes with AlphaFold.**  \nChenhao Zhang, Chengyun Zhang, Tianfeng Shang, Xinyi Wu, Hongliang Duan.  \n*Preprint, August 2023.*  \n[[10.1101\u002F2023.08.27.554979](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.08.27.554979)]\n\n**Enhancing the Protein Tertiary Structure Prediction by Multiple Sequence Alignment Generation.**  \nLe Zhang, Jiayang Chen, Tao Shen, Yu Li, Siqi Sun.  \n*Preprint, June 2023.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2306.01824)]\n\n**Enhancing the Protein Tertiary Structure Prediction by Multiple Sequence Alignment Generation.**  \nLe Zhang, Jiayang Chen, Tao Shen, Yu Li, Siqi Sun.  \n*Preprint, June 2023.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2306.01824)]\n\n**Efficient and accurate prediction of protein structure using RoseTTAFold2.**  \nMinkyung Baek, Ivan Anishchenko, Ian R. Humphreys, Qian Cong, David Baker, Frank DiMaio.  \n*Preprint, May 2023.*  \n[[10.1101\u002F2023.05.24.542179](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.05.24.542179)]\n\n**EigenFold: Generative Protein Structure Prediction with Diffusion Models.**  \nBowen Jing, Ezra Erives, Peter Pao-Huang, Gabriele Corso, Bonnie Berger, Tommi Jaakkola.  \n*Preprint, April 2023.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2304.02198)]\n\n**Evolutionary-scale prediction of atomic-level protein structure with a language model.**  \nZeming Lin, Halil Akin, Roshan Rao, Brian Hie, Zhongkai Zhu, Wenting Lu, Nikita Smetanin, Robert Verkuil, Ori Kabeli, Yaniv Shmueli, Allan dos Santos Costa, Maryam Fazel-Zarandi, Tom Sercu, Salvatore Candido, Alexander Rives.  \n*Science, March 2023.*  \n[[10.1126\u002Fscience.ade2574](https:\u002F\u002Fdoi.org\u002F10.1126\u002Fscience.ade2574)]\n\n**DR-BERT: A Protein Language Model to Annotate Disordered Regions.**  \nAnanthan Nambiar, John Malcolm Forsyth, Simon Liu, Sergei Maslov.  \n*Preprint, Feb 2023.*  \n[[10.1101\u002F2023.02.22.529574](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.02.22.529574)]\n\n\n**AlphaFold Prediction of Structural Ensembles of Disordered Proteins.**  \nZ. Faidon Brotzakis, Shengyu Zhang, Michele Vendruscolo.  \n*Preprint, January 2023.*  \n[[10.1101\u002F2023.01.19.524720](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.01.19.524720)]\n\n**AFsample: Improving Multimer Prediction with AlphaFold using Aggressive Sampling.**  \nBjörn Wallner.  \n*Preprint, December 2022.*  \n[[10.1101\u002F2022.12.20.521205](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.12.20.521205)]\n\n**OpenFold: Retraining AlphaFold2 yields new insights into its learning mechanisms and capacity for generalization.**  \nGustaf Ahdritz, Nazim Bouatta, Sachin Kadyan, Qinghui Xia, William Gerecke, Timothy J O’Donnell, Daniel Berenberg, Ian Fisk, Niccolò Zanichelli, Bo Zhang, Arkadiusz Nowaczynski, Bei Wang, Marta M Stepniewska-Dziubinska, Shang Zhang, Adegoke Ojewole, Murat Efe Guney, Stella Biderman, Andrew M Watkins, Stephen Ra, Pablo Ribalta Lorenzo, Lucas Nivon, Brian Weitzner, Yih-En Andrew Ban, Peter K Sorger, Emad Mostaque, Zhao Zhang, Richard Bonneau, Mohammed AlQuraishi.  \n*Preprint, November 2022.*  \n[[10.1101\u002F2022.11.20.517210](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.11.20.517210)]\n\n**Improved the Protein Complex Prediction with Protein Language Models.**  \nBo Chen, Ziwei Xie, Jiezhong Qiu, Zhaofeng Ye, Jinbo Xu, Jie Tang.  \n*Preprint, November 2022.*  \n[[10.1101\u002F2022.09.15.508065](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.09.15.508065)]\n\n**tFold-Ab: Fast and Accurate Antibody Structure Prediction without Sequence Homologs.**  \nJiaxiang Wu, Fandi Wu, Biaobin Jiang, Wei Liu, Peilin Zhao.  \n*Preprint, November 2022.*  \n[[10.1101\u002F2022.11.10.515918](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.11.10.515918)]\n\n**Ultra-fast protein structure prediction to capture effects of sequence variation in mutation movies.**  \nKonstantin Weissenow, Michael Heinzinger, Martin Steinegger, Burkhard Rost.  \n*Preprint, November 2022.*  \n[[10.1101\u002F2022.11.14.516473](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.11.14.516473)]\n\n**Improving protein secondary structure prediction by deep language models and transformer networks.**  \nTianqi Wu, Weihang Cheng, Jianlin Cheng.  \n*Preprint, November 2022.*  \n[[10.1101\u002F2022.11.21.517442](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.11.21.517442)]\n\n**Fast and accurate Ab Initio Protein structure prediction using deep learning potentials.**  \nRobin Pearce,Yang Li,Gilbert S. Omenn,Yang Zhang.  \n*PLoS Computational Biology, September 2022.*  \n[[10.1371\u002Fjournal.pcbi.1010539](https:\u002F\u002Fdoi.org\u002F10.1371\u002Fjournal.pcbi.1010539)]\n\n**Accurate prediction of nucleic acid and protein-nucleic acid complexes using RoseTTAFoldNA.**  \nMinkyung Baek, Ryan McHugh, Ivan Anishchenko, David Baker, Frank DiMaio.  \n*Preprint, September 2022.*  \n[[10.1101\u002F2022.09.09.507333](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.09.09.507333)]\n\n**Hallucination of closed repeat proteins containing central pockets.**  \nLinna An, Derrick R Hicks, Dmitri Zorine, Justas Dauparas, Basile I. M. Wicky, Lukas F. Milles, Alexis Courbet, Asim K. Bera, Hannah Nguyen, Alex Kang, Lauren Carter, David Baker.  \n*Preprint, September 2022.*  \n[[10.1101\u002F2022.09.01.506251](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.09.01.506251)]\n\n**SE(3) Equivalent Graph Attention Network as an Energy-Based Model for Protein Side Chain Conformation.**  \nDeqin Liu, Sheng Chen, Shuangjia Zheng, Sen Zhang, Yuedong Yang.  \n*Preprint, September 2022.* \n[[10.1101\u002F2022.09.05.506704](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.09.05.506704)]\n\n**SPEACH_AF: Sampling protein ensembles and conformational heterogeneity with Alphafold2.**  \nRichard A. Stein ,Hassane S. Mchaourab.  \n*PLoS Computational Biology, August 2022.*  \n[[10.1371\u002Fjournal.pcbi.1010483](https:\u002F\u002Fdoi.org\u002F10.1371\u002Fjournal.pcbi.1010483)]\n\n**Few-Shot Learning of Accurate Folding Landscape for Protein Structure Prediction.**  \nJun Zhang, Sirui Liu, Mengyun Chen, Haotian Chu, Min Wang, Zidong Wang, Jialiang Yu, Ningxi Ni, Fan Yu, Diqing Chen, Yi Isaac Yang, Boxin Xue, Lijiang Yang, Yuan Liu, Yi Qin Gao.  \n*Preprint, August 2022.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2208.09652)]\n\n**Atomic protein structure refinement using all-atom graph representations and SE(3)-equivariant graph neural networks.**  \nTianqi Wu, Jianlin Cheng.  \n*Preprint, August 2022.*   \n[[10.1101\u002F2022.05.06.490934](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.05.06.490934)]\n\n**HelixFold-Single: MSA-free Protein Structure Prediction by Using Protein Language Model as an Alternative.**. \nXiaomin Fang, Fan Wang, Lihang Liu, Jingzhou He, Dayong Lin, Yingfei Xiang, Xiaonan Zhang, Hua Wu, Hui Li, Le Song.  \n*Preprint, August 2022.*  \n[[arxiv]https:\u002F\u002Farxiv.org\u002Fabs\u002F2207.13921]\n\n**NetSurfP-3.0: accurate and fast prediction of protein structural features by protein language models and deep learning.**  \nMagnus Haraldson Høie, Erik Nicolas Kiehl, Bent Petersen, Morten Nielsen, Ole Winther, Henrik Nielsen, Jeppe Hallgren, Paolo Marcatili.  \n*Nucleic Acids Research, July 2022.*  \n[[10.1093\u002Fnar\u002Fgkac439](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fnar\u002Fgkac439)]\n\n\n**High-resolution de novo structure prediction from primary sequence.**  \nRuidong Wu, Fan Ding, Rui Wang, Rui Shen, Xiwen Zhang, Shitong Luo, Chenpeng Su, Zuofan Wu, Qi Xie, Bonnie Berger, Jianzhu Ma, Jian Peng.  \n*Preprint, July 2022.*  \n[[10.1101\u002F2022.07.21.500999](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.07.21.500999)]\n\n**Protein Structure Prediction with Expectation Reflection.**  \nEvan Cresswell-Clay, Danh-Tai Hoang, Joe McKenna, Chris Yang, Eric Zhang, Vipul Periwal.  \n*Preprint, July 2022.*  \n[[10.1101\u002F2022.07.12.499755](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.07.12.499755)]\n\n**PSP: Million-level Protein Sequence Dataset for Protein Structure Prediction.**  \nSirui Liu, Jun Zhang, Haotian Chu, Min Wang, Boxin Xue, Ningxi Ni, Jialiang Yu, Yuhao Xie, Zhenyu Chen, Mengyun Chen, Yuan Liu, Piya Patra, Fan Xu, Jie Chen, Zidong Wang, Lijiang Yang, Fan Yu, Lei Chen, Yi Qin Gao.  \n*Preprint, June 2022.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2206.12240)]\n\n**Accurate prediction of inter-protein residue–residue contacts for homo-oligomeric protein complexes.**  \nYumeng Yan, Sheng-You Huang.  \n*Briefings in Bioinformatics, September 2021.*  \n[[10.1093\u002Fbib\u002Fbbab038](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbib\u002Fbbab038)]\n\n**Improved prediction of protein-protein interactions using AlphaFold2 and extended multiple-sequence alignments.**  \nP. Bryant, G. Pozzati, A. Elofsson.  \n*Preprint, September 2021.*  \n[[10.1101\u002F2021.09.15.460468](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.09.15.460468)]\n\n**Accurate prediction of protein structures and interactions using a three-track neural network.**  \nMINKYUNG BAEK... DAVID BAKER.  \n*Science, August 2021.*  \n[[10.1126\u002Fscience.abj8754](https:\u002F\u002Fdoi.org\u002F10.1126\u002Fscience.abj8754)]\n\n**Distillation of MSA Embeddings to Folded Protein Structures with Graph Transformers.**  \nAllan Costa, Manvitha Ponnapati, Joseph M. Jacobson, Pranam Chatterjee.  \n*Preprint, June 2021.*  \n[[10.1101\u002F2021.06.02.446809](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.06.02.446809)]\n\n**Deducing high-accuracy protein contact-maps from a triplet of coevolutionary matrices through deep residual convolutional networks.**  \nYang Li, Chengxin Zhang, Eric W. Bell,Wei Zheng, Xiaogen Zhou, Dong-Jun Yu, Yang Zhang.  \n*PLOS Computational Biology, March 2021.*  \n[[10.1371\u002Fjournal.pcbi.1008865](https:\u002F\u002Fdoi.org\u002F10.1371\u002Fjournal.pcbi.1008865)]\n\n**Multi-task deep learning for concurrent prediction of protein structural properties.**  \nBuzhong Zhang, Jinyan Li, Lijun Quan, Qiang Lyu.  \n*Preprint, February 2021.*  \n[[10.1101\u002F2021.02.04.429840](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.02.04.429840)]\n\n**A multi-task deep-learning system for predicting membrane associations and secondary structures of proteins.**  \nBian Li, Jeffrey Mendenhall, John Anthony Capra, Jens Meiler. \n*Preprint, December 2020.*   \n[[10.1101\u002F2020.12.02.409045](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.12.02.409045)]\n\n**Single Layers of Attention Suffice to Predict Protein Contacts.**  \nNicholas Bhattacharya, Neil Thomas, Roshan Rao, Justas Dauparas, Peter K. Koo, David Baker, Yun S. Song, Sergey Ovchinnikov.  \n*Preprint, December 2020.*  \n[[10.1101\u002F2020.12.21.423882](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.12.21.423882)]\n\n**Fast and effective protein model refinement by deep graph neural networks.**  \nXiaoyang Jing, Jinbo Xu.  \n*Preprint, December 2020.*  \n[[10.1101\u002F2020.12.10.419994](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.12.10.419994)]\n\n**Protein Structural Alignments From Sequence.**  \nJames T. Morton, Charlie E. M. Strauss, Robert Blackwell, Daniel Berenberg, Vladimir Gligorijevic, Richard Bonneau.  \n*Preprint, November 2020.*  \n[[10.1101\u002F2020.11.03.365932](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.11.03.365932)]\n\n**Deep learning-based prediction of protein structure using learned representations of multiple sequence alignments.**  \nShaun M Kandathil, Joe G Greener, Andy M Lau, David T Jones.  \n*Preprint, November 2020.*  \n[[10.1101\u002F2020.11.27.401232](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.11.27.401232)]\n\n**Study of Real-Valued Distance Prediction For Protein Structure Prediction with Deep Learning.**  \nJin Li, Jinbo Xu.  \n*Preprint, November 2020.*  \n[[10.1101\u002F2020.11.26.400523](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.11.26.400523)]\n\n**REALDIST: Real-valued protein distance prediction.**  \nBadri Adhikari.  \n*Preprint, November 2020.*  \n[[10.1101\u002F2020.11.28.402214](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.11.28.402214)]\n\n**Deep learning-based prediction of protein structure using learned representations of multiple sequence alignments.**  \nShaun M Kandathil, Joe G Greener, Andy M Lau, David T Jones.  \n*Preprint, November 2020.*  \n[[10.1101\u002F2020.11.27.401232](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.11.27.401232)]\n\n**Combination of deep neural network with attention mechanism enhances the explainability of protein contact prediction.**  \nChen Chen, Tianqi Wu, Zhiye Guo, Jianlin Cheng.  \n*Preprint, September 2020.*  \n[[10.1101\u002F2020.09.04.283937](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.09.04.283937)]\n\n**Phylogenetic correlations have limited effect on coevolution-based contact prediction in proteins.**   \nEdwin Rodriguez Horta, Martin Weigt.  \n*Preprint, August 2020.*  \n[[10.1101\u002F2020.08.12.247577](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.08.12.247577)]\n\n**Near-complete protein structural modelling of the minimal genome.**  \nJoe G Greener, Nikita Desai, Shaun M Kandathil, David T Jones.  \n*Preprint, July 2020.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2007.06623)]\n\n**Template-based prediction of protein structure with deep learning.**  \nHaicang Zhang, Yufeng Shen.  \n*Preprint, June 2020.*  \n[[2020.06.02.129270](https:\u002F\u002Fdoi.org\u002F2020.06.02.129270)]\n\n**Energy-based models for atomic-resolution protein conformations.**  \nYilun Du, Joshua Meier, Jerry Ma, Rob Fergus, Alexander Rives.  \n*ICLR, April 2020.*  \n[[arXiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2004.13167)]\n\n**A fully open-source framework for deep learning protein real-valued distances.**  \nBadri Adhikari.  \n*Preprint, April 2020.*  \n[[10.1101\u002F2020.04.26.061820]( https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.04.26.061820)]\n\n**PhANNs, a fast and accurate tool and web server to classify phage structural proteins.**  \nVictor Seguritan, Jackson Redfield, David Salamon, Robert A. Edwards, Anca M. Segall.  \n*Preprint, April 2020.*  \n[[10.1101\u002F2020.04.03.023523]( https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.04.03.023523)]\n\n**DeepDist: real-value inter-residue distance prediction with deep residual convolutional network.**  \nTianqi Wu, Zhiye Guo, Jie Hou, Jianlin Cheng.  \n*Preprint, March 2020.*  \n[[10.1101\u002F2020.03.17.995910)](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.03.17.995910))]\n\n**Improved protein structure prediction using predicted inter-residue orientations.**  \nJianyi Yang, Ivan Anishchenko, Hahnbeom Park, Zhenling Peng, Sergey Ovchinnikov, David Baker.  \n*PNAS, January 2020.*  \n[[10.1073\u002Fpnas.1914677117]( https:\u002F\u002Fdoi.org\u002F10.1073\u002Fpnas.1914677117)]\n\n**Deep learning methods in protein structure prediction.**  \nMirko Torrisi, Gianluca Pollastri, Quan Lea.  \n*Computational and Structural Biotechnology, January 2020.*  \n[[10.1016\u002Fj.csbj.2019.12.011](https:\u002F\u002Fdoi.org\u002F10.1016\u002Fj.csbj.2019.12.011)]\n\n**Improved protein structure prediction using potentials from deep learning.**  \nAndrew W. Senior, Richard Evans, John Jumper, James Kirkpatrick, Laurent Sifre, Tim Green, Chongli Qin, Augustin Žídek, Alexander W. R. Nelson, Alex Bridgland, Hugo Penedones, Stig Petersen, Karen Simonyan, Steve Crossan, Pushmeet Kohli, David T. Jones, David Silver, Koray Kavukcuoglu, Demis Hassabis.  \n*Nature, January 2020.*  \n[[10.1038\u002Fs41586-019-1923-7](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41586-019-1923-7)]\n\n**Deep learning extends de novo protein modelling coverage of genomes using iteratively predicted structural constraints.**  \nJoe G. Greener, Shaun M. Kandathil, David T. Jones.  \n*Nature Communications, September 2019.*  \n[[10.1038\u002Fs41467-019-11994-0](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41467-019-11994-0)]\n\n**DeepPrime2Sec: Deep Learning for Protein Secondary Structure Prediction from the Primary Sequences.**  \nEhsaneddin Asgari, Nina Poerner, Alice C. McHardy,  Mohammad R.K. Mofrad.  \n*Preprint, July 2019.*  \n[[10.1101\u002F705426](https:\u002F\u002Fdoi.org\u002F10.1101\u002F705426)]\n\n**End-to-End Differentiable Learning of Protein Structure.**  \nMohammed AlQuraishi.  \n*Cell Systems, April 2019.*  \n[[10.1016\u002Fj.cels.2019.03.006](https:\u002F\u002Fdoi.org\u002F10.1016\u002Fj.cels.2019.03.006)]\n\n**DESTINI: A deep-learning approach to contact-driven protein structure prediction.**  \nMu Gao, Hongyi Zhou, Jeffrey Skolnick.  \n*Scientific Reports, March 2019.*  \n[[10.1038\u002Fs41598-019-40314-1](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41598-019-40314-1)]\n\n\n**Learning protein sequence embeddings using information from structure.**  \nTristan Bepler, Bonnier Berger.  \n*International Conference on Learning Representations, February 2019.*  \n[[ICLR](https:\u002F\u002Farxiv.org\u002Fabs\u002F1902.08661)] \n\n**Generative modeling for protein structures.**  \nNamrata Anand, Po-Ssu Huang.  \n*NeurIPS, December 2018.*  \n[[NeurIPS](https:\u002F\u002Fpapers.nips.cc\u002Fpaper\u002F7978-generative-modeling-for-protein-structures.pdf)]\n\n**Distance-based Protein Folding Powered by Deep Learning.**  \nJinbo Xu.  \n*Preprint, November 2018.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F1811.03481)]\n\n**Porter 5: fast, state-of-the-art ab initio prediction of protein secondary structure in 3 and 8 classes.**  \nMirko Torrisi, Manaz Kaleel, Gianluca Pollastri.  \n*Preprint, October 2018.*  \n[[10.1101\u002F289033](https:\u002F\u002Fdoi.org\u002F10.1101\u002F289033)] [[bioRxiv](https:\u002F\u002Fwww.biorxiv.org\u002Fcontent\u002F10.1101\u002F289033v4)]\n\n**Protein Secondary Structure Prediction Based on Data Partition and Semi-Random Subspace Method.**  \nYuming Ma, Yihui Liu, Jinyong Cheng.  \n*Scientific Reports, June 2018.*  \n[[10.1038\u002Fs41598-018-28084-8](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41598-018-28084-8)]\n\n\n**Protein Secondary Structure Prediction with Long Short Term Memory Networks.**  \nSøren Kaae Sønderby, Ole Winther.\n*Preprint, December 2014.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F1412.7828)] \n\n**Deep Supervised and Convolutional Generative Stochastic Network for Protein Secondary Structure Prediction.**  \nJian Zhou, Olga G. Troyanskaya.  \n*Preprint, March 2014.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F1403.1347)]\n\n### Predicting sequence from structure\n\n**Context-aware geometric deep learning for protein sequence design.**  \nLucien F. Krapp, Fernando A. Meireles, Luciano A. Abriata, Matteo Dal Peraro.  \n*Preprint, June 2023.*  \n[[10.1101\u002F2023.06.19.545381](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.06.19.545381)]\n\n**Inverse Protein Folding Using Deep Bayesian Optimization.**  \nNatalie Maus, Yimeng Zeng, Daniel Allen Anderson, Phillip Maffettone, Aaron Solomon, Peyton Greenside, Osbert Bastani, Jacob R. Gardner.  \n*Preprint, March 2023.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2305.18089)]\n\n**Protein Design Using Physics Informed Neural Networks.**  \nSI Omar, C Keasar, AJ Ben-Sasson, E Haber.  \n*Biomolecules, February 2023.*\n[[10.3390\u002Fbiom13030457](https:\u002F\u002Fdoi.org\u002F10.3390\u002Fbiom13030457)]\n\n**Efficient and scalable de novo protein design using a relaxed sequence space.**  \nChristopher Frank, Ali Khoshouei, Yosta de Stigter, Dominik Schiewitz, Shihao Feng, Sergey Ovchinnikov, Hendrik Dietz.  \n*Preprint, February 2023.*  \n[[10.1101\u002F2023.02.24.529906](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.02.24.529906)]\n\n**De novo protein design by inversion of the AlphaFold structure prediction network.**  \nCasper Goverde, Benedict Wolf, Hamed Khakzad, Stéphane Rosset, Bruno E. Correia.  \n*Preprint, December 2022.*  \n[[10.1101\u002F2022.12.13.520346](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.12.13.520346)]\n\n**Robust deep learning–based protein sequence design using ProteinMPNN.**  \nJ. Dauparas, I. Anishchenko, N. Bennett, H. Bai, R. J. Ragotte, L. F. Milles, B. I. M. Wicky, A. Courbet, R. J. de Haas, N. Bethel, P. J. Y. Leung, T. F. Huddy, S. Pellock, D. Tischer, F. Chan, B. Koepnick, H. Nguyen, A. Kang, B. Sankaran, A. K. Bera, N. P. King, D. Baker.  \n*Science, September 2022.*  \n[[10.1126\u002Fscience.add2187](https:\u002F\u002Fdoi.org\u002F10.1126\u002Fscience.add2187)]\n\n**PiFold: Toward effective and efficient protein inverse folding.**  \nZhangyang Gao, Cheng Tan, Stan Z. Li.  \n*Preprint, September 2022.*  \n[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2209.12643)\n\n**PeTriBERT : Augmenting BERT with tridimensional encoding for inverse protein folding and design.**  \nBaldwin Dumortier, Antoine Liutkus, Clément Carré, Gabriel Krouk.  \n*Preprint, August 2022.*  \n[[10.1101\u002F2022.08.10.503344](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.08.10.503344)]\n\n**SIPF: Sampling Method for Inverse Protein Folding.**  \nTianfan Fu, Jimeng Sun.  \n*KDD, August 2022.*  \n[[10.1145\u002F3534678.3539284](https:\u002F\u002Fdoi.org\u002F10.1145\u002F3534678.3539284)]\n\n\n**Rotamer-free protein sequence design based on deep learning and self-consistency.**  \nYufeng Liu, Lu Zhang, Weilun Wang, Min Zhu, Chenchen Wang, Fudong Li, Jiahai Zhang, Houqiang Li, Quan Chen & Haiyan Liu.  \n*Nature Computational Science, July 2022.*  \n[[10.1038\u002Fs43588-022-00273-6](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs43588-022-00273-6)]\n\n**Accurate and efficient protein sequence design through learning concise local environment of residues.**  \nBin Huang, Tingwen Fan, Kaiyue Wang, Haicang Zhang, Chungong Yu, Shuyu Nie, Yangshuo Qi, Wei-Mou Zheng, Jian Han, Zheng Fan, Shiwei Sun, Sheng Ye, Huaiyi Yang, Dongbo Bu.  \n*Preprint, July 2022.*  \n[[10.1101\u002F2022.06.25.497605](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.06.25.497605)]\n\n**Protein sequence sampling and prediction from structural data.**  \nGabriel Andres Orellana, Javier Caceres-Delpiano, Roberto Ibañez, Michael P Dunne, Leonardo Álvarez.  \n*Preprint, November 2021.*  \n[[10.1101\u002F2021.09.06.459171](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.09.06.459171)]\n\n**Design of proteins presenting discontinuous functional sites using deep learning.**  \nDoug Tischer, Sidney Lisanza, Jue Wang, Runze Dong, Ivan Anishchenko, Lukas F. Milles, Sergey Ovchinnikov, David Baker. \n*Preprint, November 2020.*  \n [[10.1101\u002F2020.11.29.402743](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.11.29.402743)]\n\n**Learning from Protein Structure with Geometric Vector Perceptrons.**  \nBowen Jing, Stephan Eismann, Patricia Suriana, Raphael J.L. Townshend, Ron Dror.  \n*Preprint, September 2020.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2009.01411)]\n\n**Protein Sequence Design with a Learned Potential.**  \nNamrata Anand, Raphael R. Eguchi, Alexander Derry, Russ B. Altman, Po-Ssu Huang.  \n*Preprint, January 2020.*  \n[[10.1101\u002F2020.01.06.895466](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.01.06.895466)]\n\n**Designing real novel proteins using deep graph neural networks.**  \nAlexey Strokach, David Becerra, Carles Corbi, Albert Perez-Riba, Philip M. Kim.  \n*Preprint, December 2019.*  \n[[10.1101\u002F868935](https:\u002F\u002Fdoi.org\u002F10.1101\u002F868935)] [[bioRxiv](https:\u002F\u002Fwww.biorxiv.org\u002Fcontent\u002F10.1101\u002F868935v1)]\n\n**ProDCoNN: Protein design using a convolutional neural network.**  \nYuan Zhang, Yang Chen, Chenran Wang, Chun‐Chao Lo, Xiuwen Liu, Wei Wu, Jinfeng Zhang.  \n*Proteins: Structure, Function, Bioinformatics, December 2019.*  \n[[10.1002\u002Fprot.25868]( https:\u002F\u002Fdoi.org\u002F10.1002\u002Fprot.25868)]\n\n**RamaNet: Computational De Novo Protein Design using a Long Short-Term Memory Generative Adversarial Neural Network.**  \nSari Sabban, Mikhail Markovsky.  \n*Preprint, June 2019.*  \n[[10.1101\u002F671552](https:\u002F\u002Fdoi.org\u002F10.1101\u002F671552)] [[bioRxiv](https:\u002F\u002Fwww.biorxiv.org\u002Fcontent\u002F10.1101\u002F671552v1)]\n\n**Generative Models for Graph-Based Protein Design.**  \nJohn Ingraham, Vikas K. Garg, Regina Barzilay, Tommi Jaakkola.  \n*ICLR workshop on Deep Generative Models for Highly Structured Data, May 2019.*  \n[[OpenReview](https:\u002F\u002Fopenreview.net\u002Fpdf?id=SJgxrLLKOE)]\n\n**SPIN2: Predicting sequence profiles from protein structures using deep neural networks.**  \nJames O'Connell, Zhixiu Li, Jack Hansonm, Rhys Heffernan, James Lyons, Kuldip Paliwal, Abdollah Dehzangi, Yuedong Yang, Yaoqi Zhou.  \n*Proteins, March 2018.*  \n[[10.1002\u002Fprot.25489](https:\u002F\u002Fdoi.org\u002F10.1002\u002Fprot.25489)]\n\n### Classification, annotation, search, and alignments\n\n**FAPM: Functional Annotation of Proteins using Multi-Modal Models Beyond Structural Modeling.**  \nWenkai Xiang, Zhaoping Xiong, Huan Chen, Jiacheng Xiong, Wei Zhang, Zunyun Fu, Mingyue Zheng, Bing Liu, Qian Shi.  \n*Preprint, May 2024.*  \n[[10.1101\u002F2024.05.07.593067](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2024.05.07.593067)]\n\n**Sequence alignment using large protein structure alphabets doubles sensitivity to remote homologs.**   \nRobert C. Edgar.  \n*Preprint, May 2024.*  \n[[10.1101\u002F2024.05.24.595840](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2024.05.24.595840)]\n\n**ProteinCLIP: enhancing protein language models with natural language.**  \nKevin E. Wu, Howard Chang, James Zou.  \n*Preprint, May 2024.*  \n[[10.1101\u002F2024.05.14.594226](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2024.05.14.594226)]\n\n**Protein Language Models Expose Viral Mimicry and Immune Escape.**  \nDan Ofer, Michal Linial.  \n*Preprint, March 2024.*  \n[[10.1101\u002F2024.03.14.585057](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2024.03.14.585057)]\n\n**Predicting enzymatic function of protein sequences with attention.**  \nNicolas Buton, François Coste, Yann Le Cunff.  \n*Bioinformatics, October 2023.*  \n[[10.1093\u002Fbioinformatics\u002Fbtad620](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbtad620)]\n\n**Clustering predicted structures at the scale of the known protein universe.**  \nInigo Barrio-Hernandez, Jingi Yeo, Jürgen Jänes, Milot Mirdita, Cameron L. M. Gilchrist, Tanita Wein, Mihaly Varadi, Sameer Velankar, Pedro Beltrao & Martin Steinegger.  \n*Nature, September 2023.*  \n[[10.1038\u002Fs41586-023-06510-w](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41586-023-06510-w)]\n\n**TEMPROT: protein function annotation using transformers embeddings and homology search.**  \nGabriel B. Oliveira, Helio Pedrini & Zanoni Dias.  \n*BMC Bioinformatics, June 2023.*  \n[[10.1186\u002Fs12859-023-05375-0](https:\u002F\u002Fdoi.org\u002F10.1186\u002Fs12859-023-05375-0)]\n\n**Enzyme function prediction using contrastive learning.**  \nTianhao Yu, Haiyang Cui, Jianan Canal Li, Yunan Luo, Guangde Jiang, Huimin Zhao. \n*Science, March 2023.*  \n[[10.1126\u002Fscience.adf2465](https:\u002F\u002Fdoi.org\u002F10.1126\u002Fscience.adf2465)] \n\n**ProteInfer, deep neural networks for protein functional inference.**  \nTheo Sanderson, Maxwell L Bileschi, David Belanger, Lucy J Colwell.  \n*eLife, February 2023.*  \n[[10.7554\u002FeLife.80942](https:\u002F\u002Fdoi.org\u002F10.7554\u002FeLife.80942)]\n\n**Machine learning models for the prediction of enzyme properties should be tested on proteins not used for model training.**  \nAlexander Kroll, Martin J. Lercher.  \n*Preprint, February 2023.*  \n[[10.1101\u002F2023.02.06.526991](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.02.06.526991)]\n\n\n**Language models can identify enzymatic active sites in protein sequences.**  \nYves Gaetan Nana Teukam ,Loïc Kwate Dassi ,Matteo Manica, Daniel Probst ,Philippe Schwaller ,Teodoro Laino.  \n*Preprint, February 2023.*  \n[[10.26434\u002Fchemrxiv-2021-m20gg-v3](https:\u002F\u002Fdoi.org\u002F10.26434\u002Fchemrxiv-2021-m20gg-v3)]\n\n**Alignment-free estimation of sequence conservation for identifying functional sites using protein sequence embeddings.**  \nWayland Yeung, Zhongliang Zhou, Sheng Li, Natarajan Kannan.  \n*Briefings in Bioinformatics, January 2023.*  \n[[10.1093\u002Fbib\u002Fbbac599](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbib\u002Fbbac599)]\n\n**Fast and accurate protein function prediction from sequence through pretrained language model and homology-based label diffusion.**  \nQianmu Yuan, Junjie Xie, Jiancong Xie, Huiying Zhao, Yuedong Yang\n*Preprint, December 2022.*  \n[[10.1101\u002F2022.12.05.519119](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.12.05.519119)]\n\n**Vector-clustering Multiple Sequence Alignment: Aligning into the twilight zone of protein sequence similarity with protein language models.**  \nClaire D. McWhite, Mona Singh.  \n*Preprint, October 2022.*  \n[[10.1101\u002F2022.10.21.513099](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.10.21.513099)]\n\n**Highly significant improvement of protein sequence alignments with AlphaFold2.**  \nAthanasios Baltzis, Leila Mansouri, Suzanne Jin, Björn E Langer, Ionas Erb, Cedric Notredame.  \n*Bioinformatics, September 2022.*  \n[[doi.org\u002F10.1093\u002Fbioinformatics\u002Fbtac625](https:\u002F\u002Fdoi.org\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbtac625)]\n\n\n**GO Bench: Shared-hub for Universal Benchmarking of Machine Learning-Based Protein Functional Annotations.**  \nAndrew Dickson, Ehsaneddin Asgari, Alice C. McHardy, Mohammad R.K. Mofrad.  \n*Preprint, July 2022.*  \n[[10.1101\u002F2022.07.19.500685](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.07.19.500685)]\n\n**SETH predicts nuances of residue disorder from protein embeddings.**  \nDagmar Ilzhoefer, Michael Heinzinger, Burkhard Rost.  \n*Preprint, June 2022.*  \n[[10.1101\u002F2022.06.23.497276](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.06.23.497276)]\n\n**TSignal: A transformer model for signal peptide prediction.**  \nAlexandru Dumitrescu, Emmi Jokinen, Juho Kellosalo, Ville Paavilainen, Harri Lähdesmäki.  \n*Preprint, June 2022.*  \n[[10.1101\u002F2022.06.02.493958](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.06.02.493958)] \n\n**TMbed – Transmembrane proteins predicted through Language Model embeddings.**  \nMichael Bernhofer, Burkhard Rost.  \n*Preprint, June 2022.*  \n[[10.1101\u002F2022.06.12.495804](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.06.12.495804)]\n\n**Contrastive learning on protein embeddings enlightens midnight zone at lightning speed.**  \nMichael Heinzinger,  Maria Littmann, Ian Sillitoe,  Nicola Bordin, Christine Orengo, Burkhard Rost.  \n*Preprint, November 2021.*  \n[[10.1101\u002F2021.11.14.468528](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.11.14.468528)]\n\n\n**SignalP 6.0 achieves signal peptide prediction across all types using protein language models.**  \nFelix Teufel, José Juan Almagro Armenteros, Alexander Rosenberg Johansen, Magnús Halldór Gíslason, Silas Irby Pihl,Konstantinos D. Tsirigos,Ole Winther, Søren Brunak,Gunnar von Heijne, Henrik Nielsen. \n*Preprint, July 2021.*   \n[[10.1101\u002F2021.06.09.447770](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.06.09.447770)]\n\n**Convolutional neural networks with image representation of amino acid sequences for protein function prediction.**  \nSamia Tasnim Sara, Md Mehedi Hasan, Ahsan Ahmada, Swakkhar Shatabda.  \n*Computational Biology and Chemistry, June 2021.*  \n[[10.1016\u002Fj.compbiolchem.2021.107494](https:\u002F\u002Fdoi.org\u002F10.1016\u002Fj.compbiolchem.2021.107494)]\n\n**Intrinsic-Extrinsic Convolution and Pooling for Learning on 3D Protein Structures.**\nPedro Hermosilla, Marco Schäfer, Matěj Lang, Gloria Fackelmann, Pere Pau Vázquez, Barbora Kozlíková, Michael Krone, Tobias Ritschel, Timo Ropinski.  \n*Preprint, April 2021.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2007.06252)]\n\n**Embeddings from deep learning transfer GO annotations beyond homology.**  \nMaria Littmann, Michael Heinzinger, Christian Dallago, Tobias Olenyi, Burkhard Rost.  \n*Preprint, September 2020.*  \n[[10.1101\u002F2020.09.04.282814](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.09.04.282814)]\n\n**Structure-Based Protein Function Prediction using Graph Convolutional Networks.**  \nVladimir Gligorijevic, P. Douglas Renfrew, Tomasz Kosciolek, Julia Koehler Leman, Daniel Berenberg,  Tommi Vatanen, Chris Chandler, Bryn C. Taylor, Ian M. Fisk, Hera Vlamakis,  Ramnik J. Xavier, Rob Knight, Kyunghyun Cho, Richard Bonneau.  \n*Preprint, June 2020.*  \n[[10.1101\u002F786236](https:\u002F\u002Fdoi.org\u002F10.1101\u002F786236)]\n\n**Unsupervised protein embeddings outperform hand-crafted sequence and structure features at predicting molecular function.**  \nAmelia Villegas-Morcillo, Stavros Makrodimitris, Roeland van Ham, Angel M. Gomez, Victoria Sanchez, Marcel Reinders.  \n*Preprint, April 2020.*  \n[[10.1101\u002F2020.04.07.028373](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.04.07.028373)]\n\n**Machine Learning Predicts New Anti-CRISPR Proteins.**  \nGavin J. Knott, Jennifer A. Doudna, Fayyaz ul Amir Afsar Minhas.  \n*Preprint, November 2019.*  \n[[10.1101\u002F854950](https:\u002F\u002Fdoi.org\u002F10.1101\u002F854950)]\n\n**Improving protein function prediction with synthetic feature samples created by generative adversarial networks.**  \nCen Wan, David T. Jones.  \n*Preprint, August 2019.*  \n[[10.1101\u002F730143](https:\u002F\u002Fdoi.org\u002F10.1101\u002F730143)]\n\n**Universal Deep Sequence Models for Protein Classification.**  \nNils Strodthoff, Patrick Wagner, Markus Wenzel, Wojciech Samek.  \n*Preprint, July 2019.*  \n[[10.1101\u002F704874](https:\u002F\u002Fdoi.org\u002F10.1101\u002F704874)]\n\n**Critiquing Protein Family Classification Models Using Sufficient Input Subsets.**  \nBrandon Carter, Maxwell L. Bileschi, Jamie Smith, Theo Sanderson, Drew Bryant, David Belanger, Lucy J. Colwell.  \n*Preprint, June 2019.*  \n[[10.1101\u002F674119](https:\u002F\u002Fdoi.org\u002F10.1101\u002F674119)] [[bioRxiv](https:\u002F\u002Fwww.biorxiv.org\u002Fcontent\u002F10.1101\u002F674119v1)]\n\n**A Brief History of Protein Sorting Prediction.**  \nHenrik Nielsen, Konstantinos D. Tsirigos, Søren Brunak, Gunnar von Heijne.  \n*The Protein Journal, May 2019.*  \n[[10.1007\u002Fs10930-019-09838-3](https:\u002F\u002Fdoi.org\u002F10.1007\u002Fs10930-019-09838-3)]\n\n**DEEPred: Automated Protein Function Prediction with Multi-task Feed-forward Deep Neural Networks.**  \nAhmet Sureyya Rifaioglu, Tunca Dogan, Maria Jesus Martin, Rengul Cetin-Atalay, Volkan Atalay.  \n*Scientific Reports, May 2019.*  \n[[10.1038\u002Fs41598-019-43708-3](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41598-019-43708-3)]\n\n**Using Deep Learning to Annotate the Protein Universe.**  \nMaxwell L. Bileschi, David Belanger, Drew Bryant, Theo Sanderson, Brandon Carter, D. Sculley, Mark A. DePristo, Lucy J. Colwell\u0014.  \n*Preprint, May 2019.*  \n[[10.1101\u002F626507](https:\u002F\u002Fdoi.org\u002F10.1101\u002F626507)] [[bioRxiv](https:\u002F\u002Fwww.biorxiv.org\u002Fcontent\u002F10.1101\u002F626507v3)]\n\n**ECPred: a tool for the prediction of the enzymatic functions of protein sequences based on the EC nomenclature.**  \nAlperen Dalkiran, Ahmet Sureyya Rifaioglu, Maria Jesus Martin, Rengul Cetin-Atalay, Volkan Atalay, Tunca Dogan.  \n*BMC Bioinformatics, September 2018.*  \n[[10.1186\u002Fs12859-018-2368-y](https:\u002F\u002Fdoi.org\u002F10.1186\u002Fs12859-018-2368-y)]\n\n**DeepGO: predicting protein functions from sequence and interactions using a deep ontology-aware classifier.**  \nMaxat Kulmanov, Mohammed Asif Khan, Robert Hoehndorf.  \n*Bioinformatics, February 2018.*  \n[[10.1093\u002Fbioinformatics\u002Fbtx624](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbtx624)]\n\n**Near perfect protein multi-label classification with deep neural networks.**  \nBalázs Szalkaia, Vince Grolmuszab.  \n*Methods, January 2018.*  \n[[10.1016\u002Fj.ymeth.2017.06.034](https:\u002F\u002Fdoi.org\u002F10.1016\u002Fj.ymeth.2017.06.034)]\n\n**Large‐scale automated function prediction of protein sequences and an experimental case study validation on PTEN transcript variants.**  \nAhmet Sureyya Rifaioglu, Tunca Dogan, Omer Sinan Sarac, Tulin Ersahin, Rabie Saidi, Mehmet Volkan Atalay, Maria Jesus Martin, Rengul Cetin‐Atalay.  \n*Proteins, November 2017.*  \n[[10.1002\u002Fprot.25416](https:\u002F\u002Fdoi.org\u002F10.1002\u002Fprot.25416)]\n\n**ProLanGO: Protein Function Prediction Using Neural Machine Translation Based on a Recurrent Neural Network.**  \nRenzhi Cao, Colton Freitas, Leong Chan, Miao Sun, Haiqing Jiang, Zhangxin Chen.  \n*Molecules, October 2017.*  \n[[10.3390\u002Fmolecules22101732](https:\u002F\u002Fdoi.org\u002F10.3390\u002Fmolecules22101732)]\n\n**Continuous Distributed Representation of Biological Sequences for Deep Proteomics and Genomics.**  \nEhsaneddin Asgari, Mohammad R. K. Mofrad  \n*PLOS One, November 2015.*  \n[[10.1371\u002Fjournal.pone.0141287](https:\u002F\u002Fdoi.org\u002F10.1371\u002Fjournal.pone.0141287)]\n\n**A structural alignment kernel for protein structures.**  \nJian Qiu, Martial Hue, Asa Ben-Hur, Jean-Philippe Vert, William Stafford Noble  \n*Bioinformatics, January 2007.*  \n[[10.1093\u002Fbioinformatics\u002Fbtl642](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbtl642)]  \n\n**The spectrum kernel: A string kernel for SVM protein classification.**  \nChristina S Leslie, Eleazar Eskin, William Stafford Noble.  \n*Pacific Symposium on Biocomputing, January 2002.*  \n[[pdf](http:\u002F\u002Fpsb.stanford.edu\u002Fpsb-online\u002Fproceedings\u002Fpsb02\u002Fleslie.pdf)]\n\n### Predicting interactions with other molecules\n\n**A universal framework for accurate and efficient geometric deep learning of molecular systems.**  \nShuo Zhang, Yang Liu, Lei Xie.  \n*Scientific Reports, November 2023.*  \n[[10.1038\u002Fs41598-023-46382-8](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41598-023-46382-8)]\n\n**Pairing interacting protein sequences using masked language modeling.**  \nUmberto Lupo, Damiano Sgarbossa, Anne-Florence Bitbol.  \n*Preprint, August 2023.*  \n[[10.1101\u002F2023.08.14.553209](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.08.14.553209)]\n\n**From Proteins to Ligands: Decoding Deep Learning Methods for Binding Affinity Prediction.**  \nRohan Gorantla, Ažbeta Kubincová, Andrea Y. Weiße, Antonia S. J. S. Mey.  \n*Preprint, August 2023.*  \n[[10.1101\u002F2023.08.01.551483](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.08.01.551483)]\n\n**De Novo Design of κ-Opioid Receptor Antagonists Using a Generative Deep-Learning Framework.**  \nLeslie Salas-Estrada, Davide Provasi, Xing Qiu, Husnu Ümit Kaniskan, Xi-Ping Huang, Jeffrey F. DiBerto, João Marcelo Lamim Ribeiro, Jian Jin, Bryan L. Roth, and Marta Filizola.  \n*Journal of Chemical Informatics and Modeling, August 2023.*  \n[[10.1021\u002Facs.jcim.3c00651](https:\u002F\u002Fdoi.org\u002F10.1021\u002Facs.jcim.3c00651)]\n\n**Sequence-Based Nanobody-Antigen Binding Prediction.**  \nUsama Sardar, Sarwan Ali, Muhammad Sohaib Ayub, Muhammad Shoaib, Khurram Bashir, Imdad Ullah Khan, Murray Patterson.  \n*Preprint, July 2023.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2308.01920)]\n\n**Machine learning optimization of candidate antibody yields highly diverse sub-nanomolar affinity antibody libraries.**  \nLin Li, Esther Gupta, John Spaeth, Leslie Shing, Rafael Jaimes, Emily Engelhart, Randolph Lopez, Rajmonda S. Caceres, Tristan Bepler & Matthew E. Walsh.  \n*Nature Communications, June 2023.*  \n[[10.1038\u002Fs41467-023-39022-2](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41467-023-39022-2)]\n\n**Matching receptor to odorant with protein language and graph neural networks.**  \nMatej Hladiš, Maxence Lalis, Sebastien Fiorucci, Jérémie Topin.  \n*ICLR, May 2023.*  \n[ICLR](https:\u002F\u002Fopenreview.net\u002Fforum?id=q9VherQJd8_)\n\n**A general model to predict small molecule substrates of enzymes based on machine and deep learning.**  \nAlexander Kroll, Sahasra Ranjan, Martin K. M. Engqvist & Martin J. Lercher.  \n*Nature Communications, May 2023.*  \n[[10.1038\u002Fs41467-023-38347-2](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41467-023-38347-2)]\n\n**De novo design of protein interactions with learned surface fingerprints.**  \nPablo Gainza, Sarah Wehrle, Alexandra Van Hall-Beauvais, Anthony Marchand, Andreas Scheck, Zander Harteveld, Stephen Buckley, Dongchun Ni, Shuguang Tan, Freyr Sverrisson, Casper Goverde, Priscilla Turelli, Charlène Raclot, Alexandra Teslenko, Martin Pacesa, Stéphane Rosset, Sandrine Georgeon, Jane Marsden, Aaron Petruzzella, Kefang Liu, Zepeng Xu, Yan Chai, Pu Han, George F. Gao, …Bruno E. Correia.  \n*Nature, April 2023.*  \n[[10.1038\u002Fs41586-023-05993-x](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41586-023-05993-x)]\n\n**PeSTo: parameter-free geometric deep learning for accurate prediction of protein binding interfaces.**  \nLucien F. Krapp, Luciano A. Abriata, Fabio Cortés Rodriguez & Matteo Dal Peraro.  \n*Nature Communications, April 2023.*  \n[[10.1038\u002Fs41467-023-37701-8](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41467-023-37701-8)]\n\n**DRPBind: prediction of DNA, RNA and protein binding residues in intrinsically disordered protein sequences.**  \nRonesh Sharma, Tatsuhiko Tsunoda, Alok Sharma.  \n*Preprint, March 2023.*  \n[[10.1101\u002F2023.03.20.533427](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.03.20.533427)]\n\n**FlexVDW: A machine learning approach to account for protein flexibility in ligand docking.**  \nPatricia Suriana, Joseph M. Paggi, Ron O. Dror.  \n*Preprint, March 2023.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2303.11494)]\n\n**End-to-end sequence-structure-function meta-learning predicts genome-wide chemical-protein interactions for dark proteins.**  \nTian Cai, Li Xie, Shuo Zhang, Muge Chen, Di He, Amitesh Badkul, Yang Liu, Hari Krishna Namballa, Michael Dorogan, Wayne W. Harding, Cameron Mura, Philip E. Bourne, Lei Xie.  \n*PLOS Computational Biology, January 2023.*  \n[[10.1371\u002Fjournal.pcbi.1010851](https:\u002F\u002Fdoi.org\u002F10.1371\u002Fjournal.pcbi.1010851)]\n\n**Application of artificial intelligence to decode the relationships between smell, olfactory receptors and small molecules.**  \nRayane Achebouche, Anne Tromelin, Karine Audouze & Olivier Taboureau.  \n*Scientific Reports, November 2022.*  \n[[10.1038\u002Fs41598-022-23176-y](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41598-022-23176-y)]\n\n**DiffBP: Generative Diffusion of 3D Molecules for Target Protein Binding.**  \nHaitao Lin, Yufei Huang, Meng Liu, Xuanjing Li, Shuiwang Ji, Stan Z. Li.  \n*Preprint, November 2022.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2211.11214)]\n\n**DiffDock: Diffusion Steps, Twists, and Turns for Molecular Docking.**  \nGabriele Corso, Hannes Stärk, Bowen Jing, Regina Barzilay, Tommi Jaakkola.  \n*Preprint, October 2022.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2210.01776)]\n\n**Benchmarking AlphaFold-enabled molecular docking predictions for antibiotic discovery.**  \nFelix Wong, Aarti Krishnan, Erica J Zheng, Hannes Stärk, Abigail L Manson, Ashlee M Earl, Tommi Jaakkola, James J Collins.  \n*Molecular Systems Biology, September 2022.*  \n[[10.15252\u002Fmsb.202211081](https:\u002F\u002Fdoi.org\u002F10.15252\u002Fmsb.202211081)]\n\n**Dynamic-Backbone Protein-Ligand Structure Prediction with Multiscale Generative Diffusion Models.**  \nZhuoran Qiao, Weili Nie, Arash Vahdat, Thomas F. Miller III, Anima Anandkumar.  \n*Preprint, September 2022.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2209.15171)]\n\n**Widely Used and Fast De Novo Drug Design by a Protein Sequence-Based Reinforcement Learning Model.**  \nYaqin Li, Lingli Li, Yongjin Xu, Yi Yu.  \n*Preprint, August 2022.*  \n[[10.1101\u002F2022.08.18.504370](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.08.18.504370)]\n\n**Antibody-Antigen Docking and Design via Hierarchical Equivariant Refinement.**  \nWengong Jin, Regina Barzilay, Tommi Jaakkola.  \n*Preprint, July 2022.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2207.06616)]\n\n**Cross-Modality and Self-Supervised Protein Embedding for Compound–Protein Affinity and Contact Prediction.**  \nYuning You, Yang Shen.  \n*Preprint, July 2022.*  \n[[10.1101\u002F2022.07.18.500559](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.07.18.500559)]\n\n**EvoBind: in silico directed evolution of peptide binders with AlphaFold.**  \nPatrick Bryant, Arne Elofsson.  \n*Preprint, July 2022.*  \n[[10.1101\u002F2022.07.23.501214](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.07.23.501214)]\n\n**BepiPred-3.0: Improved B-cell epitope prediction using protein language models.**  \nJoakim Clifford, Magnus Haraldson Høie, Morten Nielsen, Sebastian Deleuran, Bjoern Peters, Paolo Marcatili.  \n*Preprint, July 2022.*  \n[[10.1101\u002F2022.07.11.499418](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.07.11.499418)]\n\n**Predicting the specific substrate for transmembrane transport proteins using BERT language model.**  \nSima Ataei, Gregory Butler.  \n*Preprint, July 2022.*  \n[[10.1101\u002F2022.07.23.501263](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.07.23.501263)]\n\n**Peptide binding specificity prediction using fine-tuned protein structure prediction networks.**  \nAmir Motmaen, Justas Dauparas, Minkyung Baek, Mohamad H. Abedi, David Baker, Philip Bradley\n*Preprint, July 2022.*  \n[[10.1101\u002F2022.07.12.499365](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.07.12.499365)]\n\n**Predicting the locations of cryptic pockets from single protein structures using the PocketMiner graph neural network.**  \nArtur Meller, Michael Ward, Jonathan Borowsky, Jeffrey M. Lotthammer, Meghana Kshirsagar, Felipe Oviedo, Juan Lavista Ferres, Gregory R. Bowman\n*Preprint, June 2022.*  \n[[10.1101\u002F2022.06.28.497399](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.06.28.497399)]\n\n**Topsy-Turvy: integrating a global view into sequence-based PPI prediction.**  \nRohit Singh, Kapil Devkota, Samuel Sledzieski, Bonnie Berger, Lenore Cowen.\n*Bioinformatics, July 2022.*  \n[[10.1093\u002Fbioinformatics\u002Fbtac258](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbtac258)]\n\n**Scaffolding protein functional sites using deep learning.**  \nJue Wang, Sidney Lisanza, David Juergens, Doug Tischer, Joseph L. Watson, Karla M. Castro, Robert Ragotte, Amijai Saragovi, Lukas F. Milles, Minkyung Baek, Ivan Anishchenko, Wei Yang, Derrick R. Hicks, Marc Expòsit, Thomas Schlichthaerle, Jung-Ho Chun, Justas Dauparas, Nathaniel Bennett, Basile I. M. Wicky, Andrew Muenks, Frank DiMaio, Bruno Correia, Sergey Ovchinnikov and David Baker.  \n*Science, July 2022.*  \n[[10.1126\u002Fscience.abn2100](https:\u002F\u002Fdoi.org\u002F10.1126\u002Fscience.abn2100)]\n\n**The substrate scopes of enzymes: a general prediction model based on machine and deep learning.**  Alexander Kroll, Sahasra Ranjan, Martin K. M. Engqvist, Martin J. Lercher.  \n*Preprint, May 2022.*  \n[[10.1101\u002F2022.05.24.493213](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.05.24.493213)]\n\n**Machine learning modeling of family wide enzyme-substrate specificity screens.**  \nSamuel Goldman, Ria Das, Kevin K. Yang, Connor W. Coley.  \n*PLoS Computational Biology, February 2022.*  \n[[10.1371\u002Fjournal.pcbi.1009853](https:\u002F\u002Fdoi.org\u002F10.1371\u002Fjournal.pcbi.1009853)]\n**The substrate scopes of enzymes: a general prediction model based on machine and deep learning**\nAlexander Kroll, Sahasra Ranjan, Martin K. M. Engqvist, Martin J. Lercher.  \n*Preprint, May 2022.*  \n[[10.1101\u002F2022.05.24.493213](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.05.24.493213)]\n\n**AlphaFold encodes the principles to identify high affinity peptide binders.**. \nLiwei Chang, Alberto Perez.  \n*Preprint, March 2022.*\n[[10.1101\u002F2022.03.18.484931](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.03.18.484931)]\n\n**Leveraging nonstructural data to predict structures and affinities of protein–ligand complexes.**  \nJoseph M. Paggi, Julia A. Belk, Scott A. Hollingsworth, Nicolas Villanueva, Alexander S. Powers, Mary J. Clark, Augustine G. Chemparathy, Jonathan E. Tynan, Thomas K. Lau, Roger K. Sunahara, and Ron O. Dror.  \n*PNAS, December 2021.*  \n[[10.1073\u002Fpnas.2112621118](https:\u002F\u002Fdoi.org\u002F10.1073\u002Fpnas.2112621118)]\n\n**AlphaFill: enriching the AlphaFold models with ligands and co-factors.**  \nMaarten L Hekkelman, Ida de de Vries, Robbie P Joosten, Anastassis Perrakis.  \n*Preprint, November 2021.*  \n[[10.1101\u002F2021.11.26.470110](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.11.26.470110)]\n\n**Deep learning allows genome-scale prediction of Michaelis constants from structural features.**  \nAlexander Kroll, Martin K. M. Engqvist, David Heckmann, Martin J. Lercher.  \n*PLoS Biology, October 2021*  \n[[10.1371\u002Fjournal.pbio.3001402](https:\u002F\u002Fdoi.org\u002F10.1371\u002Fjournal.pbio.3001402)]\n\n**Probing T-cell response by sequence-based probabilistic modeling.**. \nBarbara Bravi, Vinod P. Balachandran, Benjamin D. Greenbaum, Aleksandra M. Walczak, Thierry Mora, Rémi Monasson, Simona Cocco.  \n*PLOS Computational Biology, September 2021.*    \n[[10.1371\u002Fjournal.pcbi.1009297](https:\u002F\u002Fdoi.org\u002F10.1371\u002Fjournal.pcbi.1009297)]\n\n**Biologically relevant transfer learning improves transcription factor binding prediction.**  \nGherman Novakovsky, Manu Saraswat, Oriol Fornes, Sara Mostafavi & Wyeth W. Wasserman.   \n*Genome Biology, September 2021.*  \n[[10.1186\u002Fs13059-021-02499-5](https:\u002F\u002Fdoi.org\u002F10.1186\u002Fs13059-021-02499-5)]\n\n**Deep learning based kcat prediction enables improved enzyme constrained model reconstruction.**  \nFeiran Li, Le Yuan, Hongzhong Lu, Gang Li, Yu Chen, Martin K. M. Engqvist, Eduard J Kerkhoven, Jens Nielsen.  \n*Preprint, August 2021*  \n[[10.1101\u002F2021.08.06.455417 ](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.08.06.455417 )]\n\n**A billion synthetic 3D-antibody-antigen complexes enable unconstrained machine-learning formalized investigation of antibody specificity prediction.**. \nPhilippe A. Robert,Rahmad Akbar,Robert Frank,Milena Pavlović,Michael Widrich,Igor Snapkov,Maria Chernigovskaya,Lonneke Scheffer,Andrei Slabodkin,Brij Bhushan Mehta, Mai Ha Vu, Aurél Prósz, Krzysztof Abram, Alex Olar,Enkelejda Miho, Dag Trygve Tryslew Haug,Fridtjof Lund-Johansen,Sepp Hochreiter, Ingrid Hobæk Haff,Günter Klambauer,Geir K. Sandve,Victor Greiff.  \n*Preprint, July 2021.*    \n[[10.1101\u002F2021.07.06.451258](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.07.06.451258)]\n\n**Leveraging Sequential and Spatial Neighbors Information by Using CNNs Linked With GCNs for Paratope Prediction.**  \nShuai Lu, Yuguang Li, Fei Wang, Xiaofei Nan, Shoutao Zhang.  \n* IEEE\u002FACM Transactions on Computational Biology and Bioinformatics, May 2021.*  \n[[10.1109\u002FTCBB.2021.3083001](https:\u002F\u002Fdoi.org\u002F10.1109\u002FTCBB.2021.3083001)]\n\n**Neural message passing for joint paratope-epitope prediction.**  \nAlice Del Vecchio, Andreea Deac, Pietro Liò, Petar Veličković.  \n*Preprint, May 2021.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2106.00757)]\n\n**Interpreting Neural Networks for Biological Sequences by Learning Stochastic Masks.**  \nJohannes Linder, Alyssa La Fleur, Zibo Chen, Ajasja Ljubetič, David Baker, Sreeram Kannan, Georg Seelig.  \n*Preprint, April 2021.*  \n[[10.1101\u002F2021.04.29.441979](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.04.29.441979)]\n\n**GraphProt2: A graph neural network-based method for predicting binding sites of RNA-binding proteins.**  \nMichael Uhl, Van Dinh Tran, Florian Heyl, Rolf Backofen.  \n*Preprint, March 2021.*  \n[[10.1101\u002F850024](https:\u002F\u002Fdoi.org\u002F10.1101\u002F850024)]\n\n**Using the antibody-antigen binding interface to train image-based deep neural networks for antibody-epitope classification.**  \nDaniel R. Ripoll, Sidhartha Chaudhury, Anders Wallqvist.  \n*PLOS Computational Biology, March 2021.*  \n[[10.1371\u002Fjournal.pcbi.1008864](https:\u002F\u002Fdoi.org\u002F10.1371\u002Fjournal.pcbi.1008864)]\n\n**A multitask transfer learning framework for novel virus-human protein interactions.**  \nNgan Thi Dong, Megha Khosla.  \n*Preprint, March 2021.*  \n[[10.1101\u002F2021.03.25.437037](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.03.25.437037)]\n\n**EGRET: Edge Aggregated Graph Attention Networks and Transfer Learning Improve Protein-Protein Interaction Site Prediction.**  \nSazan Mahbub, Md Shamsuzzoha Bayzid.  \n*Preprint, February 2021.*  \n[[10.1101\u002F2020.11.07.372466](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.11.07.372466)]\n\n**Towards a systematic characterization of protein complex function: a natural language processing and machine-learning framework.**  \nVarun S. Sharma, Andrea Fossati, Rodolfo Ciuffa, Marija Buljan, Evan G. Williams, Zhen Chen, Wenguang Shao, Patrick G. A. Pedrioli, Anthony W. Purcell, María Rodríguez Martínez, … Chen Li. \n*Preprint, February 2021.*  \n[[10.1101\u002F2021.02.24.432789](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.02.24.432789)]\n\n**Capsule network for protein ubiquitination site prediction.**  \nQiyi Huang, Jiulei Jiang, Yin Luo, Weimin Li, Ying Wang.  \n*Preprint, January 2021.*  \n[[10.1101\u002F2021.01.07.425697](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.01.07.425697)]\n\n**Accurate neoantigen prediction depends on mutation position relative to patient allele-specific MHC anchor location.**  \nHuiming Xia, Joshua F. McMichael, Suangson Supabphol, Megan M. Richters, Anamika Basu, Cody A. Ramirez, Cristina Puig-Saus, Kelsy C. Cotto, Jasreet Hundal, Susanna Kiwala, … Malachi Griffith.  \n*Preprint, December 2020.*  \n[[10.1101\u002F2020.12.08.416271](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.12.08.416271)]\n\n**DeepPurpose: a deep learning library for drug–target interaction prediction.**  \nKexin Huang, Tianfan Fu, Lucas M. Glass, Marinka Zitnik, Cao Xiao, Jimeng Sun.  \n*Bioinformatics, December 2020.*  \n[[10.1093\u002Fbioinformatics\u002Fbtaa1005](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbtaa1005)]\n\n**Substrate specificity of 2-deoxy-D-ribose 5-phosphate aldolase (DERA) assessed by different protein engineering and machine learning methods.**  \nSanni Voutilainen, Markus Heinonen, Martina Andberg, Emmi Jokinen, Hannu Maaheimo, Johan Pääkkönen, Nina Hakulinen, Juha Rouvinen, Harri Lähdesmäki, Samuel Kaski, Juho Rousu, Merja Penttilä & Anu Koivula.   \n*Applied Microbiology and Biotechnology, November 2020.*  \n[[10.1007\u002Fs00253-020-10960-x](https:\u002F\u002Fdoi.org\u002F10.1007\u002Fs00253-020-10960-x)]\n\n**BERTMHC: Improves MHC-peptide class II interaction prediction with transformer and multiple instance learning.**  \nJun Cheng, Kaïdre Bendjama, Karola Rittner, Brandon Malone.  \n*Preprint, November 2020.*  \n[[10.1101\u002F2020.11.24.396101](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.11.24.396101)]\n\n\n**Predicting Cell-Penetrating Peptides: Building and Interpreting Random Forest based prediction Models.**  \nShilpa Yadahalli, Chandra S. Verma.  \n *Preprint, October 2020.*  \n[[10.1101\u002F2020.10.15.341149](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.10.15.341149)]\n\n**Struct2Graph: A graph attention network for structure based predictions of protein-protein interactions.**  \nMayank Baranwal, Abram Magner, Jacob Saldinger, Emine S. Turali-Emre, Shivani Kozarekar, Paolo Elvati, J. Scott VanEpps, Nicholas A. Kotov, Angela Violi, Alfred O. Hero.  \n*Preprint, September 2020.*  \n[[10.1101\u002F2020.09.17.301200](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.09.17.301200)]\n\n**Predicting antigen specificity of single T cells based on TCR CDR3 regions.**  \nDavid S Fischer, Yihan Wu, Benjamin Schubert, Fabian J Theis.  \n*Molecular Systems Biology, August 2020.*  \n[[10.15252\u002Fmsb.20199416](https:\u002F\u002Fdoi.org\u002F10.15252\u002Fmsb.20199416)]\n\n**DeepKinZero: zero-shot learning for predicting kinase–phosphosite associations involving understudied kinases.**  \nIman Deznabi, Busra Arabaci, Mehmet Koyutürk, Oznur Tastan.  \n*Bioinformatics, June 2020.*  \n[[10.1093\u002Fbioinformatics\u002Fbtaa013](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbtaa013)]\n\n**EpiDope: A Deep neural network for linear B-cell epitope prediction.**  \nMaximilian Collatz, Florian Mock, Martin Hölzer, Emanuel Barth, Konrad Sachse, Manja Marz.  \n*Preprint, May 2020.*  \n[[10.1101\u002F2020.05.12.090019](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.05.12.090019)]\n\n**Site2Vec: a reference frame invariant algorithm for vector embedding of protein-ligand binding sites.**  \nArnab Bhadra, Kalidas Y.  \n*Preprint, March 2020.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2003.08149v1)]\n\n**Energy-based graph convolutional networks for scoring protein docking models.**  \nYue Cao, Yang Shen.  \n*Proteins: Structure, Function, and Bioinformatics, 2020.*  \n[[10.1002\u002Fprot.25888](https:\u002F\u002Fdoi.org\u002F10.1002\u002Fprot.25888)]\n\n**Mutation effect estimation on protein-protein interactions using deep contextualized representation learning**  \nGuangyu Zhou, Muhao Chen, Chelsea J.-T. Ju, Zheng Wang, Jyun-Yu Jiang, Wei Wang.  \n*NAR Genomics and Bioinformatics, March 2020*  \n[[10.1093\u002Fnargab\u002Flqaa015](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fnargab\u002Flqaa015)]  \n\n**Biophysical prediction of protein–peptide interactions and signaling networks using machine learning.**  \nJoseph M. Cunningham, Grigoriy Koytiger, Peter K. Sorger & Mohammed AlQuraishi.  \n*Nature Methods, January 2020.*  \n[[10.1038\u002Fs41592-019-0687-1](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41592-019-0687-1)]\n\n**Functions of olfactory receptors are decoded from their sequence.**  \nXiaojing Cong, Wenwen Ren, Jody Pacalon, Claire A. de March, Lun Xu, Hiroaki Matsunami, Yiqun Yu, Jérôme Golebiowski.  \n*Preprint, January 2020.*  \n[[10.1101\u002F2020.01.06.895540](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.01.06.895540)]\n\n**Sequence-to-function deep learning frameworks for synthetic biology.**  \nJacqueline Valeri, Katherine M. Collins, Bianca A. Lepe, Timothy K. Lu, Diogo M. Camacho.  \n*Preprint, December 2019.*  \n[[10.1101\u002F870055](https:\u002F\u002Fdoi.org\u002F10.1101\u002F870055)]\n\n**Explainable Deep Relational Networks for Predicting Compound-Protein Affinities and Contacts.**  \nMostafa Karimi, Di Wu, Zhangyang Wang, Yang Shen.  \n*Preprint, December 2019.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F1912.12553v1)]\n\n**Using Single Protein\u002FLigand Binding Models to Predict Active Ligands for Previously Unseen Proteins**.  \nVikram Sundar, Lucy Colwell.  \n*NeurIPS Workshop on Machine Learning and the Physical Sciences, December 2019.*  \n[[ML4PS](https:\u002F\u002Fml4physicalsciences.github.io\u002Ffiles\u002FNeurIPS_ML4PS_2019_66.pdf)]\n\n**Deciphering interaction fingerprints from protein molecular surfaces using geometric deep learning.**  \nP. Gainza, F. Sverrisson, F. Monti, E. Rodolà, D. Boscaini, M. M. Bronstein, B. E. Correia.  \n*Nature Methods, December 2019.*  \n[[10.1038\u002Fs41592-019-0666-6](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41592-019-0666-6)]\n\n**End-to-End Learning on 3D Protein Structure for Interface Prediction**  \nRaphael J. L. Townshend, Rishi Bedi, Patricia A. Suriana, Ron O. Dror.  \n*NeurIPS, December 2019.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F1807.01297)]\n\n**USMPep: Universal Sequence Models for Major Histocompatibility Complex Binding Affinity Prediction.**  \nJohanna Vielhaben, Markus Wenzel, Wojciech Samek, Nils Strodthoff.  \n*Preprint, October 2019.* \n[[10.1101\u002F816546](https:\u002F\u002Fdoi.org\u002F10.1101\u002F816546)]\n\n**DeepCLIP: Predicting the effect of mutations on protein-RNA binding with Deep Learning.**  \nAlexander Gulliver Bjørnholt Grønning, Thomas Koed Doktor, Simon Jonas Larsen, Ulrika Simone Spangsberg Petersen, Lise Lolle Holm, Gitte Hoffmann Bruun, Michael Birkerod Hansen, Anne-Mette Hartung, Jan Baumbach, Brage Storstein Andresen.  \n*Preprint, September 2019.*  \n[[10.1101\u002F757062](https:\u002F\u002Fdoi.org\u002F10.1101\u002F757062)] \n\n**Multifaceted protein–protein interaction prediction based on Siamese residual RCNN**  \nMuhao Chen, Chelsea J.-T. Ju, Guangyu Zhou, Xuelu Chen, Tianran Zhang, Kai-Wei Chang, Carlo Zaniolo, Wei Wang.  \n*Bioinformatics, July 2019. (Procs. ISMB\u002FECCB-2019)*  \n[[10.1093\u002Fbioinformatics\u002Fbtz328](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbtz328)]  \n\n**DeepConv-DTI: Prediction of drug-target interactions via deep learning with convolution on protein sequences.**  \nIngoo Lee, Jongsoo Keum, Hojung Nam.  \n*PLOS Computational Biology, June 2019.*  \n[[10.1371\u002Fjournal.pcbi.1007129](https:\u002F\u002Fdoi.org\u002F10.1371\u002Fjournal.pcbi.1007129)]\n\n**Leveraging binding-site structure for drug discovery with point-cloud methods.**  \nVincent Mallet, Carlos G. Oliver, Nicolas Moitessier, Jerome Waldispuhl.  \n*Preprint, May 2019.*  \n[[arXiV]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1905.12033)]\n\n**Repertoires of G protein-coupled receptors for Ciona-specific neuropeptides.**  \nAkira Shiraishi, Toshimi Okuda, Natsuko Miyasaka, Tomohiro Osugi, Yasushi Okuno, Jun Inoue, and Honoo Satake.  \n*PNAS, March 2019.*  \n[[10.1073\u002Fpnas.1816640116]( https:\u002F\u002Fdoi.org\u002F10.1073\u002Fpnas.1816640116)]\n\n**Simple tricks of convolutional neural network architectures improve DNA–protein binding prediction.**  \nZhen Cao, Shihua Zhang.  \n*Bioinformatics, October 2018.*  \n[[10.1093\u002Fbioinformatics\u002Fbty893](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbty893)\n\n**MHCflurry: Open-Source Class I MHC Binding Affinity Prediction.**  \nTimothy J. O'Donnell, Alex Rubinsteyn, Maria Bonsack, Angelika B. Riemer, Uri Laserson, Jeff Hammerbacher.  \n*Cell Systems, June 2018.*  \n[[10.1016\u002Fj.cels.2018.05.014](https:\u002F\u002Fdoi.org\u002F10.1016\u002Fj.cels.2018.05.014)]\n\n**P2Rank: machine learning based tool for rapid and accurate prediction of ligand binding sites from protein structure.**    \nRadoslav Krivak, David Hoksza.  \n*Journal of Cheminformatics, August 2018*.  \n[[10.1186\u002Fs13321-018-0285-8](https:\u002F\u002Fdoi.org\u002F10.1186\u002Fs13321-018-0285-8)]  \n\n**DeepMHC: Deep Convolutional Neural Networks for High-performance peptide-MHC Binding Affinity Prediction.**  \nJianjun Hu, Zhonghao Liu.  \n*Preprint, December 2017.*  \n[[10.1101\u002F239236](https:\u002F\u002Fdoi.org\u002F10.1101\u002F239236)] [[bioRxiv](https:\u002F\u002Fwww.biorxiv.org\u002Fcontent\u002F10.1101\u002F239236v1)]\n\n**DeepSite: protein-binding site predictor using 3D-convolutional neural networks.**  \nJ, Jiménez. S. Doerr, G. Martínez-Rosell, A. S. Rose, G. De Fabritiis.  \n*Bioinformatics, October 2017.*  \n[[10.1093\u002Fbioinformatics\u002Fbtx350](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbtx350)]\n\n**Predicting Protein Binding Affinity With Word Embeddings and Recurrent Neural Networks.**  \nCarlo Mazzaferro.  \n*Preprint, April 2017.*    \n[[10.1101\u002F128223](https:\u002F\u002Fdoi.org\u002F10.1101\u002F128223)] [[bioRxiv](https:\u002F\u002Fwww.biorxiv.org\u002Fnode\u002F37703.abstract)]\n\n**Atomic Convolutional Networks for Predicting Protein-Ligand Binding Affinity.**  \nJoseph Gomes, Bharath Ramsundar, Evan N. Feinberg, Vijay S. Pande.  \n*Preprint, March 2017.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F1703.10603)]\n\n**Convolutional neural network architectures for predicting DNA–protein binding.**  \nHaoyang Zeng, Matthew D. Edwards. Ge Liu, David K. Gifford.  \n*Bioinformatics, 15 June 2016.*  \n[[10.1093\u002Fbioinformatics\u002Fbtw255](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbtw255)]\n\n**A deep learning framework for modeling structural features of RNA-binding protein targets.**  \nSai Zhang, Jingtian Zhou, Hailin Hu, Haipeng Gong, Ligong Chen, Chao Cheng, Jianyang Zeng.  \n*Nucleic Acids Research, October 2015.*  \n[[10.1093\u002Fnar\u002Fgkv1025](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fnar\u002Fgkv1025)]\n\n**Predicting the sequence specificities of DNA- and RNA-binding proteins by deep learning.**  \nBabak Alipanahi, Andrew Delong, Matthew T. Weirauch, Brendan J. Frey.  \n*Nature Biotechnology, July 2015.*  \n[[10.1038\u002Fnbt.3300](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fnbt.3300)]\n\n**Protein-protein docking using learned three-dimensional representations.**  \nGeorgy Derevyanko, Guillaume Lamoureux.  \n*Preprint, March 2017.*  \n[[10.1101\u002F738690](https:\u002F\u002Fdoi.org\u002F10.1101\u002F738690)][[bioRxiv](https:\u002F\u002Fwww.biorxiv.org\u002Fcontent\u002F10.1101\u002F738690v2)]\n\n\n### Other supervised learning\n\n**A protein sequence-based deep transfer learning framework for identifying human proteome-wide deubiquitinase-substrate interactions.**   \nYuan Liu, Dianke Li, Xin Zhang, Simin Xia, Yingjie Qu, Xinping Ling, Yang Li, Xiangren Kong, Lingqiang Zhang, Chun-Ping Cui & Dong Li.  \n*Nature Communications, May 2024.*  \n[[10.1038\u002Fs41467-024-48446-3](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41467-024-48446-3)]\n\n**TransMEP: Transfer learning on large protein language models to predict mutation effects of proteins from a small known dataset.**   \nTilman Hoffbauer, Birgit Strodel.  \n*Preprint, January 2024.*  \n[[10.1101\u002F2024.01.12.575432](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2024.01.12.575432)]\n\n**The simplicity of protein sequence-function relationships.**  \nYeonwoo Park, Brian P.H. Metzger, Joseph W. Thornton.  \n*Preprint, September 2023.*  \n[[10.1101\u002F2023.09.02.556057](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.09.02.556057)]\n\n**Deep learning-based codon optimization with large-scale synonymous variant datasets enables generalized tunable protein expression.**  \nDavid A. Constant, Jahir M. Gutierrez, Anand V. Sastry, Rebecca Viazzo, Nicholas R. Smith, Jubair Hossain, David A. Spencer, Hayley Carter, Abigail B. Ventura, Michael T. M. Louie, Christa Kohnert, Rebecca Consbruck, Joshua Bennett, Kenneth A. Crawford, John M. Sutton, Anneliese Morrison, Andrea K. Steiger, Kerianne A. Jackson, Jennifer T. Stanton, Shaheed Abdulhaqq, Gregory Hannum, Joshua Meier, Matthew Weinstock, Miles Gander.  \n*Preprint, Feb 2023.*  \n[[10.1101\u002F2023.02.11.528149](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.02.11.528149)]\n\n**Coherent Blending of Biophysics-Based Knowledge with Bayesian Neural Networks for Robust Protein Property Prediction.**  \nHunter Nisonoff, Yixin Wang, and Jennifer Listgarten.  \n*ACS Synthetic Biology, October 2023.*  \n[[10.1021\u002Facssynbio.3c00217](https:\u002F\u002Fdoi.org\u002F10.1021\u002Facssynbio.3c00217)]\n\n**FiTMuSiC: Leveraging structural and (co)evolutionary data for protein fitness prediction.**  \nMatsvei Tsishyn, Gabriel Cia, Pauline Hermans, Jean Kwasigroch, Marianne Rooman, Fabrizio Pucci.  \n*Preprint, August 2023.*  \n[[10.1101\u002F2023.08.01.551497](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.08.01.551497)]\n\n**Assessing the performance of protein regression models.**  \nRichard Michael, Jacob Kæstel-Hansen, Peter Mørch Groth, Simon Bartels, Jesper Salomon, Pengfei Tian, Nikos S. Hatzakis, Wouter K. Boomsma.  \n*Preprint, June 2023.*  \n[[10.1101\u002F2023.06.18.545472](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.06.18.545472)]\n\n**Interpretable neural architecture search and transfer learning for understanding sequence dependent enzymatic reactions.**   \nZijun Zhang, Adam R. Lamson, Michael Shelley, Olga Troyanskaya.  \n*Preprint, May 2023.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2305.11917)]\n\n**Protein language model-based end-to-end type II polyketide prediction without sequence alignment.**  \nJiaquan Huang, Qiandi Gao, Ying Tang, Yaxin Wu, Heqian Zhang, Zhiwei Qin.  \n*Preprint, April 2023.*  \n[[10.1101\u002F2023.04.18.537339](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.04.18.537339)]\n\n**Flattening the curve - How to get better results with small deep-mutational-scanning datasets.**  \nGregor Wirnsberger, Iva Pritišanac, Gustav Oberdorfer, Karl Gruber.  \n*Preprint, March 2023.*  \n[[10.1101\u002F2023.03.27.534314](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.03.27.534314)]\n\n**Prediction and Design of Protease Enzyme Specificity Using a Structure-Aware Graph Convolutional Network.**  \nChangpeng Lu, Joseph H. Lubin, Vidur V. Sarma, Samuel Z. Stentz, Guanyang Wang, Sijian Wang, Sagar D. Khare.  \n*Preprint, February 2023.*  \n[[10.1101\u002F2023.02.16.528728](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.02.16.528728)]\n\n**Linear-scaling kernels for protein sequences and small molecules outperform deep learning while providing uncertainty quantitation and improved interpretability.**  \nJonathan Parkinson, Wei Wang.  \n*Preprint, February 2023.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2302.03294)]\n\n**Turnover number predictions for kinetically uncharacterized enzymes using machine and deep learning.**  \nAlexander Kroll, Xiao-Pan Hu, Nina A. Liebrand, Martin J. Lercher.  \n*Preprint, November 2022.*  \n[[10.1101\u002F2022.11.10.516024](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.11.10.516024)]\n\n**PrMFTP: Multi-functional therapeutic peptides prediction based on multi-head self-attention mechanism and class weight optimization.**  \nWenhui Yan ,Wending Tang ,Lihua Wang,Yannan Bin ,Junfeng Xia.  \n*PLOS Comp Bio, September 2022.*  \n[[10.1371\u002Fjournal.pcbi.1010511](https:\u002F\u002Fdoi.org\u002F10.1371\u002Fjournal.pcbi.1010511)]\n\n**Learning with phenotypic similarity improves the prediction of functional effects of missense variants in voltage-gated sodium channels.**  \nChristian Malte Boßelmann, Ulrike B.S. Hedrich,  Holger Lerche, Nico Pfeifer.  \n*Preprint, September 2022.*  \n[[10.1101\u002F2022.09.29.510111](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.09.29.510111)]\n\n**A synthetic protein-level neural network in mammalian cells.**  \nZibo Chen, James M. Linton, Ronghui Zhu, Michael B. Elowitz.  \n*Preprint, July 2022.*  \n[[10.1101\u002F2022.07.10.499405](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.07.10.499405)]\n\n**Protein structure prediction in the era of AI: challenges and limitations when applying to in-silico force spectroscopy.**  \nPriscila S. F. C. Gomes, Diego E. B. Gomes, Rafael C. Bernardi.  \n*Preprint, July 2022.*  \ndoi: https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.06.30.498329\n\n**A synthetic protein-level neural network in mammalian cells.**  \nZibo Chen, James M Linton, Ronghui Zhu, Michael Elowitz.  \n*Preprint, July 2022.*  \n[[10.1101\u002F2022.07.10.499405](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.07.10.499405)]\n\n**PRESTO: Rapid protein mechanical strength prediction with an end-to-end deep learning model.**  \nFrank Y.C.Liu, Bo Ni, Markus J.Buehler.  \n*Extreme mechanics letters, August 2022.*  \n[[10.1016\u002Fj.eml.2022.101803](https:\u002F\u002Fdoi.org\u002F10.1016\u002Fj.eml.2022.101803)]\n\n**Deep learning-based kcat prediction enables improved enzyme-constrained model reconstruction.**  \nFeiran Li, Le Yuan, Hongzhong Lu, Gang Li, Yu Chen, Martin K. M. Engqvist, Eduard J. Kerkhoven, Jens Nielsen.  \n*Nature Catalysis, June 2022.*  \n[[10.1038\u002Fs41929-022-00798-z](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41929-022-00798-z)]\n\n**A Topological Data Analytic Approach for Discovering Biophysical Signatures in Protein Dynamics.**  \nWai Shing Tang, Gabriel Monteiro da Silva, Henry Kirveslahti, Erin Skeens, Bibo Feng, Timothy Sudijono, Kevin K Yang, Sayan Mukherjee, Brenda Rubenstein, Lorin Crawford.  \n*PLoS Computational Biology, May 2022.*  \n[[10.1371\u002Fjournal.pcbi.1010045](https:\u002F\u002Fdoi.org\u002F10.1371\u002Fjournal.pcbi.1010045)]\n\n**Neural networks to learn protein sequence–function relationships from deep mutational scanning data.**  \nSam Gelman, Sarah A. Fahlberg, Pete Heinzelman, Philip A. Romero, and Anthony Gitter.  \n*PNAS, November 2021.*  \n[[10.1073\u002Fpnas.2104878118](https:\u002F\u002Fdoi.org\u002F10.1073\u002Fpnas.2104878118)]\n\n**Multiscale profiling of enzyme activity in cancer.**  \nAva P. Soleimany, Jesse D. Kirkpatrick, Cathy S. Wang, Alex M. Jaeger, Susan Su, Santiago Naranjo, Qian Zhong, Christina M. Cabana, Tyler Jacks, Sangeeta N. Bhatia.  \n*Preprint, November 2021.*  \n[[10.1101\u002F2021.11.11.468288](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.11.11.468288)]\n\n**Epistatic Net allows the sparse spectral regularization of deep neural networks for inferring fitness functions.**  \nAmirali Aghazadeh, Hunter Nisonoff, Orhan Ocal, David H. Brookes, Yijie Huang, O. Ozan Koyluoglu, Jennifer Listgarten & Kannan Ramchandran.   \n*Nature Communications, September 2021.*  \n[[10.1038\u002Fs41467-021-25371-3](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41467-021-25371-3)]\n\n**AllerStat: Finding Statistically Significant Allergen-Specific Patterns in Protein Sequences by Machine Learning.**  \nKento Goto, Norimasa Tamehiro, Takumi Yoshida, Hiroyuki Hanada, Takuto Sakuma, Reiko Adachi, Kazunari Kondo, Ichiro Takeuchi.  \n*Preprint, August 2021.*  \n[[10.1101\u002F2021.08.17.456743](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.08.17.456743)] \n\n**A Topological Data Analytic Approach for Discovering Biophysical Signatures in Protein Dynamics.**  \nWai Shing Tang, Gabriel Monteiro da Silva, Henry Kirveslahti, Erin Skeens, Bibo Feng, Timothy Sudijono, Kevin K Yang, Sayan Mukherjee, Brenda Rubenstein, Lorin Crawford.  \n*Preprint, July 2021.*  \n[[10.1101\u002F2021.07.28.454240](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.07.28.454240)]\n\n**Performance of Regression Models as a Function of Experiment Noise.**  \nGang Li, Jan Zrimec, Boyang Ji, Jun Geng, Johan Larsbrink, Aleksej Zelezniak, Jens Nielsen, Martin K. M. Engqvist.  \n*Bioinformatics and Biology Insights, June 2021.*  \n[[10.1177\u002F11779322211020315](https:\u002F\u002Fdoi.org\u002F10.1177\u002F11779322211020315)]\n\n**In-Pero: Exploiting deep learning embeddings of protein sequences to predict the localisation of peroxisomal proteins.**  \nMarco Anteghini, Vitor AP Martins dos Santos, Edoardo Saccenti.  \n*International Journal of Molecular Sciences, June 2021.*  \n[[10.3390\u002Fijms22126409](https:\u002F\u002Fdoi.org\u002F10.3390\u002Fijms22126409)]\n\n**Predicting and interpreting large scale mutagenesis data using analyses of protein stability and conservation.**  \nMagnus H. Høie, Matteo Cagiada, Anders Haagen Beck Frederiksen, Amelie Stein, Kresten Lindorff-Larsen.  \n*Preprint, June 2021.*  \n[[10.1101\u002F2021.06.26.450037](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.06.26.450037)]\n\n**Machine learning differentiates enzymatic and non-enzymatic metals in proteins.**  \nRyan Feehan, Meghan W. Franklin, Joanna S. G. Slusky.  \n*Nature Communications, June 2021.*  \n[[10.1038\u002Fs41467-021-24070-3](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41467-021-24070-3)]\n\n**Assessing the performance of computational predictors for estimating protein stability changes upon missense mutations.**  \nShahid Iqbal, Fuyi Li, Tatsuya Akutsu, David B Ascher, Geoffrey I Webb, Jiangning Song.  \n*Briefings in Bioinformatics, May 2021.*  \n[[10.1093\u002Fbib\u002Fbbab184](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbib\u002Fbbab184)]\n\n**Predicting enzymatic reactions with a molecular transformer.**  \nDavid Kreutter, Philippe Schwaller, Jean-Louis Reymond.  \n*Chemical Science, May 2021.*  \n[[10.1039\u002FD1SC02362D](https:\u002F\u002Fdoi.org\u002F10.1039\u002FD1SC02362D)]\n\n**On the sparsity of fitness functions and implications for learning.**  \nDavid H. Brookes, Amirali Aghazadeh, Jennifer Listgarten.  \n*Preprint, May 2021.*  \n[[10.1101\u002F2021.05.24.445506](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.05.24.445506)]\n\n**Deep protein representations enable recombinant protein expression prediction**.  \nHannah-Marie Martiny, Jose Juan Almagro Armenteros, Alexander Rosenberg Johansen, Jesper Salomon, Henrik Nielsen.  \n*Preprint, May 2021.*  \n[[10.1101\u002F2021.05.13.443426](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.05.13.443426)]\n\n**Deep learning tools and modeling to estimate the temporal expression of cell cycle proteins from 2D still images.**\nThierry Pécot, Maria C. Cuitiño, Roger H. Johnson, Cynthia Timmers, Gustavo Leone.  \n*Preprint, April 2021.*  \n[[10.1101\u002F2021.03.01.433386](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.03.01.433386)]\n\n**Light Attention Predicts Protein Location from the Language of Life.**  \nHannes Stärk, Christian Dallago, Michael Heinzinger, Burkhard Rost.  \n*Preprint, April 2021.*  \n[[10.1101\u002F2021.04.25.441334](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.04.25.441334)]\n\n**Positional SHAP (PoSHAP) for Interpretation of Machine Learning Models Trained from Biological Sequences.**  \nQuinn Dickinson, Jesse G. Meyer.  \n*Preprint, March 2021.*  \n[[10.1101\u002F2021.03.04.433939](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.03.04.433939)]\n\n**Modeling mutational effects on biochemical phenotypes using convolutional neural networks: application to SARS-CoV-2.**  \nBo Wang, Eric R. Gamazon.  \n*Preprint, February 2021.*  \n[[10.1101\u002F2021.01.28.428521](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.01.28.428521)]\n\n**Identifying protein subcellular localisation in scientific literature using bidirectional deep recurrent neural network.**  \nRakesh David, Rhys-Joshua D. Menezes, Jan De Klerk, Ian R. Castleden, Cornelia M. Hooper, Gustavo Carneiro & Matthew Gilliham.   \n*Scientific Reports, January 2021.*  \n[[10.1038\u002Fs41598-020-80441-8](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41598-020-80441-8)]\n\n**DeepPSC (protein structure camera): computer vision-based reconstruction of proteins backbone structure from alpha carbon trace as a case study.**  \nXing Zhang, Junwen Luo, Yi Cai, Wei Zhu, Xiaofeng Yang, Hongmin Cai, Zhanglin Lin.  \n*Preprint, August 2020.*  \n[[10.1101\u002F2020.08.12.247312](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.08.12.247312)]\n\n**TransINT: an interface-based prediction of membrane protein-protein interactions.**  \nG. Khazen, A. Gyulkhandanian, T. Issa, R.C. Maroun.  \n*Preprint, July 2020.*  \n[[10.1101\u002F871590](https:\u002F\u002Fdoi.org\u002F10.1101\u002F871590)]\n\n**DeepEMhancer: a deep learning solution for cryo-EM volume post-processing.**  \nR Sanchez-Garcia, J Gomez-Blanco, A Cuervo, JM Carazo, COS Sorzano, J Vargas.  \n*Preprint, June 2020.*  \n[[10.1101\u002F2020.06.12.148296](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.06.12.148296)]\n\n\n**ProtTox: Toxin identification from Protein Sequences.**  \nSathappan Muthiah, Debanjan Datta, Mohammad Raihanul Islam, Patrick Butler, Andrew Warren, Naren Ramakrishnan.  \n*Preprint, April 2020.*  \n[[10.1101\u002F2020.04.18.048439](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.04.18.048439)]\n\n**Predicting the Viability of Beta-Lactamase: How Folding and Binding Free Energies Correlate with Beta-Lactamase Fitness.**  \nJordan Yang, Nandita Naik, Jagdish Suresh Patel, Christopher S. Wylie, Wenze Gu, Jessie Huang, Marty Ytreberg, Mandar T. Naik, Daniel M. Weinreich, Brenda M. Rubenstein.  \n*Preprint, April 2020.*  \n[[10.1101\u002F2020.04.15.043661](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.04.15.043661)]\n\n**Classifying protein structures into folds by convolutional neural networks, distance maps, and persistent homology.**  \nYechan Hong, Yongyu Deng, Haofan Cui, Jan Segert, Jianlin Cheng.  \n*Preprint, April 2020.*  \n[[10.1101\u002F2020.04.15.042739](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.04.15.042739)]\n\n**Minimum epistasis interpolation for sequence-function relationships.**  \nJuannan Zhou, David M. McCandlish.  \n*Nature Communications, April 2020.*  \n[[10.7554\u002FeLife.16965.024](https:\u002F\u002Fdoi.org\u002F10.7554\u002FeLife.16965.024)]\n\n**Machine Learning to Identify Flexibility Signatures of Class A GPCR Inhibition.**  \nJoseph Bemister-Buffington, Alex J. Wolf, Sebastian Raschka, Leslie A. Kuhn.  \n*Biomolecules, March 2020.*  \n[[10.3390\u002Fbiom10030454](https:\u002F\u002Fdoi.org\u002F10.3390\u002Fbiom10030454)]\n\n**Extraction of Protein Dynamics Information Hidden in Cryo-EM Map Using Deep Learning.**  \nShigeyuki Matsumoto, Shoichi Ishida, Mitsugu Araki, Takayuki Kato, Kei Terayama, Yasushi Okuno.  \n*Preprint, February 2020.*  \n[[10.1101\u002F2020.02.17.951863](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.02.17.951863)]\n\n**Transformer neural network for protein specific de novo drug generation as machine translation problem.**  \nDaria Grechishnikova.  \n*Preprint, December 2019.*  \n[[10.1101\u002F863415](https:\u002F\u002Fdoi.org\u002F10.1101\u002F863415)]\n\n**Iterative Peptide Modeling With Active Learning And Meta-Learning.**  \nRainier Barrett, Andrew D. White.  \n*Preprint, November 2019.*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F1911.09103)]\n\n**Deep convolutional neural network and attention mechanism based pan-specific model for interpretable MHC-I peptide binding prediction.**  \nJing Jin, Zhonghao Liu, Alireza Nasiri, Yuxin Cui, Stephen Louis, Ansi Zhang, Yong Zhao, Jianjun Hu.  \n*Preprint, November 2019.*  \n[[10.1101\u002F830737](https:\u002F\u002Fdoi.org\u002F10.1101\u002F830737)]\n\n**BCrystal: an interpretable sequence-based protein crystallization predictor.**  \nAbdurrahman Elbasir, Raghvendra Mall, Khalid Kunji, Reda Rawi, Zeyaul Islam, Gwo-Yu Chuang, Prasanna R Kolatkar, Halima Bensmail. \n*Bioinformatics, October 2019.*  \n[[10.1093\u002Fbioinformatics\u002Fbtz762](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbtz762)]\n\n**Deep learning regression model for antimicrobial peptide design.**  \nJacob Witten, Zack Witten.  \n*Preprint, July 2019.*  \n[\u002F10.1101\u002F692681](https:\u002F\u002Fdoi.org\u002F10.1101\u002F692681)] [[bioRxiv](https:\u002F\u002Fwww.biorxiv.org\u002Fcontent\u002F10.1101\u002F692681v1)]\n\n**Using machine learning to predict organismal growth temperatures from protein primary sequences.**  \nDavid B. Sauer, Da-Neng Wang.  \n*Preprint, June 2019.*  \n[[10.1101\u002F677328](https:\u002F\u002Fdoi.org\u002F10.1101\u002F677328)] [[bioRxiv](https:\u002F\u002Fwww.biorxiv.org\u002Fcontent\u002F10.1101\u002F677328v1?rss=1)]\n\n**SolXplain: An Explainable Sequence-Based Protein Solubility Predictor.**  \nRaghvendra Mall.  \n*Preprint, May 2019.*  \n[[10.1101\u002F651067](https:\u002F\u002Fdoi.org\u002F10.1101\u002F651067)] [[bioRxiv](https:\u002F\u002Fwww.biorxiv.org\u002Fcontent\u002F10.1101\u002F651067v1)]\n\n**High precision protein functional site detection using 3D convolutional neural networks.**  \nWen Torng, Russ B Altman.  \n*Bioinformatics, May 2019.*  \n[[10.1093\u002Fbioinformatics\u002Fbty813](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbty813)]\n\n**Develop machine learning-based regression predictive models for engineering protein solubility.**  \nXi Han, Xiaonan Wang, Kang Zhou.  \n*Bioinformatics, April 2019.*  \n[[10.1093\u002Fbioinformatics\u002Fbtz294](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbtz294)]\n\n**DeepCrystal: a deep learning framework for sequence-based protein crystallization prediction.**  \nAbdurrahman Elbasir, Balasubramanian Moovarkumudalvan, Khalid Kunji, Prasanna R Kolatkar, Raghvendra Mall, Halima Bensmail.  \n*Bioinformatics, November 2018.*  \n[[10.1093\u002Fbioinformatics\u002Fbty953](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbty953)]\n\n**DeepSol: a deep learning framework for sequence-based protein solubility prediction.**  \nSameer Khurana, Reda Rawi, Khalid Kunji, Gwo-Yu Chuang, Halima Bensmail, Raghvendra Mall.  \n*Bioinformatics, March 2018.*   \n[[10.1093\u002Fbioinformatics\u002Fbty166](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbty166)]\n\n**A statistical model for improved membrane protein expression using sequence-derived features.**  \nShyam M. Saladi, Nauman Javed, Axel Müller, William M. Clemons, Jr.  \n*Journal of Biological Chemistry, March 2018.*  \n[[10.1074\u002Fjbc.RA117.001052](https:\u002F\u002Fdoi.org\u002F10.1074\u002Fjbc.RA117.001052)]\n\n**Learning epistatic interactions from sequence-activity data to predict enantioselectivity.**  \nJulian Zaugg, Yosephine Gumulya, Alpeshkumar K. Malde, Mikael Bodén.  \n*Journal of Computer Aided Molecular Design, December 2017.*  \n[[10.1007\u002Fs10822-017-0090-x](https:\u002F\u002Fdoi.org\u002F10.1007\u002Fs10822-017-0090-x)]\n\n**Quantitative Missense Variant Effect Prediction Using Large-Scale Mutagenesis Data.**  \nVanessa E. Gray, Ronald J. Hause, Jens Luebeck, Jay Shendure, Douglas M. Fowler.  \n*Cell Systems, December 2017.*  \n[[10.1016\u002Fj.cels.2017.11.003](https:\u002F\u002Fdoi.org\u002F10.1016\u002Fj.cels.2017.11.003)]\n\n**DeepLoc: prediction of protein subcellular localization using deep learning.**  \nJose Juan Almagro Armenteros, Casper Kaae Sønderby, Søren Kaae Sønderby, Henrik Nielsen, Ole Winther.  \n*Bioinformatics, September 2017.*  \n[[10.1093\u002Fbioinformatics\u002Fbtx548](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbtx548)]\n\n**Semisupervised Gaussian Process for Automated Enzyme Search.**  \nJoseph Mellor, Ioana Grigoras, Pablo Carbonell, and Jean-Loup Faulon.  \n*ACS Synthetic Biology, March 2016.*  \n[[10.1021\u002Facssynbio.5b00294](https:\u002F\u002Fdoi.org\u002F10.1021\u002Facssynbio.5b00294)]\n\n**High Precision Prediction of Functional Sites in Protein Structures.**  \nLjubomir Buturovic, Mike Wong, Grace W. Tang, Russ B. Altman, Dragutin Petkovic.  \n*PLOS One, March 2014.*  \n[[10.1371\u002Fjournal.pone.0091240](https:\u002F\u002Fdoi.org\u002F10.1371\u002Fjournal.pone.0091240)]\n\n**Sequence Motifs in MADS Transcription Factors Responsible for Specificity and Diversification of Protein-Protein Interaction.**   \nAalt D. J. van Dijk, Giuseppa Morabito, Martijn Fiers, Roeland C. H. J. van Ham, Gerco C. Angenent, Richard G. H. Immink.  \n*PLOS Computational Biology, November 2010.*  \n[[10.1371\u002Fjournal.pcbi.1001017](https:\u002F\u002Fdoi.org\u002F10.1371\u002Fjournal.pcbi.1001017)]\n\n**Predicting and understanding transcription factor interactions based on sequence level determinants of combinatorial control.**  \nA.D.J. van Dijk, C.J.F. ter Braak, R.G. Immink, G.C. Angenent, R.C.H.J. van Ham.  \n*Bioinformatics, January 2008.*  \n[[10.1093\u002Fbioinformatics\u002Fbtm539](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbtm539)]\n\n**Deep convolutional networks for quality assessment of protein folds.**   \nGeorgy Derevyanko, Sergei Grudinin, Yoshua Bengio, Guillaume Lamoureux.   \n*Bioinformatics, December 2018.*   \n[[10.1093\u002Fbioinformatics\u002Fbty494](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbty494)][[ArXiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F1801.06252)]\n","## 蛋白质领域的机器学习论文\n\n### 背景\n\n我们最近发布了一篇关于蛋白质工程中机器学习方法的[综述](https:\u002F\u002Farxiv.org\u002Fabs\u002F1811.10775)，但该领域发展迅速，新论文层出不穷，任何静态文档都难免遗漏重要工作。此外，这种形式也使我们能够将范围扩展到工程以外的应用领域。我们希望这能成为对该领域感兴趣人士的有用资源。\n\n据我们所知，这是首个公开的、协作维护的蛋白质应用机器学习论文列表。我们尝试根据论文的应用场景和模型类型对其进行分类。如果您有其他论文或分类的建议，请提交拉取请求或创建议题！\n\n### 格式\n\n在每个类别中，论文按时间倒序排列（最新的排在前面）。在可能的情况下，应提供链接。\n\n### 类别\n\n[综述](#reviews)  \n[工具与数据集](#tools-and-datasets)  \n[机器学习引导的定向进化](#machine-learning-guided-directed-evolution)  \n[表示学习](#representation-learning)  \n[无监督变异预测](#unsupervised-variant-prediction)  \n[生成模型](#generative-models)  \n[生物物理](#biophysics)  \n[稳定性预测](#predicting-stability)  \n[从序列预测结构](#predicting-structure-from-sequence)  \n[从结构预测序列](#predicting-sequence-from-structure)  \n[分类、注释、搜索与比对](#classification-annotation-search-and-alignments)  \n[与其他分子相互作用的预测](#predicting-interactions-with-other-molecules)  \n[其他监督学习](#other-supervised-learning)\n\n### 综述\n\n**蛋白质工程中的机器学习。**  \nKadina E. Johnston, Clara Fannjiang, Bruce J. Wittmann, Brian L. Hie, Kevin K. Yang & Zachary Wu。  \n*分子科学中的机器学习，2023年10月。*  \n[[10.1007\u002F978-3-031-37196-7_9](https:\u002F\u002Fdoi.org\u002F10.1007\u002F978-3-031-37196-7_9)]\n\n**利用生成式人工智能解码酶催化与进化以增强工程化能力。**  \nWen Jun Xie, Arieh Warshel。  \n*预印本，2023年10月。*  \n[[10.1101\u002F2023.10.10.561808](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.10.10.561808)]\n\n**机器学习引导的蛋白质工程。**  \nPetr Kouba, Pavel Kohout, Faraneh Haddadi, Anton Bushuiev, Raman Samusevich, Jiri Sedlar, Jiri Damborsky, Tomas Pluskal, Josef Sivic, 和 Stanislav Mazurenko。  \n*ACS Catalysis，2023年10月。*  \n[[10.1021\u002Facscatal.3c02743](https:\u002F\u002Fdoi.org\u002F10.1021\u002Facscatal.3c02743)]\n\n**用于从头设计蛋白质的生成式人工智能。**  \nAdam Winnifrith, Carlos Outeiral, Brian Hie。  \n*预印本，2023年10月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2310.09685)]\n\n**用于蛋白质建模的深度学习方法生态系统的发展。**  \nJulia R. Rogers, Gergő Nikolényi, Mohammed AlQuraishi。  \n*预印本，2023年10月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2310.06725)]\n\n**利用全局生成模型探索蛋白质序列空间。**  \nSergio Romero-Romero, Sebastian Lindner, Noelia Ferruz。  \n*预印本，2023年5月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2305.01941)]\n\n**生物信息学中的扩散模型：深度学习革命的新浪潮正在发挥作用。**  \nZhiye Guo, Jian Liu, Yanli Wang, Mengrui Chen, Duolin Wang, Dong Xu, Jianlin Cheng。  \n*预印本，2023年2月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2302.10907)]\n\n**学习上位效应与残基共进化模式：推动酶工程发展的当前趋势与未来展望。**  \nMarcel Wittmund, Frederic Cadet 和 Mehdi D. Davari。  \n*ACS Catalysis，2022年11月。*  \n[[10.1021\u002Facscatal.2c01426](https:\u002F\u002Fdoi.org\u002F10.1021\u002Facscatal.2c01426)]\n\n**从序列到功能再到结构：深度学习在蛋白质设计中的应用。**  \nNoelia Ferruz, Michael Heinzinger, Mehmet Akdel, Alexander Goncearenco, Luca Naef, Christian Dallago。  \n*预印本，2022年9月。*  \n[[10.1101\u002F2022.08.31.505981](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.08.31.505981)]\n\n**基于进化与物理启发的建模在计算蛋白质设计中的应用：当前与未来的协同作用。**  \nCyril Malbranke, David Bikard, Simona Cocco, Rémi Monasson, Jérôme Tubiana。  \n*预印本，2022年8月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2208.13616)]\n\n**深度学习方法在蛋白质设计中用于处理构象灵活性与开关特性。**  \nLucas S. P. Rudde, Mahdi Hijazi, Patrick Barth。  \n*Front. Mol. Biosci., 2022年8月。*  \n[[10.3389\u002Ffmolb.2022.928534](https:\u002F\u002Fdoi.org\u002F10.3389\u002Ffmolb.2022.928534)]\n\n**利用语言模型进行可控的蛋白质设计。**  \nNoelia Ferruz, Birte Höker。  \n*Nature Machine Intelligence，2022年6月。*  \n[[10.1038\u002Fs42256-022-00499-z](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs42256-022-00499-z)]\n\n**通往完全可编程蛋白质催化之路。**  \nSarah L. Lovelock, Rebecca Crawshaw, Sophie Basler, Colin Levy, David Baker, Donald Hilvert, Anthony P. Green。  \n*Nature，2022年6月。*  \n[[10.1038\u002Fs41586-022-04456-z](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41586-022-04456-z)]\n\n**通过序列引导的蛋白质工程与设计高效探索序列空间。**  \nBen E. Clifton, Dan Kozome，以及 Paola Laurino。  \n*Biochemistry，2022年3月。*  \n[[10.1021\u002Facs.biochem.1c00757](https:\u002F\u002Fdoi.org\u002F10.1021\u002Facs.biochem.1c00757)]\n\n**利用语言模型学习蛋白质的功能特性。**  \nSerbulent Unsal, Heval Atas, Muammer Albayrak, Kemal Turhan, Aybar C. Acar & Tunca Doğan。  \n*Nature Machine Intelligence，2022年3月。*  \n[[10.1038\u002Fs42256-022-00457-9](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs42256-022-00457-9)]\n\n**人工智能在代谢工程中用于酶与代谢途径设计的应用。**  \nWoo Dae Jang, Gi Bae Kim, Yeji Kim, Sang Yup Lee。  \n*Current Opinion in Biotechnology，2022年2月。*  \n[[10.1016\u002Fj.copbio.2021.07.024](https:\u002F\u002Fdoi.org\u002F10.1016\u002Fj.copbio.2021.07.024)]\n\n**适应性机器学习在蛋白质工程中的应用。**  \nBrian L. Hie, Kevin K. Yang。  \n*Current Opinion in Structural Biology，2022年2月。*  \n[[10.1016\u002Fj.sbi.2021.11.002](https:\u002F\u002Fdoi.org\u002F10.1016\u002Fj.sbi.2021.11.002)]\n\n**利用深度生成模型进行蛋白质序列设计。**  \nZachary Wu, Kadina E. Johnston, Frances H. Arnold, Kevin K. Yang。  \n*Current Opinion in Chemical Biology，2021年12月。*  \n[[10.1016\u002Fj.cbpa.2021.04.004](https:\u002F\u002Fdoi.org\u002F10.1016\u002Fj.cbpa.2021.04.004)]\n\n**人工智能在预测突变对蛋白质稳定性影响方面的挑战。**  \nFabrizio Pucci, Martin Schwersensky, Marianne Rooman。  \n*预印本，2021年11月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2111.04208v1)]\n\n**定向进化中机器学习的进展。**  \nBruce J Wittmann, Kadina E Johnston, Zachary Wu, Frances H Arnold。  \n*Current Opinion in Structural Biology，2021年8月。*  \n[[10.1016\u002Fj.sbi.2021.01.008](https:\u002F\u002Fdoi.org\u002F10.1016\u002Fj.sbi.2021.01.008)]\n\n**蛋白质磷酸化位点预测的机器学习技术简述。**  \n法尔扎内·伊斯迈利、马赫迪·普尔米尔宰伊、沙欣·拉马齐、埃尔哈姆·亚瓦里。  \n*预印本，2021年8月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2108.04951v1)]\n\n**学习蛋白质的语言：进化、结构与功能。**  \n特里斯坦·贝普勒、邦妮·伯格。  \n*细胞系统，2021年6月。*  \n[[10.1016\u002Fj.cels.2021.05.017](https:\u002F\u002Fdoi.org\u002F10.1016\u002Fj.cels.2021.05.017)]\n\n**表示学习在生物序列分析中的应用。**  \n一枝仁志、松谷太郎、山田圭介、岩野夏希、住俊介、细田诗音、赵士涛、福永司、滨田道明。  \n*计算与结构生物技术杂志，2021年5月。*  \n[[10.1016\u002Fj.csbj.2021.05.039](https:\u002F\u002Fdoi.org\u002F10.1016\u002Fj.csbj.2021.05.039)]\n\n**数据驱动的计算蛋白质设计。**  \n文森特·弗拉皮耶、艾米·E·基廷。  \n*当前结构生物学观点，2021年5月。*  \n[\u002F10.1016\u002Fj.sbi.2021.03.009](https:\u002F\u002Fdoi.org\u002F10.1016\u002Fj.sbi.2021.03.009)]\n\n**机器学习在蛋白质结构预测中的应用。**  \n穆罕默德·阿尔库赖希。  \n*当前化学生物学观点，2021年5月。*  \n[[10.1016\u002Fj.cbpa.2021.04.005](https:\u002F\u002Fdoi.org\u002F10.1016\u002Fj.cbpa.2021.04.005)]\n\n**蛋白质序列到结构的学习：这是否标志着端到端革命的终结？**  \n埃洛迪·莱恩、斯蒂芬·艾斯曼、阿爾內·埃洛夫森、謝爾蓋·格魯季寧。  \n*预印本，2021年5月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2105.07407v1)]\n\n**通过人工智能和机器学习革新酶工程。**  \n尼图·辛格、桑尼·马利克、安维塔·古普塔、金舒克·拉杰·斯里瓦斯塔瓦。  \n*生命科学新兴课题，2021年4月。*  \n[[10.1042\u002FETLS20200257](https:\u002F\u002Fdoi.org\u002F10.1042\u002FETLS20200257)]\n\n**蛋白质的语言：自然语言处理、机器学习与蛋白质序列。**  \n丹·奥弗、纳达夫·布兰德斯、米哈尔·利尼亚尔。  \n*计算与结构生物技术杂志，2021年1月。*  \n[[10.1016\u002Fj.csbj.2021.03.022](https:\u002F\u002Fdoi.org\u002F10.1016\u002Fj.csbj.2021.03.022)]\n\n**第十二章——机器学习辅助的酶工程。**  \n尼克拉斯·E·西德霍夫、乌尔里希·施万内贝格和梅赫迪·D·达瓦里。  \n*酶学方法，2020年11月。*  \n[[10.1016\u002Fbs.mie.2020.05.005](https:\u002F\u002Fdoi.org\u002F10.1016\u002Fbs.mie.2020.05.005)]\n\n**基于机器学习和人工智能的方法用于生物活性配体发现及GPCR配体识别。**  \n塞巴斯蒂安·拉斯奇卡、本杰明·考夫曼。  \n*预印本，2020年1月。*  \n[[arXiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2001.06545v2)]\n\n**机器学习在酶工程中的应用。**  \n斯坦尼斯拉夫·马祖连科、兹比涅克·普罗科普、伊日·丹博尔斯基。  \n*ACS催化，2019年12月。*  \n[[10.1021\u002Facscatal.9b04321](https:\u002F\u002Fdoi.org\u002F10.1021\u002Facscatal.9b04321)]  \n\n**机器学习引导的定向进化在蛋白质工程中的应用。**  \n凯文·K·杨、扎卡里·吴、弗朗西斯·H·阿诺德。  \n*自然方法，2019年7月。*  \n[[10.1038\u002Fs41592-019-0496-6](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41592-019-0496-6)]  \n预印本可在[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F1811.10775)上查阅。\n\n**使用TAPE评估蛋白质迁移学习。**  \n罗尚·拉奥、尼古拉斯·巴塔查里亚、尼尔·托马斯、严端、陈曦、约翰·坎尼、皮特·阿贝尔、宋云生。  \n*预印本，2019年6月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F1906.08230)]\n\n**机器学习能否革新选择性酶的定向进化？**  \n李广岳、董义杰、曼弗雷德·T·雷茨。  \n*先进合成与催化，2019年3月。*  \n[[10.1002\u002Fadsc.201900149](https:\u002F\u002Fdoi.org\u002F10.1002\u002Fadsc.201900149)]\n\n### 工具与数据集\n\n**Scaffold-Lab：在统一框架中对蛋白质主链生成方法进行关键评估和排名。**  \n郑卓奇、张博、钟博子涛、刘可欣、李正鑫、朱俊杰、于金宇、魏婷、陈海峰。  \n*预印本，2024年5月。*  \n[[10.1101\u002F2024.02.10.579743](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2024.02.10.579743)]\n\n**基于神经网络生成的酶的计算评分与实验评估。**  \n肖恩·R·约翰逊、付晓志、桑德拉·维克南德、克拉拉·戈尔丁、萨拉·莫纳科、阿列克谢·泽列兹尼亚克、杨凯文·K。  \n*自然生物技术，2024年4月。*  \n[[10.1038\u002Fs41587-024-02214-2](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41587-024-02214-2)]\n\n**深度插入缺失诱变揭示了插入和缺失对蛋白质稳定性和功能的影响。**  \n玛格达莱娜·托波尔斯卡、安东尼·贝尔特兰、本·莱纳。  \n*预印本，2023年10月。*  \n[[10.1101\u002F2023.10.06.561180](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.10.06.561180)]\n\n**OpenProteinSet：用于大规模结构生物学的训练数据集。**  \n古斯塔夫·阿德里茨、纳齐姆·布阿塔、萨钦·卡迪安、卢卡斯·雅罗施、丹尼尔·贝伦伯格、伊恩·菲斯克、安德鲁·M·沃特金斯、史蒂芬·拉、理查德·邦诺、穆罕默德·阿尔库赖希。  \n*预印本，2023年8月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2308.05326)]\n\n**生物学与设计领域中蛋白质折叠稳定性的大规模实验分析。**  \n津保山孝太郎、尤斯塔斯·道帕拉斯、乔纳森·陈、艾洛迪·莱恩、亚瑟·莫赫塞尼·贝赫巴哈尼、乔纳森·J·韦恩斯坦、尼尔·M·曼根、谢尔盖·奥夫钦尼科夫及加布里埃尔·J·罗克林。  \n*自然杂志，2023年7月。*  \n[[10.1038\u002Fs41586-023-06328-6](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41586-023-06328-6)]\n\n**FLOP：针对野生型蛋白质适应度景观的任务集。**  \n彼得·莫尔奇·格罗特、理查德·迈克尔、耶斯珀·萨洛蒙、田鹏飞、沃特·布姆斯马。  \n*预印本，2023年6月。*  \n[[10.1101\u002F2023.06.21.545880](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.06.21.545880)]\n\n\n**PDBench：评估蛋白质序列设计的计算方法。**  \n莱昂纳多·V·卡斯托里纳、罗卡斯·佩特雷纳斯、卡尔蒂克·苏布尔、克里斯托弗·W·伍德。  \n*生物信息学，2023年1月。*  \n[[10.1093\u002Fbioinformatics\u002Fbtad027](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbtad027)]]\n\n\n**KRAS抑制的能量与别构景观。**  \n温晨春、安德烈·J·福雷、本·莱纳。  \n*预印本，2022年12月。*  \n[[10.1101\u002F2022.12.06.519122](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.12.06.519122)]\n\n**ManyFold：用于训练和验证蛋白质折叠模型的高效灵活库。**  \n阿梅莉娅·比列加斯-莫尔西略、路易斯·罗宾逊、阿图尔·弗拉若莱、托马斯·D·巴雷特。  \n*生物信息学，2022年12月。*  \n[[10.1093\u002Fbioinformatics\u002Fbtac773](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbtac773)]\n\n**生物学与蛋白质设计领域中蛋白质折叠稳定性的大规模实验分析。**  \n津保山孝太郎、尤斯塔斯·道帕拉斯、乔纳森·陈、艾洛迪·莱恩、亚瑟·莫赫塞尼·贝赫巴哈尼、乔纳森·J·韦恩斯坦、尼尔·M·曼根、谢尔盖·奥夫钦尼科夫、加布里埃尔·J·罗克林。  \n*预印本，2022年12月。*  \n[[10.1101\u002F2022.12.06.519132](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.12.06.519132)]\n\n**用于模型指导的蛋白质设计基准测试的调优适应度景观。**  \n尼尔·托马斯、阿蒂什·阿加瓦拉、大卫·贝朗热、宋云S、露西·J·科尔威尔。  \n*预印本，2022年10月。*  \n[[10.1101\u002F2022.10.28.514293](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.10.28.514293)]\n\n**深度突变扫描与机器学习揭示了同源蛋白中调控别构热点的结构与分子规则。**  \n梅根·利安德、刘壮、崔强、斯里瓦特桑·拉曼。  \n*Elife，2022年10月。*  \n[[10.7554\u002FeLife.79932](https:\u002F\u002Fdoi.org\u002F10.7554\u002FeLife.79932)]\n\n**随机化门控消除排序测序实验中的偏差。**  \n布莱恩·L·特里普、黄步伟、艾丽卡·A·德贝内迪克蒂斯、布莱恩·科文特里、尼古拉斯·巴塔查里亚、杨凯文·K、戴维·贝克、洛林·克劳福德。  \n*蛋白质科学，2022年8月。*  \n[[10.1002\u002Fpro.4401](https:\u002F\u002Fdoi.org\u002F10.1002\u002Fpro.4401)]\n\n**Uni-Fold：开发超越AlphaFold的蛋白质折叠模型的开源平台。**  \n李子瑶、刘旭阳、陈伟杰、沈凡、毕航睿、柯国林、张林峰。  \n*预印本，2022年8月。*  \n[[10.1101\u002F2022.08.04.502811](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.08.04.502811)]\n\n**PEER：一个全面且多任务的蛋白质序列理解基准测试。**  \n许明浩、张左白、陆嘉瑞、朱兆成、张阳天、马昌、刘润成、唐健。  \n*预印本，2022年6月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2206.02096)]\n\n**FLIP：蛋白质适应度景观推断中的基准测试任务。**  \n克里斯蒂安·达拉戈、乔迪·穆、卡迪娜·E·约翰斯顿、布鲁斯·J·威特曼、尼古拉斯·巴塔查里亚、塞缪尔·戈德曼、阿里·马达尼、杨凯文·K。  \n*NeurIPS 2021 数据集与基准测试赛道，2021年12月。*  \n[[10.1101\u002F2021.11.09.467890](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.11.09.467890)]\n\n**evSeq：经济高效的扩增子测序，用于检测蛋白质文库中的每一个变异体。**  \n布鲁斯·J·威特曼、卡迪娜·E·约翰斯顿、帕特里克·J·阿尔姆赫耶尔、弗朗西斯·H·阿诺德。  \n*预印本，2021年11月。*  \n[[10.1101\u002F2021.11.18.469179](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.11.18.469179)]\n\n**immuneML生态系统：用于自适应免疫受体库的机器学习分析。**  \n米莱娜·帕夫洛维奇、隆内克·谢弗尔、凯沙夫·莫特瓦尼、查克拉瓦尔蒂·坎杜里、拉德米拉·孔波娃、尼古拉·瓦佐夫、克努特·瓦甘、法比安·L·M·贝尔纳尔、亚历山德雷·阿尔梅达·科斯塔、布莱恩·科里、拉赫马德·阿克巴尔、加迪·S·阿尔哈吉、加布里埃尔·巴拉班、托德·M·布鲁斯科、玛丽亚·切尔尼戈夫斯卡娅、斯科特·克里斯特利、琳赛·G·考威尔、罗伯特·弗兰克、伊瓦尔·格吕滕、斯韦因翁·贡德森、英格丽德·霍贝克·哈夫、埃文德·霍维格、平汉·谢、君特·克兰鲍尔、玛丽克·L·库伊耶尔、克里斯汀·伦德-安德森、安东尼奥·马尔蒂尼、托马斯·米诺托、约翰·彭萨尔、克努特·兰德、恩里科·里卡迪、菲利普·A·罗伯特、阿图尔·罗沙、安德烈·斯拉博德金、伊戈尔·斯纳普科夫、路德维格·M·索利德、德米特罗·季托夫、塞德里克·R·韦伯、迈克尔·维德里希、古尔·亚阿里、维克托·格雷夫及盖尔·凯蒂尔·桑德韦。  \n*自然机器智能，2021年11月。*  \n[[10.1038\u002Fs42256-021-00413-z](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs42256-021-00413-z)]\n\n**从深度学习中学习到的嵌入表示，用于可视化和预测蛋白质集合。**  \n克里斯蒂安·达拉戈、康斯坦丁·舒策、迈克尔·海因辛格、托比亚斯·奥莱尼、玛丽亚·利特曼、艾米·X·卢、杨凯文·K、闵善宇、尹成浩、詹姆斯·T·莫顿、布尔克哈德·罗斯特。  \n*Current Protocols，2021年5月。*  \n[[10.1002\u002Fcpz1.113](https:\u002F\u002Fdoi.org\u002F10.1002\u002Fcpz1.113)]\n\n**基于群体的黑盒优化用于生物序列设计。**  \n克里斯托夫·安格穆勒、大卫·贝朗热、安德烈娅·加内、泽尔达·马里埃特、大卫·多汉、凯文·墨菲、露西·科尔威尔、D·斯卡利。  \nICML，2020年7月。  \n[[ICML](https:\u002F\u002Fproceedings.icml.cc\u002Fstatic\u002Fpaper_files\u002Ficml\u002F2020\u002F6338-Paper.pdf)]\n\n**Selene：一个基于PyTorch的序列数据深度学习库。**  \n凯瑟琳·M·陈、埃文·M·科弗、周建、奥尔加·G·特罗扬斯卡娅。  \n*自然方法，2019年3月。*  \n[[10.1038\u002Fs41592-019-0360-8](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41592-019-0360-8)]\n\n### 机器学习引导的定向进化\n\n**通过主动学习增强人工金属酶的序列-活性映射与进化。**  \n托比亚斯·沃恩霍尔特、莫伊米尔·穆特尼、格雷戈尔·W·施密特、克里斯蒂安·谢尔哈斯、立尾良、斯文·潘克、托马斯·R·沃德、安德烈亚斯·克劳塞*及马库斯·耶舍克。  \n*ACS中央科学，2024年5月。*  \n[[10.1021\u002Facscentsci.4c00258](https:\u002F\u002Fdoi.org\u002F10.1021\u002Facscentsci.4c00258)]\n\n**碱基编辑酶的机器学习与定向进化。**  \n拉米罗·M·佩罗塔、斯文雅·芬克、拉斐尔·费雷拉、米夏埃尔·莫雷、艾哈迈德·马哈斯、阿努什·奇亚皮诺-佩佩、丽莎·M·里德迈尔、安娜-泰蕾丝·梅拉、路易莎·S·莱曼、乔治·M·丘奇。  \n*预印本，2024年5月。*  \n[[10.1101\u002F2024.05.17.594556](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2024.05.17.594556)]\n\n**通过直接偏好优化将蛋白质生成模型与实验适应度对齐。**  \n塔拉勒·维达塔拉、拉斐尔·拉法伊洛夫、布莱恩·希。  \n*预印本，2024年5月。*  \n[[10.1101\u002F2024.05.20.595026](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2024.05.20.595026)]\n\n**计算稳定非血红素铁酶可实现新功能的高效进化。**  \n布里安妮·R·金、基拉·H·苏米达、杰西卡·L·卡鲁索、大卫·贝克、杰西·G·扎拉坦。  \n*预印本，2024年5月。*  \n[[10.1101\u002F2024.04.18.590141](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2024.04.18.590141)]\n\n**微滴筛选快速表征生物催化剂，以支持其人工智能辅助工程化。**  \n马克西米利安·甘茨、西蒙·V·马蒂斯、弗里德里科·E·H·宁策尔、保罗·J·祖雷克、坦雅·克瑙斯、埃利·帕特尔、丹尼尔·博罗斯、弗里德里希-马克西米利安·韦伯林、马修·R·A·肯尼思、奥斯卡·J·克莱因、埃利奥特·J·梅德卡尔夫、雅各布·莫斯、迈克尔·赫格尔、托马什·S·卡明斯基、弗朗切斯科·G·穆蒂、皮耶特罗·利奥、弗洛里安·霍尔费尔德。  \n*预印本，2024年4月。*   \n[[10.1101\u002F2024.04.08.588565](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2024.04.08.588565)]\n\n**自动化体内酶工程加速生物催化剂优化。**  \n恩里科·奥尔西、伦纳特·沙达·冯·博尔齐斯科夫斯基、施特凡·诺克、巴勃罗·I·尼克尔及施特芬·N·林德纳。  \n*自然通讯，2024年4月。*  \n[[10.1038\u002Fs41467-024-46574-4](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41467-024-46574-4)]\n\n**结合机器学习与超高通量筛选工程高活性且多样化的核酸酶。**  \n尼尔·托马斯、大卫·贝兰热、许晨玲、韩森·李、凯瑟琳·平野、岩井浩介、万雅·波利奇、肯德拉·D·尼伯格、凯文·霍夫、卢卡斯·弗伦茨、查理·A·埃姆里奇、金俊宇、玛丽亚·查瓦哈、阿比·拉马南、杰里米·J·阿格雷斯蒂、露西·J·科尔威尔。  \n*预印本，2024年4月。*  \n[[10.1101\u002F2024.03.21.585615](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2024.03.21.585615)]\n\n**用于数据驱动蛋白质工程的可解释预测性机器学习模型。**  \n大卫·梅迪纳-奥尔蒂斯、阿什坎·哈利费、霍达·安瓦里-卡泽马巴德及梅赫迪·D·达瓦里。  \n*预印本，2024年3月。*  \n[[arxiv](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2024.02.18.580860)]\n\n**机器学习辅助光、氧、电压光感受器加合物寿命工程化。**  \n斯特法妮·海默、尼克拉斯·埃里克·西德霍夫、索菲娅·维尔纳、吉泽姆·厄尔居屈、乌尔里希·施瓦内贝格、卡尔-埃里希·雅格尔、梅赫迪·D·达瓦里及乌尔里希·克劳斯  \n*JACS Au，2023年11月。*  \n[[10.1021\u002Fjacsau.3c00440](https:\u002F\u002Fdoi.org\u002F10.1021\u002Fjacsau.3c00440)]\n\n**基于生物物理的蛋白质语言模型用于蛋白质工程。**  \n萨姆·盖尔曼、布莱斯·约翰逊、蔡斯·弗雷什林、萨米尔·德科斯塔、安东尼·吉特、菲利普·A·罗梅罗。  \n*预印本，2024年3月。*  \n[[10.1101\u002F2024.03.15.585128](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2024.03.15.585128)]\n\n**利用ProteinMPNN提升蛋白质表达、稳定性和功能。**  \n基拉·H·苏米达、雷耶斯·努涅斯-弗兰科、因德雷克·卡尔韦特、塞缪尔·J·佩洛克、巴西勒·I·M·威基、卢卡斯·F·米勒斯、尤斯塔斯·道帕拉斯、王珏、亚科夫·基普尼斯、诺埃尔·詹姆森、亚历克斯·康、乔什敏·德拉克鲁斯、巴努马蒂·桑卡拉恩、阿西姆·K·贝拉、冈萨洛·希门尼斯-奥塞斯、大卫·贝克。  \n*预印本，2023年10月。*  \n[[10.1101\u002F2023.10.03.560713](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.10.03.560713)]\n\n**运用合成共进化与机器学习工程蛋白质-蛋白质相互作用。**  \n艾琳·杨、凯文·M·朱德、本·赖、梅森·米诺特、安娜·M·科西拉、迦勒·R·格拉斯曼、西宫大辅、尹锡金、赛·T·雷迪、阿里·A·汗、K·克里斯托弗·加西亚。  \n*科学，2023年7月*  \n[[10.1126\u002Fscience.adh1720](https:\u002F\u002Fdoi.org\u002F10.1126\u002Fscience.adh1720)]\n\n**面向离线模型的双向学习用于生物序列设计。**  \n陈灿、张颖雪、刘雪、马克·科茨。  \n*预印本，2023年1月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2301.02931)]\n\n**基于梯度的离散MCMC实现蛋白质的即插即用定向进化。**  \n帕特里克·埃马米、艾丹·佩罗、杰弗里·劳、大卫·比亚焦尼、彼得·C·圣约翰。  \n*预印本，2022年12月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2212.09925)]\n\n**酶的组合组装与设计。**  \n罗莎莉·利普什-索科利克、奥尔加·赫尔松斯基、西布林·P·施罗德、卡斯珀·德博尔、什洛莫-雅基尔·霍赫、吉迪恩·J·戴维斯、赫尔门·S·欧弗克利夫特、萨雷尔·J·弗莱施曼。  \n*预印本，2022年12月。*  \n[[10.1101\u002F2022.09.17.508230](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.09.17.508230)]\n\n**针对分布偏移下的标签预测，用于机器引导的序列设计。**  \n劳伦·伯克·惠洛克、斯蒂芬·马利纳、杰弗里·格罗尔德、萨姆·西奈。  \n*预印本，2022年11月*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2211.10422)]\n\n**PropertyDAG：用于生物序列设计的多目标贝叶斯优化，处理部分有序的混合变量属性。**  \n朴智源、塞缪尔·斯坦顿、萨义德·萨雷米、安德鲁·沃特金斯、亨利·德怀尔、弗拉基米尔·格利戈里耶维奇、理查德·邦诺、斯蒂芬·拉、庆贤·曹。  \n*预印本，2022年10月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2210.04096)]\n\n**设计的活性位点文库揭示数千种功能性GFP变体。**  \n乔纳森·雅各布·温斯坦、卡洛斯·马蒂·戈麦斯·阿尔达拉维、罗莎莉·利普什-索科利克、什洛莫·雅基尔·霍赫、德米安·利伯曼、雷纳特·内沃、海姆·魏斯曼、叶卡捷琳娜·彼得罗维奇-科皮特曼、大卫·马古利斯、德米特里·伊万科夫、大卫·麦坎德利什、萨雷尔·雅各布·弗莱施曼。  \n*预印本，2022年10月。*  \n[[10.1101\u002F2022.10.11.511732](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.10.11.511732)]\n\n**通过深度学习和分子模拟加速理性PROTAC设计。**  \n双佳·郑、游海·谭、振宇·王、成涛·李、志清·张、尚旭、洪明·陈及岳东·杨。  \n*自然机器智能，2022年9月。*  \n[[10.1038\u002Fs42256-022-00527-y](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs42256-022-00527-y)]\n\n**从实验室进化实验中推断蛋白质适应度景观。**  \n萨米尔·德科斯塔、艾米丽·C·欣兹、蔡斯·R·弗雷什林、玄彬·宋、菲利普·A·罗梅罗。  \n*预印本，2022年9月。*  \n[[10.1101\u002F2022.09.01.506224](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.09.01.506224)]\n\n**由人工智能预测结合力和自然性所实现的抗体优化。**  \n沙罗尔·巴查斯、戈兰·拉科切维奇、大卫·斯宾塞、阿南德·V·萨斯特里、罗贝尔·海勒、约翰·M·萨顿、乔治·卡孙、安德鲁·斯塔希拉、贾希尔·M·古铁雷斯、埃德里斯·亚辛、博尔卡·梅焦、文森特·布莱、克里斯塔·科恩内特、珍妮弗·T·斯坦顿、亚历山大·布朗、内博伊沙·蒂亚尼奇、凯伦·麦克洛斯基、丽贝卡·维亚佐、丽贝卡·康斯布鲁克、海莉·卡特、西蒙·莱文、沙希德·阿卜杜勒哈克、雅各布·绍尔、阿比盖尔·B·文图拉、兰达尔·S·奥尔森、恩金·亚皮奇、乔舒亚·迈尔、肖恩·麦克莱恩、马修·韦因斯托克、格雷戈里·汉努姆、阿里埃尔·施瓦茨、迈尔斯·甘德尔、罗伯托·斯普雷阿菲科。  \n*预印本，2022年8月。*  \n[[10.1101\u002F2022.08.16.504181](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.08.16.504181)]\n\n**利用可泛化至全新突变空间的机器学习模型对治疗性抗体的亲和力与特异性进行协同优化。**  \n艾米丽·K·马科夫斯基、帕特里克·C·金努嫩、黄洁、吴琳娜、马修·D·史密斯、王铁欣、阿莱克·A·戴赛、克雷格·N·斯特鲁、张玉磊、詹妮弗·M·祖潘西奇、约翰·S·沙尔特、詹妮弗·J·林德曼、彼得·M·泰西耶。  \n*《自然通讯》，2022年7月。*  \n[[10.1038\u002Fs41467-022-31457-3](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41467-022-31457-3)]\n\n**结合进化概率与机器学习的混合模型助力数据驱动的蛋白质工程。**  \n亚历山大-莫里斯·伊利格、尼克拉斯·E·齐德霍夫、乌尔里希·施万内贝格和梅迪·D·达瓦里。  \n*预印本，2022年6月。*  \n[[arxiv](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.06.07.495081)]\n\n**GFP适应度景观的异质性与数据驱动的蛋白质设计。**  \n路易莎·冈萨雷斯·索默迈耶、奥班·弗莱斯、亚历山大·S·米申、妮娜·G·博扎诺娃、安娜·A·伊戈尔基娜、延斯·迈勒、玛丽亚-埃利森达·阿拉巴尔·普霍尔、叶卡捷琳娜·V·普廷采娃、卡伦·S·萨尔基相。  \n*eLife，2022年5月。*  \n[[10.7554\u002FeLife.75842](https:\u002F\u002Fdoi.org\u002F10.7554\u002FeLife.75842)]\n\n**基于深度网络“幻觉”的从头蛋白质设计。**  \n伊万·阿尼申科、塞缪尔·J·佩洛克、塔穆卡·M·奇迪亚乌西库、特蕾莎·A·拉梅洛特、谢尔盖·奥夫钦尼科夫、郝静舟、库什布·巴夫纳、克里斯托弗·诺恩、亚历克斯·康、阿西姆·K·贝拉、弗兰克·迪马约、劳伦·卡特、卡梅隆·M·周、加埃塔诺·T·蒙特利奥内以及大卫·贝克。  \n*《自然》，2021年12月。*  \n[[10.1038\u002Fs41586-021-04184-w](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41586-021-04184-w)]\n\n**通过知情的训练集设计实现高效的机器学习辅助定向蛋白质进化。**  \n布鲁斯·J·维特曼、易松岳、弗朗西斯·H·阿诺德。  \n*《细胞系统》，2021年11月。*  \n[[10.1016\u002Fj.cels.2021.07.008](https:\u002F\u002Fdoi.org\u002F10.1016\u002Fj.cels.2021.07.008)]\n\n\n\n**基于机器学习的文库设计提升腺相关病毒（AAV）文库的包装效率与多样性。**  \n朱丹青、大卫·H·布鲁克斯、阿科苏阿·布西亚、安娜·卡内罗、克拉拉·范江、加利娜·波波娃、大卫·申、爱德华·F·张、托马什·J·诺瓦科夫斯基、詹妮弗·利斯特加滕、大卫·V·沙弗尔。  \n*预印本，2021年11月。*  \n[[10.1101\u002F2021.11.02.467003](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.11.02.467003)]\n\n**基于生成序列模型的随机DNA合成协议优化设计。**  \n伊莱·N·温斯坦、艾伦·N·阿明、威尔·格拉斯沃赫尔、丹尼尔·卡斯勒、让·迪塞、黛博拉·S·马克斯。  \n*预印本，2021年10月。*  \n[[10.1101\u002F2021.10.28.466307](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.10.28.466307)]\n\n**无似然推断与黑盒序列设计的统一及其拓展。**  \n张丁怀、付杰、约书亚·本吉奥、阿伦·库维尔。  \n*预印本，2021年10月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2110.03372)]\n\n**机器导向进化用于提高亚胺还原酶的活性与立体选择性。**  \n埃里克·J·马、埃莉娜·西罗拉、查尔斯·摩尔、阿尔卡季·库默尔、马库斯·施托克利、迈克尔·法勒、卡罗琳·布凯、法比安·埃吉曼、马蒂厄·利吉贝尔、丹·胡英、杰弗里·卡特勒、卢卡·西格里斯特、理查德·A·刘易斯、安妮-克里斯汀·阿克尔、恩斯特·弗罗因德、埃尔克·科赫、马库斯·沃格尔、霍尔格·施林根西彭、爱德华·J·奥克利以及拉德卡·斯纳伊德罗娃。  \n*《ACS催化》，2021年9月。*  \n[[10.1021\u002Facscatal.1c02786](https:\u002F\u002Fdoi.org\u002F10.1021\u002Facscatal.1c02786)]\n\n**PyPEF——一个用于数据驱动蛋白质工程的集成框架。**  \n尼克拉斯·E·齐德霍夫、亚历山大-莫里斯·伊利格、乌尔里希·施万内贝格以及梅迪·D·达瓦里*  \n*《化学信息学模型杂志》，2021年7月。*  \n[[10.1021\u002Facs.jcim.1c00099](https:\u002F\u002Fdoi.org\u002F10.1021\u002Facs.jcim.1c00099)]\n\n**用于高效离线模型驱动优化的保守目标模型。**  \n布兰登·特拉布科、阿维拉尔·库马尔、耿鑫阳、谢尔盖·列文。  \n*预印本，2021年7月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2107.06882v1)]\n\n**面向属性增强型生成的深度外推技术。**  \n阿尔文·陈、阿里·马达尼、本·克劳斯、尼基尔·奈克。  \n*预印本，2021年7月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2107.02968)]\n\n**用于蛋白质设计的贝叶斯优化有效代理模型。**  \n内特·格鲁弗、塞缪尔·斯坦顿、波琳娜·基里琴科、马克·芬齐、菲利普·马费托内、维韦克·迈尔斯、\n艾米丽·德拉尼、佩顿·格林赛德、安德鲁·戈登·威尔逊。  \n*2021年ICML计算生物学研讨会，2021年7月。*  \n[[pdf](https:\u002F\u002Ficml-compbio.github.io\u002F2021\u002Fpapers\u002FWCBICML2021_paper_61.pdf)] \n\n**结合进化与结构约束正则化的贝叶斯优化在定向蛋白质进化中的应用。**  \n特雷弗·S·弗里斯比、克里斯托弗·詹姆斯·朗米德。  \n*《分子生物学算法》，2021年7月。*  \n[[10.1186\u002Fs13015-021-00195-4](https:\u002F\u002Fdoi.org\u002F10.1186\u002Fs13015-021-00195-4)]\n\n**深度自适应设计：摊销顺序式贝叶斯实验设计。**  \n亚当·福斯特、黛西·R·伊万诺娃、伊利亚斯·马利克、汤姆·雷恩福思。  \n*预印本，2021年7月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2103.02438)]\n\n**机器学习驱动的抗体设计在无约束规模下的计算机模拟原理验证。**  \n拉赫马德·阿克巴尔、菲利普·A·罗伯特、塞德里克·R·韦伯、迈克尔·维德里希、罗伯特·弗兰克、米莱娜·帕夫洛维奇、洛内克·谢弗尔、玛丽亚·切尔尼戈夫斯卡娅、伊戈尔·斯纳普科夫、安德烈·斯拉博德金、布里吉·布尚·梅塔、恩凯莱伊达·米霍、弗里德乔夫·伦德-约翰森、扬·特耶·安德森、塞普·霍赫赖特、英格丽德·霍贝克·哈夫、居特·克兰鲍尔、盖尔·凯蒂尔·桑德韦、维克多·格雷夫。  \n*预印本，2021年7月。*  \n[[10.1101\u002F2021.07.08.451480](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.07.08.451480)]\n\n**利用机器学习对AAV衣壳蛋白进行深度多样化。**  \n德鲁·H·布莱恩特、阿里·巴希尔、萨姆·西奈、妮娜·K·贾因、皮尔斯·J·奥格登、帕特里克·F·莱利、乔治·M·丘奇、露西·J·科尔威尔以及埃里克·D·凯尔西克。  \n*《自然生物技术》，2021年2月。*  \n[[10.1038\u002Fs41587-020-00793-4](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41587-020-00793-4)]\n\n**深度不确定性与蛋白质搜索。**  \n泽尔达·马里埃特、加森·杰尔费尔、子王、克里斯托夫·安格穆勒、大卫·贝兰热、苏哈尼·沃拉、麦克斯韦尔·比莱斯基、露西·科尔威尔、D·斯卡利、达斯汀·特兰、贾斯珀·斯诺克。  \n*NeurIPS 2020 分子机器学习研讨会，2020年12月。*   \n[[pdf](https:\u002F\u002Fml4molecules.github.io\u002Fpapers2020\u002FML4Molecules_2020_paper_23.pdf)]\n\n**机器学习指导的酰基-ACP还原酶工程化以提高体内脂肪醇产量。**  \n乔纳森·C·格林霍尔、萨拉·A·法尔贝格、布赖恩·F·普弗勒、菲利普·A·罗梅罗。  \n*预印本，2021年5月。*  \n[[10.1101\u002F2021.05.21.445192](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.05.21.445192)]\n\n**基于仅序列模型的大规模稳定蛋白质设计与优化。**  \n杰迪迪亚·M·辛格、斯科特·诺沃特尼、德文·斯特里克兰、休·K·哈多克斯、尼古拉斯·莱比、加布里埃尔·J·罗克林、卡梅隆·M·周、阿尼迪亚·罗伊、阿西姆·K·贝拉、弗朗西斯·C·莫塔……埃里克·克拉文斯。  \n*预印本，2021年3月。*  \n[[10.1101\u002F2021.03.12.435185](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.03.12.435185)]\n\n**AdaLead：一种简单而稳健的自适应贪心搜索算法，用于序列设计。**  \n萨姆·西奈、理查德·王、亚历山大·沃特利、斯图尔特·斯洛克姆、埃莉娜·洛坎、埃里克·D·凯尔西。  \n*预印本，2020年10月。*  \n[[arxiv](http:\u002F\u002Farxiv.org\u002Fabs\u002F2010.02141)]\n\n**NK景观作为机器学习驱动蛋白质工程的通用基准。**  \n亚当·C·马特、马哈卡兰·桑杜、科林·杰克逊。  \n*预印本，2020年10月。*  \n[[10.1101\u002F2020.09.30.319780](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.09.30.319780)]\n\n**面向生物发现与设计的不确定性学习。**  \n布莱恩·希、布莱恩·布莱森、邦妮·伯格。  \n*预印本，2020年8月。*  \n[[10.1101\u002F2020.08.11.247072](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.08.11.247072)]\n\n**基于种群的黑箱优化在生物序列设计中的应用。**  \n克里斯托夫·安格尔穆勒、大卫·贝兰热、安德烈娅·加内、泽尔达·马里埃特、大卫·多汉、凯文·墨菲、露西·科尔韦尔、D·斯库利。  \n*ICML，2020年7月。*  \n[[ICML](https:\u002F\u002Fproceedings.icml.cc\u002Fstatic\u002Fpaper_files\u002Ficml\u002F2020\u002F6338-Paper.pdf)]\n\n**面向模型驱动设计的自动聚焦预言机。**  \n克拉拉·范江、珍妮弗·利斯特加滕。  \n*预印本，2020年6月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2006.08052)]\n\n**通过后悔最小化进行领域外推。**  \n金文功、雷吉娜·巴尔齐莱、汤米·雅各拉。  \n*预印本，2020年6月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2006.03908)]\n\n**用于分子设计的快速可微DNA和蛋白质序列优化。**  \n约翰内斯·林德、格奥尔格·塞利格。  \n*预印本，2020年5月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2005.11275)]\n\n**深入探讨蛋白质工程中的机器学习模型。**  \n许宇婷、迪普塔克·维尔玛、罗伯特·P·谢里丹、安迪·利亚乌、马俊水、尼古拉斯·马歇尔、约翰·麦金托什、爱德华·C·谢勒、弗拉基米尔·斯韦特尼克、珍妮弗·约翰斯顿。  \n*《化学信息与建模杂志》，2020年4月。*  \n[[10.1021\u002Facs.jcim.0c00073](https:\u002F\u002Fdoi.org\u002F10.1021\u002Facs.jcim.0c00073)]\n\n**整合进化背景的深度序列建模在蛋白质工程中的应用。**  \n卢云、林武、丁汉田、苏宇峰、刘洋、韦斯利·魏谦、赵慧敏、彭健。  \n*预印本，2020年1月。*  \n[[10.1101\u002F2020.01.16.908509](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.01.16.908509)]\n\n**基于批处理贝叶斯优化的生物序列设计。**  \n大卫·贝兰热、苏哈尼·沃拉、泽尔达·马里埃特、拉米娅·德什潘德、大卫·多汉、克里斯托夫·安格尔穆勒、凯文·墨菲、奥利维埃·沙佩尔、露西·科尔韦尔。  \n*NeurIPS机器学习与物理科学研讨会，2019年12月。*  \n[[ML4PS](https:\u002F\u002Fml4physicalsciences.github.io\u002Ffiles\u002FNeurIPS_ML4PS_2019_141.pdf)]\n\n**面向模型优化的模型反演网络。**  \n阿维拉尔·库马尔、谢尔盖·列文  \n*预印本，2019年12月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F1912.13464v1)]\n\n**逐个突变位点解读突变效应预测。**  \nC. K. 斯鲁蒂、梅赫尔·K. 普拉卡什。  \n*bioRxiv，2019年12月*  \n[[10.1101\u002F867812](https:\u002F\u002Fdoi.org\u002F10.1101\u002F867812)]\n\n**基于结构的深度学习框架用于蛋白质工程。**  \n拉加夫·施罗夫、奥斯汀·W·科尔、巴雷特·R·莫罗、丹尼尔·J·迪亚斯、艾萨克·唐内尔、吉米·戈利哈尔、安德鲁·D·埃灵顿、罗斯·泰耶。  \n*预印本，2019年11月。*  \n[[10.1101\u002F833905](https:\u002F\u002Fdoi.org\u002F10.1101\u002F833905)]\n\n**全面的AAV衣壳适应度景观揭示了一种病毒基因，并实现了机器指导的设计。**  \n皮尔斯·J·奥格登、埃里克·D·凯尔西、萨姆·西奈、乔治·M·丘奇。  \n*《科学》杂志，2019年11月。*  \n[[10.1126\u002Fscience.aaw2900](https:\u002F\u002Fdoi.org\u002F10.1126\u002Fscience.aaw2900)]\n\n**机器学习指导的通道视紫红蛋白工程化实现了微创光遗传学技术。**  \n克莱尔·N·贝德布鲁克、凯文·K·杨、J·埃利奥特·罗宾逊、维维安娜·格拉迪纳鲁、弗朗西斯·H·阿诺德。  \n*《自然方法》杂志，2019年10月。*  \n[[10.1038\u002Fs41592-019-0583-8](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41592-019-0583-8)]  \n预印本可在[[bioRxiv](https:\u002F\u002Fwww.biorxiv.org\u002Fcontent\u002F10.1101\u002F565606v1)]上查阅。\n\n**基于组合约束的批处理随机贝叶斯优化设计**。  \n凯文·K·杨、于欣·陈、艾丽西亚·李、易松·岳。  \n*国际人工智能与统计会议（AISTATS），2019年4月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F1904.08102)] [[PMLR](http:\u002F\u002Fproceedings.mlr.press\u002Fv89\u002Fyang19c.html)]\n\n**利用机器学习辅助的组合文库定向蛋白质进化。**  \n扎卡里·吴、S. B. 詹妮弗·坎、拉塞尔·D. 刘易斯、布鲁斯·J. 维特曼、弗朗西斯·H·阿诺德。  \n*PNAS，2019年4月。*  \n[[10.1073\u002Fpnas.1901979116](https:\u002F\u002Fdoi.org\u002F10.1073\u002Fpnas.1901979116)]\n\n**通过自适应采样进行条件化以实现稳健设计。**  \n大卫·H·布鲁克斯、朴韩彪、珍妮弗·利斯特加滕。  \n*预印本，2019年1月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F1901.10060)]\n\n**一种用于可靠预测氨基酸相互作用的机器学习方法及其在对映选择性酶定向进化中的应用。**  \n弗雷德里克·卡代、尼古拉斯·丰泰纳、李广跃、华金·桑奇斯、马修·吴福昌、鲁迪·潘贾伊坦、伊亚纳尔·韦特里韦尔、伯纳德·奥夫曼、曼弗雷德·T·雷茨。  \n*《科学报告》杂志，2018年11月。*  \n[[10.1038\u002Fs41598-018-35033-y](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41598-018-35033-y)]\n\n**自适应采样设计。**  \n大卫·H·布鲁克斯、珍妮弗·利斯特加滕。  \n*预印本，2018年10月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F1810.03714)]\n\n**机器学习指导的诱变技术用于荧光蛋白的定向进化。**  \n佐藤裕、及川美咲、中泽光、新出哲平、亀田友志、津田浩二以及梅津光雄。  \n*《ACS合成生物学》杂志，2018年8月。*  \n[[10.1021\u002Facssynbio.8b00155](https:\u002F\u002Fdoi.org\u002F10.1021\u002Facssynbio.8b00155)]\n\n**迈向蛋白质的机器指导设计。**  \n苏罗吉特·比斯瓦斯、格列布·库兹涅佐夫、皮尔斯·J·奥格登、尼古拉斯·J·康威、瑞安·P·亚当斯、乔治·M·丘奇。  \n*预印本，2018年6月。*  \n[[10.1101\u002F337154](https:\u002F\u002Fdoi.org\u002F10.1101\u002F337154)] [[bioRxiv](https:\u002F\u002Fwww.biorxiv.org\u002Fcontent\u002F10.1101\u002F337154v1)]\n\n**反馈GAN（FBGAN）用于DNA：一种用于优化蛋白质功能的新颖反馈回路架构。**  \n安维塔·古普塔、詹姆斯·邹。  \n*预印本，2018年4月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F1804.01694)]\n\n**利用机器学习设计整膜型通道视紫红质，以实现高效的真核表达和质膜定位。**  \n克莱尔·N·贝德布鲁克、凯文·K·杨、奥斯汀·J·赖斯、维维安娜·格拉迪纳鲁、弗朗西斯·H·阿诺德。  \n*《PLoS 计算生物学》，2017年10月。*  \n[[10.1371\u002Fjournal.pcbi.1005786](https:\u002F\u002Fdoi.org\u002F10.1371\u002Fjournal.pcbi.1005786)]\n\n**利用设计的富含信息的基因变体探索杨树谷胱甘肽转移酶的序列—功能空间。**  \n亚曼·穆斯达尔、斯里达尔·戈文达拉扬、本特·曼内尔维克。  \n*《蛋白质工程、设计与选择》，2017年8月。*  \n[[10.1093%2Fprotein%2Fgzx045](https:\u002F\u002Fdx.doi.org\u002F10.1093%2Fprotein%2Fgzx045)]\n\n**利用高斯过程探索蛋白质适应度景观。**  \n菲利普·A·罗梅罗、安德烈亚斯·克劳塞、弗朗西斯·H·阿诺德。  \n*《美国国家科学院院刊》，2013年1月。*  \n[[10.1073\u002Fpnas.1215251110](https:\u002F\u002Fdoi.org\u002F10.1073\u002Fpnas.1215251110)]\n\n**利用机器学习和合成基因工程改造蛋白酶K。**  \n廖俊、曼弗雷德·K·瓦姆思、斯里达尔·戈文达拉扬、乔恩·E·内斯、丽贝卡·P·王、克拉斯·古斯塔夫松、杰里米·明舒尔。  \n*BMC 生物技术，2007年3月。*  \n[[10.1186\u002F1472-6750-7-16](https:\u002F\u002Fdoi.org\u002F10.1186\u002F1472-6750-7-16)]\n\n**通过基于ProSAR的酶进化提升催化功能。**  \n理查德·J·福克斯、S·克里斯托弗·戴维斯、艾米莉·C·芒多夫、丽莎·M·纽曼、韦斯娜·加夫里洛维奇、史蒂文·K·马、洛莱塔·M·钟、夏琳·青、萨瑞娜·谭、希拉·穆利、约翰·格雷特、约翰·格鲁伯、约翰·C·惠特曼、罗杰·A·谢尔顿、贾尔特·W·海斯曼。  \n*《自然生物技术》，2007年2月。*  \n[[《自然生物技术》](https:\u002F\u002Fwww.nature.com\u002Farticles\u002Fnbt1286)]\n\n\n\n### 表征学习\n\n**特征复用与扩展：理解基于蛋白质语言模型的迁移学习。**  \n弗朗西斯卡-周凡·李、艾娃·P·阿米尼、伊桑·岳、凯文·K·杨、亚历克斯·X·卢。  \n*ICML，2024年7月。*  \n[[10.1101\u002F2024.02.05.578959](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2024.02.05.578959)]\n\n**ProSST：基于量化结构与解耦注意力的蛋白质语言建模。**  \n李明晨、谭阳、马新竹、钟博子涛、于慧群、周子怡、欧阳万力、周冰欣、洪亮、谭攀。  \n*预印本，2024年5月。*  \n[[10.1101\u002F2024.04.15.589672](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2024.04.15.589672)]\n\n**基于生物物理学的蛋白质语言模型在蛋白质工程中的应用。**  \n萨姆·盖尔曼、布莱斯·约翰逊、蔡斯·弗雷斯林、萨米尔·德科斯塔、安东尼·吉特、菲利普·A·罗梅罗。  \n*预印本，2024年3月。*  \n[[10.1101\u002F2024.03.15.585128](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2024.03.15.585128)]\n\n**卷积神经网络在蛋白质序列预训练方面可与变压器相媲美。**  \n凯文·K·杨、尼科洛·富西、亚历克斯·X·卢。  \n*《细胞系统》，2024年2月。*  \n[[10.1016\u002Fj.cels.2024.01.008](https:\u002F\u002Fdoi.org\u002F10.1016\u002Fj.cels.2024.01.008)]\n\n**两种基于序列和两种基于结构的机器学习模型已分别学习到蛋白质生物化学的不同方面。**  \n安娜斯塔西娅·V·库利科娃、丹尼尔·J·迪亚斯、陈天龙、T·杰弗里·科尔、安德鲁·D·埃灵顿及克劳斯·O。  \n*《科学报告》，2023年8月。*  \n[[10.1038\u002Fs41598-023-40247-w](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41598-023-40247-w)]\n\n**Domain-PFP：利用功能感知域嵌入表示进行蛋白质功能预测。**  \n纳比勒·伊布泰哈兹、加贺屋由纪、木原大介。  \n*预印本，2023年8月。*  \n[[10.1101\u002F2023.08.23.554486](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.08.23.554486)]\n\n**来自等变图变换器的上下文相关蛋白质与抗体编码。**  \n赛·普贾·马哈詹、杰弗里·A·鲁弗洛、杰弗里·J·格雷。  \n*预印本，2023年7月。*  \n[[10.1101\u002F2023.07.15.549154](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.07.15.549154)]\n\n**Ankh：优化的蛋白质语言模型解锁通用建模能力。**  \n艾哈迈德·埃尔纳加尔、哈泽姆·埃萨姆、瓦法·萨拉赫-埃尔丁、瓦利德·穆斯塔法、穆罕默德·埃尔克尔达维、夏洛特·罗什罗、布尔克哈德·罗斯特。  \n*预印本，2023年6月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2301.06568)]\n\n**结构感知的蛋白质自监督学习。**  \n陈灿（萨姆）、周景波、王帆、刘雪、窦德静。  \n*《生物信息学》，2023年4月。*  \n[[10.1093\u002Fbioinformatics\u002Fbtad189](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbtad189)]\n\n**轻量级对比式蛋白质结构—序列转换。**  \n郑江斌、王革、黄宇飞、胡博振、李思远、陈成、范新文、李斯坦 Z。  \n*预印本，2023年3月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2303.11783)]\n\n**蛋白质序列与结构联合表征学习的系统性研究。**  \n张左白、王传睿、徐明浩、钱塔马拉克尚、奥蕾莉·洛萨诺、帕耶尔·达斯、唐健。  \n*预印本，2023年3月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2303.06275)]\n\n**结构信息驱动的语言模型是蛋白质设计师。**  \n郑在祥、邓一凡、薛东宇、周毅、叶飞、顾全全。  \n*预印本，2023年2月。*  \n[[10.1101\u002F2023.02.03.526917](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.02.03.526917)]\n\n**用于蛋白质表征学习的检索式序列增强。**  \n马畅、赵海腾、郑林、辛嘉义、李钦通、吴立军、邓志宏、陆洋、刘奇、孔令鹏。  \n*预印本，2023年2月。*  \n[[10.1101\u002F2023.02.22.529597](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.02.22.529597)]\n\n**ProtST：蛋白质序列与生物医学文本的多模态学习。**  \n徐明浩、袁鑫宇、圣地亚哥·米雷特、唐健。  \n*预印本，2023年1月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2301.12040)]\n\n**密码子语言嵌入为蛋白质工程提供强大信号。**  \n卡洛斯·欧特伊拉尔、夏洛特·M·迪恩。  \n*预印本，2022年12月。*  \n[[10.1101\u002F2022.12.15.519894](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.12.15.519894)]\n\n**当几何深度学习遇见预训练的蛋白质语言模型时。**  \n吴芳、陶宇、德拉戈米尔·拉德夫、许金波。  \n*预印本，2022年12月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2212.03447)]\n\n**利用图神经网络对蛋白质表征进行对比学习，以实现结构与功能注释。**  \n罗佳琪、罗宇楠。  \n*预印本，2022年12月。*  \n[[10.1101\u002F2022.11.29.518451](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.11.29.518451)]\n\n**在人工切割的蛋白质上训练自监督肽序列模型。**  \n吉尔·萨德、王子辰、贾斯琳·格雷瓦尔、胡泽法·兰格瓦拉、莱恩·普赖斯。  \n*预印本，2022年11月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2211.06428)]\n\n**利用序列迁移的掩码反向折叠进行蛋白质表征学习。**  \n凯文·K·杨、尼科洛·扎尼凯利、休·叶。  \n*《蛋白质工程、设计与选择》，2022年10月。*  \n[[10.1093\u002Fprotein\u002Fgzad015](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fprotein\u002Fgzad015)]\n\n**处于进化尺度上的蛋白质序列语言模型能够实现准确的结构预测。**  \n林泽明、哈利尔·阿金、罗山·拉奥、布赖恩·希、朱中凯、陆文婷、阿兰·多斯桑托斯科斯塔、玛丽亚姆·法泽尔-扎兰迪、汤姆·塞尔库、萨尔·坎迪多、亚历山大·里夫斯。  \n*预印本，2022年7月。*  \n[[10.1101\u002F2022.07.20.500902](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.07.20.500902)]\n\n**借助语言学推进蛋白质语言模型：提升可解释性的路线图。**  \n武氏美河、拉赫马德·阿克巴尔、菲利普·A·罗伯特、巴特沃米耶·斯维亚特恰克、维克托·格莱夫、盖尔·凯蒂尔·桑德韦、达格·特吕格韦·特鲁斯勒·豪格。  \n*预印本，2022年7月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2207.00982)]\n\n**自监督深度学习能够编码蛋白质亚细胞定位的高分辨率特征。**  \n小林博史、基思·C·切弗尔斯、曼努埃尔·D·莱昂内蒂和洛伊克·A·罗耶。  \n*自然方法，2022年7月。*  \n[[10.1038\u002Fs41592-022-01541-z](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41592-022-01541-z)]\n\n**COLLAPSE：用于识别和表征蛋白质结构位点的表示学习框架。**  \n亚历山大·德里、罗斯·B·奥特曼。  \n*预印本，2022年7月。*  \n[[10.1101\u002F2022.07.20.500713](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.07.20.500713)]\n\n**CoSP：口袋与配体的协同监督预训练。**  \n高张阳、陈诚、吴立荣、李善志。  \n*预印本，2022年6月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2206.12241)]\n\n**利用分子动力学模拟对蛋白质模型进行药物结合前的预训练。**  \n吴峰、张琪、拉德夫、王勇、金鑫、江洋、李士卓、牛震。  \n*预印本，2022年6月。*  \n[[10.21203\u002Frs.3.rs-1566483\u002Fv1](https:\u002F\u002Fdoi.org\u002F10.21203\u002Frs.3.rs-1566483\u002Fv1)]\n\n**探索基于进化且无需&的蛋白质语言模型作为蛋白质功能预测器。**  \n胡明阳、袁发杰、杨凯文、鞠福松、苏瑾、王辉、杨飞、丁秋阳。  \n*预印本，2022年6月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2206.06583)]\n\n**利用蛋白质语言模型计算进化速率。**  \n布莱恩·L·希、杨凯文、彼得·S·金。  \n*细胞系统，2022年4月。*  \n[[10.1016\u002Fj.cels.2022.01.003](https:\u002F\u002Fdoi.org\u002F10.1016\u002Fj.cels.2022.01.003)]\n\n**利用无监督语言建模识别酶活性位点。**  \n洛伊克·夸特·达西、马泰奥·马尼卡、丹尼尔·普罗布斯特、菲利普·施瓦勒、伊夫斯·加埃坦·纳纳·特乌坎、特奥多罗·莱诺。  \n*预印本，2021年11月。*  \n[[10.33774\u002Fchemrxiv-2021-m20gg](https:\u002F\u002Fdoi.org\u002F10.33774\u002Fchemrxiv-2021-m20gg)]\n\n**人工智能引导的内在无序蛋白构象挖掘。**  \n阿尤什·古普塔、索维克·戴、周焕翔。  \n*预印本，2021年11月。*  \n[[10.1101\u002F2021.11.21.469457](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.11.21.469457)]\n\n**利用自监督学习破译抗体的语言。**  \n李振宇、劳拉·S·米切尔、詹姆斯·H.R·法默里、贾斯汀·巴顿、雅各布·D·加尔森。  \n*预印本，2021年11月。*  \n[[10.1101\u002F2021.11.10.468064](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.11.10.468064)]\n\n**通过成对掩码语言模型预训练共进化的蛋白质表示。**  \n何亮、张世卓、吴立军、夏欢欢、鞠福松、张鹤、刘思远、夏英策、朱建伟、邓攀、邵斌、秦涛、刘铁燕。  \n*预印本，2021年10月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2110.15527)]\n\n**生物序列的神经距离嵌入。**  \n加布里埃莱·科尔索、雷克斯·英、米哈尔·潘迪、佩塔尔·韦利奇科维奇、朱雷·莱斯科韦茨、皮耶特罗·利奥。  \n*预印本，2021年9月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2109.09740)]\n\n**具有生物学意义的迁移学习可改善转录因子结合预测。**  \n格尔曼·诺瓦科夫斯基、马努·萨拉斯瓦特、奥里奥尔·福尔内斯、萨拉·莫斯塔菲和怀斯·W·沃瑟曼。  \n*基因组生物学，2021年9月。*  \n[[10.1186\u002Fs13059-021-02499-5](https:\u002F\u002Fdoi.org\u002F10.1186\u002Fs13059-021-02499-5)]\n\n**迈向更通用的蛋白质设计嵌入：利用序列与结构的联合表示。**  \n萨娜·曼苏尔、白敏京、乌梅什·马丹、埃里克·霍维茨。  \n*预印本，2021年9月。*  \n[[10.1101\u002F2021.09.01.458592](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.09.01.458592)]\n\n**氢键与自注意力相遇：实现通用蛋白质结构嵌入所需的一切。**  \n陈程、赵宇国、朱大明、宁康、崔雪峰。  \n*预印本，2021年8月。*  \n[[10.1101\u002F2021.01.31.428935](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.01.31.428935)]\n\n**利用进化进行对比学习，发现内在无序区域的分子特征。**  \n卢X亚历克斯、卢X艾米、普里蒂沙纳茨·伊娃、扎林·塔拉内、福尔曼-凯·朱莉、摩西斯·艾伦。  \n*预印本，2021年7月。*  \n[[10.1101\u002F2021.07.29.454330](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.07.29.454330)]\n\n**利用变分自编码器从冷冻电镜图像推断原子坐标的连续分布。**  \n丹·罗森鲍姆、玛尔塔·加尔内洛、米哈尔·齐林斯基、查理·比蒂、艾伦·克兰西、安德烈娅·胡贝尔、普什米特·科利、安德鲁·W·塞尼尔、约翰·詹珀、卡尔·多尔施、S.M.阿里·埃斯拉米、奥拉夫·罗嫩贝格、乔纳斯·阿德勒。  \n*预印本，2021年6月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2106.14108)]\n\n**生物序列数据的预训练模型。**  \n宋博生、李子萌、林轩、王建民、王天、傅向正。  \n*功能基因组学简报，2021年5月。*  \n[[10.1093\u002Fbfgp\u002Felab025](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbfgp\u002Felab025)]\n\n**ProteinBERT：一种通用的蛋白质序列与功能深度学习模型。**  \n纳达夫·布兰德斯、丹·奥弗、亚姆·佩莱格、纳达夫·拉波波特、米哈尔·利尼亚尔。  \n*预印本，2021年5月。*  \n[[10.1101\u002F2021.05.24.445464](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.05.24.445464)]\n\n**随机嵌入与线性回归即可预测蛋白质功能。**  \n陆天宇、卢X亚历克斯、摩西斯·艾伦。  \n*预印本，2021年4月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2104.14661)]\n\n**结合进化数据与实验标记数据进行蛋白质适应度预测。**  \n克洛伊·许、亨特·尼索诺夫、克拉拉·范姜、珍妮弗·利斯特加滕。  \n*预印本，2021年3月。*  \n[[10.1101\u002F2021.03.28.437402](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.03.28.437402)]\n\n**MSA Transformer。**  \n罗尚·拉奥、杰森·刘、罗伯特·费库伊尔、乔舒亚·迈尔、约翰·F·坎尼、彼得·阿贝尔、汤姆·塞尔库、亚历山大·里夫斯。  \n*预印本，2021年2月。*  \n[[10.1101\u002F2021.02.12.430858](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.02.12.430858)]\n\n**通过数据增强提高蛋白质序列模型的泛化能力。**  \n申宏宇、莱恩·C·普赖斯、塔哈·巴哈多里、弗兰齐斯卡·西格尔。  \n*预印本，2021年2月。*  \n[[10.1101\u002F2021.02.18.431877](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.02.18.431877)]\n\n**利用域架构上的自监督学习捕捉蛋白质结构域的结构与功能。**  \n达米亚诺斯·P·梅利迪斯、沃尔夫冈·内伊德尔。  \n*算法，2021年1月。*  \n[[10.3390\u002Fa14010028](https:\u002F\u002Fdoi.org\u002F10.3390\u002Fa14010028)]\n\n**蛋白质序列的对抗式对比预训练。**  \n马修·B.A.麦克德莫特、布伦丹·叶普、哈里·许、金迪、彼得·索洛维茨。  \n*预印本，2021年1月。*  \n[[arxiv](http:\u002F\u002Farxiv.org\u002Fabs\u002F2102.00466)]\n\n**蛋白质表面的快速端到端学习。**  \n弗雷尔·斯韦里松、让·费迪、布鲁诺·E·科雷亚、迈克尔·M·布朗斯坦。  \n*预印本，2020年12月。*  \n[[10.1101\u002F2020.12.28.424589](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.12.28.424589)]\n\n**Transformer蛋白质语言模型是无监督的结构学习者。**  \n罗尚·拉奥、谢尔盖·奥夫钦尼科夫、乔舒亚·迈尔、亚历山大·里夫斯、汤姆·塞尔库。  \n*预印本，2020年12月。*  \n[[10.1101\u002F2020.12.15.422761](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.12.15.422761)]\n\n**蛋白质三级结构的自监督表示学习（PtsRep）：以蛋白质工程为例**  \n罗俊文、蔡毅、吴嘉林、蔡宏敏、杨晓峰、林章林。  \n*预印本，2020年12月。*  \n[[10.1101\u002F2020.12.22.423916](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.12.22.423916)]\n\n**什么是蛋白质序列有意义的表示？**  \n尼基·斯卡夫特·德特勒夫森、索伦·豪贝格、沃特·布姆斯马。  \n*预印本，2020年11月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2012.02679v3)]\n\n**谱预测：一种基于比对的蛋白质序列模型预训练任务**  \n帕斯卡尔·施图尔姆费尔斯、杰西·维格、阿里·马达尼、纳兹宁·法蒂玛·拉贾尼。  \n*预印本，2020年11月。*  \n[[arxiv](http:\u002F\u002Farxiv.org\u002Fabs\u002F2012.00195)] \n\n**利用上下文透镜生成固定长度的蛋白质嵌入**  \n阿米尔·沙内萨扎德、大卫·贝兰格、大卫·多汉。  \n*预印本，2020年10月。*  \n[[arxiv](http:\u002F\u002Farxiv.org\u002Fabs\u002F2010.15065)] \n\n**蛋白质表示学习方法评估：定量分析**  \n塞尔布伦特·温萨尔、赫瓦尔·阿塔什、穆阿默尔·阿尔拜拉克、凯末尔·图尔汉、艾巴尔·C·阿卡尔、通卡·多安。  \n*预印本，2020年10月。*  \n[[10.1101\u002F2020.10.28.359828](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.10.28.359828)]\n\n**通过互信息最大化进行蛋白质表示的自监督对比学习**  \n艾米·X·卢、张浩然、马尔泽耶·加塞米、艾伦·摩西。  \n*预印本，2020年9月。*  \n[[10.1101\u002F2020.09.04.283929](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.09.04.283929)]\n\n**ProtTrans：通过自监督深度学习和高性能计算破解生命密码的语言**  \n艾哈迈德·埃尔纳加尔、迈克尔·海因辛格、克里斯蒂安·达拉戈、加利亚·雷哈维、王宇、利昂·琼斯、汤姆·吉布斯、塔马斯·费赫尔、克里斯托夫·安格雷尔、马丁·施泰内格尔、德布辛杜·鲍米克、布尔克哈德·罗斯特。  \n*预印本，2020年7月。*  \n[[10.1101\u002F2020.07.12.199554](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.07.12.199554)]\n\n**无监督蛋白质嵌入在预测分子功能方面优于手工设计的序列和结构特征**  \n阿梅莉亚·比列加斯-莫尔西略、斯塔夫罗斯·马克罗迪米特里斯、罗兰德·范哈姆、安赫尔·M·戈麦斯、维多利亚·桑切斯、马塞尔·莱因德斯。  \n*预印本，2020年4月。*  \n[[10.1101\u002F2020.04.07.028373](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.04.07.028373)]\n\n**Site2Vec：一种参考系不变的算法，用于蛋白质-配体结合位点的向量嵌入**  \n阿尔纳布·巴德拉、卡利达斯·Y。  \n*预印本，2020年3月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2003.08149v1)]\n\n**面向蛋白质工程的整合进化背景的深度序列建模**  \n鲁云楠、武蓝、丁瀚田、苏宇峰、刘洋、韦斯利·魏谦、赵慧敏、彭健。  \n*预印本，2020年1月。*  \n[[10.1101\u002F2020.01.16.908509](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.01.16.908509)]\n\n**序列表示及其在预测蛋白质—蛋白质相互作用中的应用**  \n丹纳贾伊·基莫蒂、普拉韦什·比亚尼、詹姆斯·M·霍根。  \n*预印本，2019年12月。*  \n[[10.1101\u002F2019.12.31.890699](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2019.12.31.890699)]\n\n**生物序列的语言建模——精选数据集与基准模型**  \n何塞·胡安·阿尔马格罗·阿门特罗斯、亚历山大·罗森伯格·约翰森、奥莱·温特、亨里克·尼尔森。  \n*预印本，2019年12月。*  \n[[alrojo.github.io](https:\u002F\u002Falrojo.github.io\u002Fmedia\u002Fpublications\u002FLMProteins\u002Fpreprint.pdf)]\n\n**利用潜在空间模型解析蛋白质进化与适应度景观**  \n丁新强、邹正廷、查尔斯·L·布鲁克斯三世。  \n《自然通讯》，2019年12月。  \n[[10.1038\u002Fs41467-019-13633-0](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41467-019-13633-0)]\n\n**端到端多任务学习：从蛋白质语言到蛋白质特征，无需比对**  \n艾哈迈德·埃尔纳加尔、迈克尔·海因辛格、克里斯蒂安·达拉戈、布尔克哈德·罗斯特。  \n*预印本，2019年12月。*  \n[[10.1101\u002F864405](https:\u002F\u002Fdoi.org\u002F10.1101\u002F864405)]\n\n**仅基于序列的深度表示学习实现统一的理性蛋白质工程**  \n伊森·C·艾利、格里戈里·希穆利亚、苏罗吉特·比斯瓦斯、穆罕默德·阿尔库赖希、乔治·M·丘奇。  \n《自然方法》，2019年10月。  \n[[10.1038\u002Fs41592-019-0598-1](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41592-019-0598-1)]\n\n**基于图卷积网络的结构导向功能预测**  \n弗拉基米尔·格利戈里耶维奇、P·道格拉斯·伦弗鲁、托马什·科希奥莱克、朱莉娅·科勒勒曼、孔炯贤、汤米·瓦塔宁、丹尼尔·贝伦贝格、布林·泰勒、伊恩·M·菲斯克、拉姆尼克·J·泽维尔、罗布·奈特、理查德·邦诺。  \n*预印本，2019年10月。*  \n[[0.1101\u002F786236](https:\u002F\u002Fdoi.org\u002F10.1101\u002F786236)]\n\n**生命的语言建模——蛋白质序列的深度学习**  \n迈克尔·海因辛格、艾哈迈德·埃尔纳加尔、王宇、克里斯蒂安·达拉戈、德米特里·涅恰耶夫、弗洛里安·马特斯、布尔克哈德·罗斯特。  \n*预印本，2019年9月。*  \n[[10.1101\u002F614313](https:\u002F\u002Fdoi.org\u002F10.1101\u002F614313)]\n\n**用序列信息增强蛋白质网络嵌入**  \n哈桑·卡内、穆罕默德·K·库利巴利、佩尔金斯·阿贾诺、阿里·阿卜杜拉。  \n*预印本，2019年8月。*  \n[[10.1101\u002F730481](https:\u002F\u002Fdoi.org\u002F10.1101\u002F730481)]\n\n**用于蛋白质分类的通用深度序列模型**  \n尼尔斯·斯特罗特霍夫、帕特里克·瓦格纳、马库斯·文策尔、沃伊切赫·萨梅克。  \n*预印本，2019年7月。*  \n[[10.1101\u002F704874](https:\u002F\u002Fdoi.org\u002F10.1101\u002F704874)]\n\n**DeepPrime2Sec：基于一级序列的蛋白质二级结构深度学习预测**  \n埃赫萨内丁·阿斯加里、妮娜·波尔纳、爱丽丝·C·麦克哈迪、穆罕默德·R·K·莫夫拉德。  \n*预印本，2019年7月。*  \n[[10.1101\u002F705426](https:\u002F\u002Fdoi.org\u002F10.1101\u002F705426)]\n\n**一种自洽的声音化方法，将氨基酸序列转化为音乐作品，并应用于人工智能驱动的蛋白质设计**  \n余志华、秦照、弗朗西斯科·J·马丁-马丁内斯、马库斯·J·布勒尔。  \n《ACS纳米》，2019年6月。  \n[[10.1021\u002Facsnano.9b02180](https:\u002F\u002Fdoi.org\u002F10.1021\u002Facsnano.9b02180)]\n\n**使用TAPE评估蛋白质迁移学习**  \n罗尚·拉奥、尼古拉斯·巴塔查里亚、尼尔·托马斯、段燕、陈曦、约翰·坎尼、皮特·阿贝尔、宋云S。  \n*预印本，2019年6月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F1906.08230)]\n\n**利用神经网络中的隐式知识对蛋白质进行功能解析与工程改造**  \n尤利乌斯·乌普迈尔·祖·贝尔岑、托雷·布尔格尔、施特凡·霍尔德巴赫、费利克斯·布贝克、卢卡斯·亚当、卡塔琳娜·甘多尔、玛丽塔·克莱因、扬·马托尼、保琳·普富德勒、卢卡斯·普拉茨、莫里茨·普日比利拉、马克思·施文德曼、丹尼尔·海德、马赖克·丹妮拉·霍夫曼、迈克尔·延德鲁施、卡罗琳·施梅拉斯、马克思·瓦尔德豪尔、伊琳娜·莱曼、多米尼克·尼奥佩克、罗兰德·艾尔斯。  \n《自然机器智能》，2019年5月。  \n[[Nature Machine Intelligence](https:\u002F\u002Fwww.nature.com\u002Farticles\u002Fs42256-019-0049-9)]\n\n**生命的语言建模——蛋白质序列的深度学习**  \n迈克尔·海因辛格、艾哈迈德·埃尔纳加尔、王宇、克里斯蒂安·达拉戈、德米特里·涅恰耶夫、弗洛里安·马特斯、布尔克哈德·罗斯特。  \n*预印本，2019年5月。*  \n[[10.1101\u002F614313](https:\u002F\u002Fdoi.org\u002F10.1101\u002F614313)] [[bioRxiv](https:\u002F\u002Fwww.biorxiv.org\u002Fcontent\u002F10.1101\u002F614313v2)]\n\n**生物学结构与功能源于将无监督学习扩展至2.5亿条蛋白质序列。**  \n亚历山大·里夫斯、西达尔特·戈亚尔、乔舒亚·迈尔、德米·郭、迈尔·奥特、C·劳伦斯·齐特尼克、杰里·马、罗布·费格斯。  \n*预印本，2019年4月。*  \n[[10.1101\u002F622803](https:\u002F\u002Fdoi.org\u002F10.1101\u002F622803)] [[bioRxiv](https:\u002F\u002Fwww.biorxiv.org\u002Fcontent\u002F10.1101\u002F622803v1)]\n\n**从序列数据中学习蛋白质的组成性基序。**  \n热罗姆·图比阿纳、西蒙娜·科科、雷米·莫纳松。  \n*eLife，2019年3月。*  \n[[10.7554\u002FeLife.39397](https:\u002F\u002Fdoi.org\u002F10.7554\u002FeLife.39397)]\n\n**用于判别性基序发现（DiMotif）和序列嵌入（ProtVecX）的蛋白质序列概率性变长分割方法。**  \n埃赫萨内丁·阿斯加里、爱丽丝·C·麦克哈迪、穆罕默德·R·K·莫弗拉德。  \n*科学报告，2019年3月。*  \n[[10.1038\u002Fs41598-019-38746-w](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41598-019-38746-w)]\n\n**利用结构信息学习蛋白质序列嵌入。**  \n特里斯坦·贝普勒、邦妮·伯格。  \n*国际表征学习会议，2019年2月。*  \n[[ICLR](https:\u002F\u002Farxiv.org\u002Fabs\u002F1902.08661)]\n\n**傅里叶变换与蛋白质化学计量学原理在蛋白质工程中的应用。**  \n弗雷德里克·卡代、尼古拉斯·丰泰纳、伊亚纳尔·韦特里维尔、马蒂厄·吴福昌、奥利维埃·萨夫里亚马、泽维尔·卡代、菲利普·夏尔东。  \n*BMC生物信息学，2018年10月。*  \n[[10.1186\u002Fs12859-018-2407-8](https:\u002F\u002Fdoi.org\u002F10.1186\u002Fs12859-018-2407-8)]\n\n**用于机器学习的蛋白质学习嵌入。**  \n凯文·K·杨、扎卡里·吴、克莱尔·N·贝德布鲁克、弗朗西斯·H·阿诺德  \n*生物信息学，2018年8月*  \n[[10.1093\u002Fbioinformatics\u002Fbty178](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbty178)]\n\n**用于注释、发现和工程的深度语义蛋白质表示。**  \n艾瑞尔·S·施瓦茨、格雷戈里·J·汉南、扎克·R·德维尔、迈克尔·E·斯穆特、安娜·R·格兰特、杰森·M·奈特、斯科特·A·贝克尔、乔纳森·R·伊兹、马修·C·拉法夫、哈里尼·埃瓦尼、尹音·刘、阿尔君·K·班萨尔、托比·H·理查德森   \n*预印本，2018年7月*   \n[[10.1101\u002F365965](https:\u002F\u002Fdoi.org\u002F10.1101\u002F365965)]  \n\n**肽和蛋白质定量构效关系建模的改进描述符。**  \n马克·H·巴利、尼古拉斯·J·特纳、罗伊斯顿·古达克尔。  \n*化学信息与建模杂志，2018年1月。*  \n[[10.1021\u002Facs.jcim.7b00488](https:\u002F\u002Fdoi.org\u002F10.1021\u002Facs.jcim.7b00488)]\n\n**蛋白质序列的变分自编码。**  \n萨姆·西奈、埃里克·凯尔西、乔治·M·丘奇、马丁·A·诺瓦克  \n*预印本，2017年12月*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F1712.03346)]\n\n**利用词嵌入和循环神经网络预测蛋白质结合亲和力。**  \n卡洛·马扎费罗。  \n*预印本，2017年4月。*  \n[[10.1101\u002F128223](https:\u002F\u002Fdoi.org\u002F10.1101\u002F128223)] [[bioRxiv](https:\u002F\u002Fwww.biorxiv.org\u002Fnode\u002F37703.abstract)]\n\n**dna2vec：可变长度k-mer的一致向量表示。**  \n帕特里克·吴  \n*预印本，2017年1月*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F1701.06279)]\n\n**用于生物序列分析的分布式表示。**  \n丹安贾伊·基莫蒂、阿克沙伊·索尼、普拉韦什·比亚尼、詹姆斯·M·霍根  \n*预印本，2016年8月*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F1608.05949)]\n\n**ProFET：特征工程捕捉蛋白质的高层次功能。**  \n丹·奥弗、米哈尔·利尼亚尔。  \n*生物信息学，2015年6月。*  \n[[10.1093\u002Fbioinformatics\u002Fbtv345](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbtv345)]\n\n**AAindex：氨基酸索引数据库，2008年进展报告。**  \n川岛修一、皮奥特·波卡罗夫斯基、玛丽亚·波卡罗夫斯卡、安杰伊·科林斯基、片山俊明、金久弥生。  \n*核酸研究，2008年1月。*  \n[[10.1093\u002Fnar\u002Fgkm998](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fnar\u002Fgkm998)]\n\n### 无监督变异预测\n\n**人类蛋白质错义突变的预测机制影响。**  \nJurgen Janes、Marc Muller、Senthil Selvaraj、Diogo Manoel、James Stephenson、Catarina Goncalves、Aleix Lafita、Benjamin Polacco、Kirsten Obernier、Kaur Alasoo、Manuel C Lemos、Nevan Krogan、Maria Martin、Luis R. Saraiva、David Burke、Pedro Beltrao。  \n*预印本，2024年5月。*  \n[[10.1101\u002F2024.05.29.596373](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2024.05.29.596373)]\n\n**解码人类蛋白质组中功能丧失型突变的分子机制。**  \nMatteo Cagiada、Nicolas Jonsson、Kresten Lindorff-Larsen。  \n*预印本，2024年5月。*  \n[[10.1101\u002F2024.05.21.595203](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2024.05.21.595203)]\n\n**AlphaFold2 可以预测单点突变效应。**  \nJohn M. McBride、Konstantin Polev、Amirbek Abdirasulov、Vladimir Reinharz、Bartosz A. Grzybowski、Tsvi Tlusty。  \n*自然杂志，2023年10月。*  \n[[10.1101\u002F2022.04.14.488301](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.04.14.488301)]\n\n**从大流行前数据中学习以预测病毒逃逸。**  \nNicole N. Thadani、Sarah Gurev、Pascal Notin、Noor Youssef、Nathan J. Rollins、Daniel Ritter、Chris Sander、Yarin Gal 和 Debora S. Marks。  \n*自然杂志，2023年10月。*  \n[[10.1038\u002Fs41586-023-06617-0](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41586-023-06617-0)]\n\n**利用深度蛋白质语言模型进行全基因组疾病突变效应预测。**  \nNadav Brandes、Grant Goldman、Charlotte H. Wang、Chun Jimmie Ye 和 Vasilis Ntranos。  \n*自然遗传学，2023年8月。*  \n[[10.1038\u002Fs41588-023-01465-0](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41588-023-01465-0)]\n\n**蛋白质适应度预测受语言模型、集成学习和采样方法相互作用的影响。**  \nMehrsa Mardikoraem、Daniel Woldring。  \n*预印本，2023年2月。*  \n[[10.1101\u002F2023.02.09.527362](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.02.09.527362)]\n\n**利用预训练蛋白质语言模型嵌入预测免疫逃逸。**  \nKyle Swanson、Howard Chang、James Zou。  \n*预印本，2022年12月。*  \n[[10.1101\u002F2022.11.30.518466](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.11.30.518466)]\n\n**蛋白质语言模型中的救援突变揭示了临床相关基因中的突变效应与结构特征。**  \nOnuralp Soylemez、Pablo Cordero。  \n*预印本，2022年11月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2211.10000)]\n\n**基于深度突变扫描的突变效应预测器更新基准测试。**  \nBenjamin J. Livesey、Joseph A. Marsh。  \n*预印本，2022年11月。*  \n[[10.1101\u002F2022.11.19.517196](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.11.19.517196)]\n\n**利用 RoseTTAFold 准确预测突变效应。**  \nSanaa Mansoor、Minkyung Baek、David Juergens、Joseph L. Watson、David Baker。  \n*预印本，2022年11月。*  \n[[10.1101\u002F2022.11.04.515218](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.11.04.515218)]\n\n**基于 Transformer 的多结构域蛋白突变效应预测的进化调优协议。**  \nHideki Yamaguchi、Yutaka Saito。  \n*生物信息学简报，2021年11月。*  \n[[10.1093\u002Fbib\u002Fbbab234](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbib\u002Fbbab234)]\n\n**利用进化数据的深度生成模型进行疾病突变预测。**  \nJonathan Frazer、Pascal Notin、Mafalda Dias、Aidan Gomez、Joseph K Min、Kelly Brock、Yarin Gal、Debora S Marks。  \n*自然杂志，2021年11月。*  \n[[10.1038\u002Fs41586-021-04043-8](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41586-021-04043-8)]\n\n**语言模型实现对蛋白质功能突变效应的零样本预测。**  \nJoshua Meier、Roshan Rao、Robert Verkuil、Jason Liu、Tom Sercu、Alexander Rives。  \n*预印本，2021年7月。*  \n[[10.1101\u002F2021.07.09.450648](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.07.09.450648)]\n\n**从深度突变扫描中无监督推断蛋白质适应度景观。**  \nJorge Fernandez-de-Cossio-Diaz、Guido Uguzzoni、Andrea Pagnani。  \n*预印本，2020年3月。*  \n[[10.1101\u002F2020.03.18.996595](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.03.18.996595)]\n\n**遗传变异的深度生成模型捕捉突变效应。**  \nAdam J. Riesselman、John B. Ingraham、Debora S. Marks。  \n*自然方法，2018年9月。*  \n[[10.1038\u002Fs41592-018-0138-4](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41592-018-0138-4)]\n\n**蛋白质序列的变分自编码。**  \nSam Sinai、Eric Kelsic、George M. Church、Martin A. Nowak。  \n*预印本，2017年12月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F1712.03346)]\n\n### 生成模型\n\n**在 24 小时 GPU 时间内完成蛋白质语言模型训练。**  \nNathan C. Frey、Taylor Joren、Aya Abdelsalam Ismail、Allen Goodman、Richard Bonneau、Kyunghyun Cho、Vladimir Gligorijević。  \n*预印本，2024年5月。*  \n[[10.1101\u002F2024.05.14.594108](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2024.05.14.594108)]\n\n**学习蛋白质结构的语言。**  \nBenoit Gaujac、Jérémie Donà、Liviu Copoiu、Timothy Atkinson、Thomas Pierrot、Thomas D. Barrett。  \n*预印本，2024年5月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2405.15840)]\n\n**众里寻一：利用 Genie 2 在结构宇宙尺度上设计和构建蛋白质支架。**  \nYeqing Lin、Minji Lee、Zhao Zhang、Mohammed AlQuraishi。  \n*预印本，2024年5月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2405.15489)]\n\n**ProtMamba：一种具有同源性感知但无需比对的蛋白质状态空间模型。**  \nDamiano Sgarbossa、Cyril Malbranke、Anne-Florence Bitbol。  \n*预印本，2024年5月。*  \n[[10.1101\u002F2024.05.24.595730](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2024.05.24.595730)]\n\n**ProtT3：用于文本化蛋白质理解的蛋白质到文本生成。**  \nZhiyuan Liu、An Zhang、Hao Fei、Enzhi Zhang、Xiang Wang、Kenji Kawaguchi、Tat-Seng Chua。  \n*预印本，2024年5月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2405.12564)]\n\n**蛋白质结构的连续语言。**  \nLukas Billera、Anton Oresten、Aron Stålmarck、Kenta Sato、Mateusz Kaduk、Ben Murrell。  \n*预印本，2024年5月。*  \n[[10.1101\u002F2024.05.11.593685](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2024.05.11.593685)]\n\n**通过建模 CRISPR-Cas 序列宇宙设计高功能基因组编辑工具。**  \nJeffrey A. Ruffolo、Stephen Nayfach、Joseph Gallagher、Aadyot Bhatnagar、Joel Beazer、Riffat Hussain、Jordan Russ、Jennifer Yip、Emily Hill、Martin Pacesa、Alexander J. Meeske、Peter Cameron、Ali Madani。  \n*预印本，2024年4月。*  \n[[10.1101\u002F2024.04.22.590591](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2024.04.22.590591)]\n\n**基于语言模型嵌入的扩散过程用于蛋白质序列生成。**  \nViacheslav Meshchaninov、Pavel Strashnov、Andrey Shevtsov、Fedor Nikolaev、Nikita Ivanisenko、Olga Kardymon、Dmitry Vetrov。  \n*预印本，2024年3月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2403.03726)]\n\n**通过折叠扩散生成蛋白质结构。**  \nKevin E. Wu、Kevin K. Yang、Rianne van den Berg、James Y. Zou、Alex X. Lu、Ava P. Amini。  \n*自然通讯，2024年2月。*  \n[[10.1038\u002Fs41467-024-45051-2](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41467-024-45051-2)]\n\n**Proteus：探索蛋白质结构生成以提升可设计性和效率。**  \nChentong Wang、Yannan Qu、Zhangzhi Peng、Yukai Wang、Hongli Zhu、Dachuan Chen、Longxing Cao。  \n*预印本，2024年2月。*  \n[[10.1101\u002F2024.02.10.579791](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2024.02.10.579791)]\n\n**扩散语言模型是多功能的蛋白质学习器。**  \n王鑫友、郑在祥、叶飞、薛东宇、黄树建、顾全全。  \n*预印本，2024年2月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2402.18567)]\n\n**用于多配体对接和结合位点设计的谐波自条件流匹配。**  \n汉内斯·施塔克、景博文、雷吉娜·巴尔扎伊、汤米·雅科拉。  \n*预印本，2023年11月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2310.05764)]\n\n**基于SE(3)流匹配的快速蛋白质主链生成。**  \n杰森·尹、安德鲁·坎贝尔、安德鲁·Y·K·冯、迈克尔·加斯特格、何塞·希门尼斯-卢纳、莎拉·刘易斯、维克托·加西亚·萨托拉斯、巴斯蒂安·S·维林、雷吉娜·巴尔扎伊、汤米·雅科拉、弗兰克·诺埃。  \n*预印本，2023年10月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2310.05297v2)]\n\n**用于蛋白质主链生成的SE(3)-随机流匹配。**  \n阿维谢克·乔伊·博斯、塔拉·阿洪德-萨德格、基利安·法特拉斯、纪尧姆·于盖、贾里德·雷克托-布鲁克斯、刘承浩、安德烈·克里斯蒂安·尼卡、马克西姆·科拉布廖夫、迈克尔·布朗斯坦、亚历山大·通。  \n*预印本，2023年10月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2310.02391)]\n\n**基于模体的蛋白质序列与结构联合设计。**  \n宋振桥、赵云龙、宋宇飞、石文贤、杨阳、李磊。  \n*预印本，2023年10月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2310.02546)]\n\n**PepMLM：基于掩码语言模型的目标序列条件化肽结合物生成。**  \n陈天来、莎拉·佩尔策米迪斯、里奥·沃森、文卡塔·斯里卡尔·卡维拉尤尼、阿什利·许、普拉奈·武雷、里沙布·普卢古尔塔、索菲娅·文科夫、劳伦·洪、田王、维维安·尤迪斯蒂拉、埃琳娜·哈勒尔、赵琳、普拉南·查特吉。  \n*预印本，2023年10月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2310.03842)]\n\n**通过自然酶序列的生成式建模提升荧光素酶活性与稳定性。**  \n谢文俊、刘党亮、王晓娅、张傲轩、魏启嘉、阿希姆·南迪、董苏伟、阿里耶·瓦舍尔。  \n*预印本，2023年10月。*  \n[[10.1101\u002F2023.09.18.558367](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.09.18.558367)]\n\n**利用进化扩散进行蛋白质生成：只需序列即可。**  \n莎拉·阿拉姆达里、尼提娅·塔卡尔、里安娜·范登伯格、亚历克斯·西杰·卢、尼科洛·富西、艾娃·帕尔迪斯·阿米尼、凯文·K·杨。  \n*预印本，2023年9月。*  \n[[10.1101\u002F2023.09.11.556673](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.09.11.556673)]\n\n**利用小型蛋白质语言模型高效准确地生成序列。**  \n雅伊萨·塞拉诺、塞尔吉·罗达、维克托·瓜亚尔、亚历克西斯·莫利纳。  \n*预印本，2023年8月。*  \n[[10.1101\u002F2023.08.04.551626](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.08.04.551626)]\n\n**应用于蛋白质主链生成的SE(3)扩散模型。**  \n杰森·尹、布莱恩·L·特里普、瓦伦丁·德·博尔托利、埃米尔·马修、阿尔诺·杜塞、雷吉娜·巴尔扎伊、汤米·雅科拉。  \n*ICML，2023年7月。*  \n[ACM](https:\u002F\u002Fdl.acm.org\u002Fdoi\u002F10.5555\u002F3618408.3620080)\n\n**利用RFdiffusion从头设计蛋白质结构与功能。**  \n约瑟夫·L·沃森、大卫·尤尔根斯、纳撒尼尔·R·贝内特、布莱恩·L·特里普、杰森·尹、海伦·E·艾森纳赫、伍迪·阿亨、安德鲁·J·博斯特、罗伯特·J·拉戈特、卢卡斯·F·米尔斯、巴西勒·I·M·威基、尼基塔·哈尼克尔、塞缪尔·J·佩洛克、亚历克西斯·库尔贝、威廉·谢夫勒、王珏、普里塔姆·文卡特什、以撒·萨平顿、苏珊娜·巴斯克斯·托雷斯、安娜·劳科、瓦伦丁·德·博尔托利、埃米尔·马修、谢尔盖·奥夫钦尼科夫、雷吉娜·巴尔扎伊、汤米·S·雅科拉、弗兰克·迪马约、明京·白及大卫·贝克。  \n*Nature，2023年7月。*  \n[[10.1038\u002Fs41586-023-06415-8](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41586-023-06415-8)]\n\n**PoET：作为序列之序列的蛋白质家族生成模型。**  \n蒂莫西·F·特鲁昂二世、特里斯坦·贝普勒。  \n*预印本，2023年6月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2306.06156)]\n\n**利用等变平移进行蛋白质序列与结构协同设计。**  \n史晨策、王传睿、陆佳睿、钟博子涛、唐健。  \n*ICLR，2023年5月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2210.08761)]\n\n**基于注意力机制的扩散模型，利用二级结构约束进行从头蛋白质生成设计。**  \n倪博、戴维·L·卡普兰、马库斯·J·布勒。  \n*Cell Chem，2023年4月。*  \n[[10.1016\u002Fj.chempr.2023.03.020](https:\u002F\u002Fdoi.org\u002F10.1016\u002Fj.chempr.2023.03.020)]\n\n**ProtWave-VAE：将自回归采样与基于潜在空间的推理相结合，用于数据驱动的蛋白质设计。**  \n尼克萨·普拉利亚克、连欣然、拉玛·兰加纳坦、安德鲁·L·费格森。  \n*预印本，2023年4月。*  \n[[10.1101\u002F2023.04.23.537971](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.04.23.537971)]\n\n**ProtFIM：基于蛋白质语言模型的中间填充式蛋白质序列设计。**  \n李有韩、柳河顺。  \n*预印本，2023年3月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2303.16452)]\n\n**通过迭代精炼实现外推式可控序列生成。**  \n维沙克·帕德马库马尔、理查德·袁哲·庞、何贺、安库尔·P·帕里克。  \n*预印本，2023年3月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2303.04562)]\n\n**ProteinVAE：用于翻译型蛋白质设计的变分自编码器。**  \n吕苏悦、沙欣·索夫拉蒂-哈什金、迈克尔·加顿。  \n*预印本，2023年3月。*  \n[[10.1101\u002F2023.03.04.531110](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.03.04.531110)]\n\n**基于多序列比对训练的蛋白质语言模型的生成能力。**  \n达米亚诺·斯加博萨、翁贝托·卢波、安妮-弗洛伦斯·比特博尔。  \n*eLife，2023年2月。*  \n[[10.7554\u002FeLife.79854](https:\u002F\u002Fdoi.org\u002F10.7554\u002FeLife.79854)]\n\n**评估提示调优在条件性蛋白质序列生成中的应用。**  \n安德烈娅·纳森森、凯文·克莱因、伯恩哈德·Y·雷纳德、梅拉尼亚·诺维茨卡、雅库布·M·巴托舍维奇。  \n*预印本，2023年2月。*  \n[[10.1101\u002F2023.02.28.530492](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.02.28.530492)]\n\n**利用深度学习从头设计荧光素酶。**  \nAndy Hsien-Wei Yeh、克里斯托弗·诺恩、雅科夫·基普尼斯、道格·蒂舍尔、塞缪尔·J·佩洛克、德克兰·埃文斯、彭臣·马、Gyu Rie Lee、Jason Z. Zhang、伊万·阿尼申科、布莱恩·科文特里、龙兴·曹、朱斯塔斯·道帕拉斯、萨默尔·哈拉比亚、米歇尔·德威特、劳伦·卡特、K. N. Houk及大卫·贝克。  \n*Nature，2023年2月。*  \n[[10.1038\u002Fs41586-023-05696-3](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41586-023-05696-3)]\n\n**一种文本引导的蛋白质设计框架。**  \n刘圣超、朱宇涛、陆佳睿、徐兆、聂伟力、安东尼·吉特、肖超伟、唐健、郭宏宇、阿尼玛·阿南德库马尔。  \n*预印本，2023年2月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2302.04611)]\n\n**大型语言模型可生成跨不同家族的功能性蛋白质序列。**  \n阿里·马达尼、本·克劳斯、埃里克·R·格林、苏布·苏布拉马尼安、本杰明·P·莫尔、詹姆斯·M·霍尔顿、何塞·路易斯·奥尔莫斯二世、蔡明雄、扎卡里·Z·孙、理查德·索彻、詹姆斯·S·弗雷泽及尼基尔·奈克。  \n*Nature Biotechnology，2023年1月。*  \n[[10.1038\u002Fs41587-022-01618-2](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41587-022-01618-2)]\n\n**利用生成式人工智能解锁从头抗体设计。**  \n阿米尔·沙内萨扎德、莎罗尔·巴查斯、乔治·卡孙、约翰·M·萨顿、安德烈娅·K·施泰格、理查德·帅、克里斯塔·科纳特、亚历克斯·莫雷黑德、安珀·布朗、切尔西·钟、布里安娜·K·卢顿、尼古拉斯·迪亚斯、马特·麦克帕特隆、贝利·奈特、梅西·拉达奇、凯瑟琳·贝特曼、大卫·A·斯宾塞、约万·切约维奇、盖林·科佩克-贝利沃、罗贝尔·海勒、埃德里斯·亚辛、凯伦·麦克洛克西、莫妮卡·纳蒂维达德、达尔顿·查普曼、卢卡·斯托亚诺维奇、戈兰·拉科切维奇、格雷戈里·汉南、恩金·亚皮奇、凯瑟琳·莫兰、罗丹特·卡圭亚特、沙希德·阿卜杜勒哈克、郭哲远、莉莲·R·克鲁格、迈尔斯·甘德尔、乔舒亚·迈尔。  \n*预印本，2023年1月。*  \n[[10.1101\u002F2023.01.08.523187](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.01.08.523187)]\n\n**针对生物活性螺旋肽的高亲和力蛋白质结合剂的从头设计。**  \n苏珊娜·巴斯克斯·托雷斯、菲利普·J·Y·梁、艾萨克·D·卢茨、普里塔姆·文卡特什、约瑟夫·L·沃森、法比安·欣克、胡伊-贤·阮、安迪·显伟·叶、大卫·尤尔根斯、纳撒尼尔·R·贝内特、安德鲁·N·胡夫纳格尔、埃里克·黄、迈克尔·J·麦科斯、马克·埃克斯波西特、李奎丽、保罗·M·莱文、李欣婷、米拉·兰布、埃利夫·尼哈尔·科尔克马兹、杰夫·尼瓦拉、兰斯·斯图尔特、约瑟夫·M·罗杰斯、大卫·贝克。  \n*预印本，2022年12月。*  \n[[10.1101\u002F2022.12.10.519862](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.12.10.519862)]\n\n**基于深度学习的信号蛋白合成同源物设计。**  \n连欣然、尼克萨·普拉利亚克、苏布·K·苏布拉马尼安、萨拉·韦辛格、拉玛·兰加纳坦、安德鲁·L·弗格森。  \n*预印本，2022年12月。*  \n[[10.1101\u002F2022.12.21.521443](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.12.21.521443)]\n\n**用于生成式蛋白质设计的高级编程语言。**  \n布莱恩·希、萨尔瓦托雷·坎迪多、林泽明、奥里·卡贝利、罗山·饶、尼基塔·斯梅塔宁、汤姆·塞尔库、亚历山大·里夫斯。  \n*预印本，2022年12月。*  \n[[10.1101\u002F2022.12.21.521526](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.12.21.521526)]\n\n**语言模型的泛化能力超越天然蛋白质。**  \n罗伯特·费尔库伊尔、奥里·卡贝利、杜一伦、巴西勒·I·M·威基、卢卡斯·F·米勒斯、尤斯塔斯·道帕拉斯、大卫·贝克、谢尔盖·奥夫钦尼科夫、汤姆·塞尔库、亚历山大·里夫斯。  \n*预印本，2022年12月。*  \n[[10.1101\u002F2022.12.21.521521](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.12.21.521521)]\n\n**通过潜伏构象优化进行表位特异性结合蛋白的深度生成设计。**  \n拉斐尔·R·江口、克里斯蒂安·A·乔、乌迪特·帕雷克、艾琳·S·哈利克、迈克尔·D·沃德、尼哈·维塔尼、格雷戈里·R·鲍曼、约瑟夫·G·贾丁、黄博思。  \n*预印本，2022年12月。*  \n[[10.1101\u002F2022.12.22.521698](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.12.22.521698)]\n\n**用可编程生成模型照亮蛋白质空间。**  \n约翰·英格拉汉、马克斯·巴拉诺夫、扎克·科斯特洛、文森特·弗拉皮耶、艾哈迈德·伊斯梅尔、尚铁、王武杰、文森特·徐、弗里茨·奥伯迈耶、安德鲁·比姆、格沃尔格·格里戈里扬。  \n*预印本，2022年12月。*  \n[[10.1101\u002F2022.12.01.518682](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.12.01.518682)]\n\n**通过整合结构预测网络和扩散生成模型实现广泛适用且精确的蛋白质设计。**  \n约瑟夫·L·沃森、大卫·尤尔根斯、纳撒尼尔·R·贝内特、布莱恩·L·特里普、杰森·尹、海伦·E·艾森纳赫、伍迪·阿亨、安德鲁·J·博斯特、罗伯特·J·拉戈特、卢卡斯·F·米勒斯、巴西勒·I·M·威基、尼基塔·哈尼克尔、塞缪尔·J·佩洛克、亚历克西斯·库尔贝、威廉·谢夫勒、王珏、普里塔姆·文卡特什、艾萨克·萨平顿、苏珊娜·巴斯克斯·托雷斯、安娜·劳科、瓦伦丁·德·博尔托利、埃米尔·马修、雷吉娜·巴尔齐莱、汤米·S·雅科拉、弗兰克·迪马约、白敏京、大卫·贝克。  \n*预印本，2022年12月。*  \n[[10.1101\u002F2022.12.09.519842](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.12.09.519842)]\n\n**基于图的深度生成模型用于从头PROTAC设计。**  \n迪维亚·诺里、康纳·W·科利、罗西奥·梅尔卡多。  \n*预印本，2022年11月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2211.02660)]\n\n**冷冻电镜结构的潜在空间扩散模型。**  \n卡斯滕·克莱斯、蒂姆·多克霍恩、李子豪、艾伦·钟。  \n*预印本，2022年11月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2211.14169)]\n\n**具有等变平移的蛋白质序列与结构协同设计。**  \n陈策、王传睿、陆嘉睿、钟博涛、唐健。  \n*预印本，2022年10月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2210.08761)]\n\n**蛋白质结构的深度生成模型揭示了连续折叠空间中的远缘关系。**  \n伊利·J·德赖岑、斯特拉·维雷特尼克、卡梅隆·穆拉、菲利普·E·伯恩。  \n*预印本，2022年8月。*  \n[[10.1101\u002F2022.07.29.501943](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.07.29.501943)]\n\n**基于神经网络推导的Potts模型，用于利用主链原子坐标和三级基序进行基于结构的蛋白质设计。**  \n亚历克斯·J·李、明仁·卢、以色列·德斯塔、维克拉姆·桑达尔、格沃尔格·格里戈里扬、艾米·E·基廷。  \n*预印本，2022年8月。*  \n[[10.1101\u002F2022.08.02.501736](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.08.02.501736)]\n\n**ProtGPT2是一种用于蛋白质设计的深度无监督语言模型。**  \n诺埃利亚·费鲁兹、施特芬·施密特和比尔特·霍克尔。  \n*《自然通讯》，2022年7月。*  \n[[10.1038\u002Fs41467-022-32007-7](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41467-022-32007-7)]\n\n**ProteinSGM：基于评分的生成模型用于从头蛋白质设计。**  \n李镇洙、金弼民。  \n*预印本，2022年7月。*  \n[[10.1101\u002F2022.07.13.499967](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.07.13.499967)]\n\n**基于扩散生成模型的抗原特异性抗体设计与优化。**  \n罗世通、苏宇峰、彭星刚、王晟、彭建、马建竹。  \n*预印本，2022年7月。*  \n[[10.1101\u002F2022.07.10.499510](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.07.10.499510)]\n\n**端到端深度结构生成模型用于蛋白质设计。**  \n赖博桥、马修·麦克帕特隆、许金波。  \n*预印本，2022年7月。*  \n[[10.1101\u002F2022.07.09.499440](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.07.09.499440)]\n\n**利用深度学习预测SARS-CoV-2的抗原进化。**  \n韩文凯、陈宁宁、孙世伟、高鑫。  \n*预印本，2022年6月。*  \n[[10.1101\u002F2022.06.23.497375](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.06.23.497375)]\n\n**幻觉般的蛋白质组装体。**  \nB. I. M. 威基、L. F. 米勒斯、A. 库尔贝、R. J. 拉戈特、J. 道帕拉斯、E. 金富、S. 蒂普斯、R. D. 基布勒、M. 白、F. 迪马约、X. 李、L. 卡特、A. 康、H. 阮、A. K. 贝拉、D. 贝克。  \n*预印本，2022年6月。*  \n[[10.1101\u002F2022.06.09.493773](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.06.09.493773)]\n\n**ProGen2：探索蛋白质语言模型的边界。**  \n埃里克·尼金坎普、杰弗里·鲁弗洛、伊利·N·温斯坦、尼基尔·奈克、阿里·马达尼。  \n*预印本，2022年6月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2206.13517)]\n\n**DiffMD：用于分子动力学模拟的几何扩散模型。**  \n吴芳、李斯坦 Z。  \n*预印本，2022年4月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2204.08672)]\n\n**基于蛋白质-配体结构的几何深度学习引导的片段式配体生成。**  \n亚历山大·S·鲍尔斯、海伦·H·于、帕特里夏·苏里亚纳、罗恩·O·德罗尔。  \n*预印本，2022年3月。*  \n[[10.1101\u002F2022.03.17.484653](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.03.17.484653)]\n\n**在黑暗中设计：用于从头蛋白质设计的深度生成模型学习。**  \n刘易斯·莫法特、肖恩·M·坎达希尔、大卫·T·琼斯。  \n*预印本，2022年1月。*  \n[[10.1101\u002F2022.01.27.478087](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.01.27.478087)]\n\n**利用AlphaFold2采样转运蛋白和受体的构象景观。**  \n迭戈·德尔阿拉莫、达维德·萨拉、哈桑·S·姆乔劳拉布、延斯·迈勒。  \n*预印本，2021年11月。*  \n[[10.1101\u002F2021.11.22.469536](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.11.22.469536)]\n\n**针对多样化抗体序列设计的深度生成模型基准测试。**  \n伊戈尔·梅尔尼克、帕耶尔·达斯、维吉尔·琴塔马拉克尚、奥雷莉·洛萨诺。  \n*预印本，2021年11月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2111.06801v1)]\n\n**使用简单自回归模型高效地生成蛋白质序列。**  \n珍妮·特兰基耶、圭多·乌古佐尼、安德烈亚·帕尼亚尼、弗朗切斯科·赞波尼及马丁·魏格特。  \n*自然通讯，2021年10月。*  \n[[10.1038\u002Fs41467-021-25756-4](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41467-021-25756-4)]\n\n**利用深度学习框架在功能蛋白质之间的氨基酸序列空间中导航。**  \n特里斯坦·比塔尔-费尔德尔。  \n*PeerJ计算机科学，2021年9月。*  \n[[10.7717\u002Fpeerj-cs.684](https:\u002F\u002Fdoi.org\u002F10.7717\u002Fpeerj-cs.684)]\n\n**BioPhi：基于天然抗体库和深度学习的抗体设计、人源化及“人类性”评估平台。**  \n大卫·普里霍达、贾德·马阿马里、安德鲁·韦特、维罗妮卡·胡安、劳伦斯·法亚达特-迪尔曼、丹尼尔·斯沃齐尔、丹尼·A·比特顿。  \n*预印本，2021年8月。*  \n[[10.1101\u002F2021.08.08.455394](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.08.08.455394)]\n\n**共进化模型中的祖先序列重建。**  \n埃德温·罗德里格斯·奥尔塔、亚历杭德罗·拉赫-卡斯特利亚诺斯、罗伯托·穆莱特。  \n*预印本，2021年8月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2108.03801)]\n\n**AMaLa：通过退火突变近似景观分析定向进化实验。**  \n卢卡·塞斯塔、圭多·乌古佐尼、豪尔赫·费尔南德斯-德-科西奥·迪亚斯、安德烈亚·帕尼亚尼。  \n*国际分子科学杂志，2021年8月。*  \n[[10.3390\u002Fijms222010908](https:\u002F\u002Fdoi.org\u002F10.3390\u002Fijms222010908)]\n\n**蛋白质进化中序列空间探索与上位性信号涌现的建模。**  \n马泰奥·比萨尔迪、胡安·罗德里格斯-里瓦斯、弗朗切斯科·赞波尼、马丁·魏格特。  \n*预印本，2021年6月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2106.02441)]\n\n**通过潜在插值实现腺相关病毒衣壳的生成式多样化。**  \n萨姆·锡奈、妮娜·贾因、乔治·M·丘奇、埃里克·D·凯尔西克。  \n*预印本，2021年4月。*  \n[[10.1101\u002F2021.04.16.440236](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.04.16.440236)]\n\n**利用自回归生成模型进行蛋白质设计与变异预测。**  \n申贞恩、亚当·里塞尔曼、科拉施、康纳·麦克马洪、伊莱娜·西蒙、克里斯·桑德、阿希什·曼格利克、安德鲁·克鲁斯、黛博拉·马克斯。  \n*自然通讯，2021年4月。*  \n[[10.1038\u002Fs41467-021-22732-w](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41467-021-22732-w)]\n\n**利用生成对抗网络扩展功能蛋白质序列空间。**  \n多纳塔斯·雷佩卡、维金塔斯·扬尼斯基斯、劳里纳斯·卡尔普斯、埃尔日别塔·伦贝扎、扬·兹里梅茨、西莫娜·波维洛涅内、伊尔曼塔斯·罗凯蒂斯、奥德里尤斯·劳里纳纳斯、维萨姆·阿布阿瓦、奥托·萨沃莱宁、罗兰达斯·梅斯基斯、马丁·K·M·英奎斯特、阿列克谢·泽列兹尼亚克。  \n*自然机器智能，2021年3月。*  \n[[10.1038\u002Fs42256-021-00310-5](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs42256-021-00310-5)]\n\n**利用变分自编码器生成功能性蛋白质变体。**  \n亚历克斯·霍金斯-胡克、弗洛伦斯·德帕迪厄、塞巴斯蒂安·鲍尔、纪尧姆·库瓦隆、阿瑟·陈、大卫·比卡尔。  \n*PLOS计算生物学，2021年2月。*  \n[[10.1371\u002Fjournal.pcbi.1008736](https:\u002F\u002Fdoi.org\u002F10.1371\u002Fjournal.pcbi.1008736)]\n\n**利用掩码语言模型的吉布斯采样生成新型蛋白质序列。**  \n肖恩·R·约翰逊、莎拉·莫纳科、肯尼思·马西、扎伊德·赛义德。  \n*预印本，2021年1月。*  \n[[10.1101\u002F2021.01.26.428322](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.01.26.428322)]\n\n**生成式序列模型中成对关系的结构-适应度景观。**  \n*预印本，2020年11月。*  \n迪伦·马歇尔、王浩博、迈克尔·斯蒂夫勒、尤斯塔斯·道帕拉斯、彼得·库、谢尔盖·奥夫钦尼科夫。  \n[[10.1101\u002F2020.11.29.402875](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.11.29.402875)]\n\n**利用引导条件Wasserstein生成对抗网络进行新折叠的从头蛋白质设计。**  \n穆斯塔法·卡里米、邵文·朱、岳曹、杨申。  \n*化学信息与建模期刊，2020年9月。*  \n[[10.1021\u002Facs.jcim.0c00593](https:\u002F\u002Fdoi.org\u002F10.1021\u002Facs.jcim.0c00593)]\n\n**深度学习助力功能性从头抗菌蛋白质的设计。**  \n哈维尔·卡塞雷斯-德尔皮亚诺、罗伯托·伊巴涅斯、帕特里西奥·阿莱格雷、辛西娅·桑韦萨、罗穆阿尔多·帕斯-菲布拉斯、西蒙·科雷亚、佩德罗·雷塔马尔、胡安·克里斯托瓦尔·希门尼斯、莱昂纳多·阿尔瓦雷斯。  \n*预印本，2020年8月。*  \n[[10.1101\u002F2020.08.26.266940](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.08.26.266940)]\n\n**考虑突变多样性的生成式概率生物序列模型。**  \n伊利·N·温斯坦、黛博拉·S·马克斯。  \n*预印本，2020年8月。*  \n[[10.1101\u002F2020.07.31.231381](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.07.31.231381)]\n\n**IG-VAE：通过直接生成3D坐标进行免疫球蛋白蛋白质的生成建模。**  \n拉斐尔·R·江口、南拉塔·阿南德、克里斯蒂安·A·乔、蒲思·黄。  \n*预印本，2020年8月。*  \n[[10.1101\u002F2020.08.07.242347](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.08.07.242347)]\n\n**用于最大化合成DNA和蛋白质序列适应度与多样性的生成式神经网络。**\n约翰内斯·林德、尼古拉斯·博加德、亚历山大·B·罗森伯格、格奥尔格·塞利格\n*细胞系统，2020年7月*\n[[10.1016\u002Fj.cels.2020.05.007](https:\u002F\u002Fdoi.org\u002F10.1016\u002Fj.cels.2020.05.007)]\n\n**基于注意力机制的神经网络生成信号肽。**  \n扎卡里·吴、凯文·凯昌·杨、迈克尔·利什卡、艾丽西亚·李、阿丽娜·巴齐拉、大卫·韦尔尼克、大卫·P·韦纳、弗朗西斯·H·阿诺德。  \n*ACS合成生物学，2020年7月。*  \n[[10.1021\u002Facssynbio.0c00219](https:\u002F\u002Fdoi.org\u002F10.1021\u002Facssynbio.0c00219)]\n\n**面向多类病毒突变预测的生物信息驱动蛋白质序列生成。**  \n于洋·王、普拉卡尔什·亚达夫、里希凯什·马加尔、阿米尔·巴拉蒂·法里马尼。  \n*预印本，2020年6月。*  \n[[10.1101\u002F2020.06.11.146167](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.06.11.146167)]\n\n**利用生成对抗网络设计特征控制的人类化抗体发现文库。**  \n蒂莱利·阿米穆尔、杰里米·M·沙弗、兰达尔·R·凯切姆、J·亚历克斯·泰勒、鲁提利奥·H·克拉克、乔什·史密斯、丹妮尔·范·西特斯、克里斯汀·C·西斯卡、保琳·斯米特、梅根·斯普拉格、布鲁斯·A·克尔温和迪恩·佩蒂特。\n*预印本，2020年4月。*\n[[10.1101\u002F2020.04.12.024844](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.04.12.024844)]\n\n**ProGen：用于蛋白质生成的语言建模。**  \n阿里·马达尼、布莱恩·麦肯、尼基尔·奈克、尼提什·希里什·凯斯卡、南拉塔·阿南德、拉斐尔·R·江口、蒲思·黄、理查德·索彻。  \n*预印本，2020年3月。*  \n[[10.1101\u002F2020.03.07.982272](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.03.07.982272)]\n\n**基于引导条件Wasserstein生成对抗网络（gcWGAN）的全新折叠蛋白质从头设计。**  \n穆斯塔法·卡里米、朱绍文、曹悦、沈洋。  \n*预印本，2019年9月。*  \n[[10.1101\u002F769919](https:\u002F\u002Fdoi.org\u002F10.1101\u002F769919)]\n\n**从冷冻电镜图像重建三维蛋白质结构的连续分布。**  \n艾伦·D·钟、特里斯坦·贝普勒、约瑟夫·H·戴维斯、邦妮·伯格。  \n*预印本，2019年9月。*\n[[arXiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F1909.05215)]\n\n**用于T细胞受体蛋白序列的深度生成模型。**  \n克里斯蒂安·戴维森、布兰登·J·奥尔森、威廉·S·德威特三世、让·冯、伊莱亚斯·哈金斯、菲利普·布拉德利、弗雷德里克·A·马森四世。  \n*eLife，2019年9月*。  \n[[10.7554\u002FeLife.46935.001](https:\u002F\u002Fdoi.org\u002F10.7554\u002FeLife.46935.001)]\n\n**基于图的蛋白质设计生成模型。**  \n约翰·英格拉姆、维卡斯·K·加格、雷吉娜·巴尔齐莱、汤米·雅科拉。  \n*ICLR关于高度结构化数据的深度生成模型研讨会，2019年5月。*  \n[[OpenReview](https:\u002F\u002Fopenreview.net\u002Fpdf?id=SJgxrLLKOE)]\n\n**如何“幻觉”出功能性蛋白质。**  \n扎克·科斯特洛、埃克托·加西亚·马丁  \n*预印本，2019年3月*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F1903.00458)]  \n\n**基于适应性采样的鲁棒设计条件化。**  \n大卫·H·布鲁克斯、朴汉范、珍妮弗·利斯特加滕。  \n*预印本，2019年1月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F1901.10060)]\n\n**蛋白质结构的生成式建模。**  \n纳姆拉塔·阿南德、黄博思。  \n*NeurIPS，2018年12月。*  \n[[NeurIPS](https:\u002F\u002Fpapers.nips.cc\u002Fpaper\u002F7978-generative-modeling-for-protein-structures.pdf)]\n\n**利用变分自编码器设计金属蛋白和新型蛋白质折叠。**  \n乔·G·格林纳、刘易斯·莫法特、戴维·T·琼斯。  \n*Scientific Reports，2018年11月。*  \n[[10.1038\u002Fs41598-018-34533-1](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41598-018-34533-1)]\n\n**基于适应性采样的设计。**  \n大卫·H·布鲁克斯、珍妮弗·利斯特加滕。  \n*预印本，2018年10月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F1810.03714)]\n\n**遗传变异的深度生成模型捕捉突变效应。**  \n亚当·J·里塞尔曼、约翰·B·英格拉姆、黛博拉·S·马克斯   \n*Nature Methods，2018年9月*  \n[[10.1038\u002Fs41592-018-0138-4](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41592-018-0138-4)] \n\n**DNA反馈GAN（FBGAN）：一种用于优化蛋白质功能的新型反馈回路架构。**  \n安维塔·古普塔、詹姆斯·邹。  \n*预印本，2018年4月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F1804.01694)]\n\n**用于肽类构建性设计的循环神经网络模型。**  \n亚历克斯·T·穆勒、扬·A·希斯和吉斯贝尔特·施奈德。  \n*《化学信息与建模杂志》，2018年1月*  \n[[10.1021\u002Facs.jcim.7b00414](https:\u002F\u002Fdoi.org\u002F10.1021\u002Facs.jcim.7b00414)]\n\n**蛋白质序列的变分自编码。**  \n萨姆·西奈、埃里克·凯尔西、乔治·M·丘奇、马丁·A·诺瓦克  \n*预印本，2017年12月*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F1712.03346)]\n\n\n\n### 生物物理学\n\n**通过蛋白质结构扩散实现精确构象采样。**  \n贾浩凡、李子耀、埃里克·阿尔凯德、郭林、黄华清、E·魏楠。 \n*预印本，2024年5月。*  \n[[10.1101\u002F2024.05.20.594916](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2024.05.20.594916)] \n\n**ForceGen：基于非线性机械展开响应的端到端从头蛋白质生成，使用蛋白质语言扩散模型。**  \n倪波、大卫·L·卡普兰、马库斯·J·布赫勒。  \n*预印本，2023年10月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2310.10605)]\n\n**粗粒度蛋白质的化学可转移生成式反向映射。**   \n杨秀贞、拉斐尔·戈麦斯-邦巴雷利。  \n*预印本，2023年3月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2303.01569)]\n\n**通过机器学习直接生成蛋白质构象集合。**  \n贾科莫·詹森、吉尔伯托·瓦尔德斯-加西亚、林熙和迈克尔·费格。  \n*Nature Communications，2023年2月。*  \n[[10.1038\u002Fs41467-023-36443-x](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41467-023-36443-x)]用蛋白质语言和图神经网络匹配受体与气味分子\n\n**蛋白质热力学的机器学习粗粒度势能。**  \n马切伊·马耶夫斯基、阿德里亚·佩雷斯、菲利普·托尔克、施特凡·多尔、尼古拉斯·E·查隆、托尼·乔尔吉诺、布鲁克·E·胡西奇、塞西莉亚·克莱门蒂、弗兰克·诺埃、詹尼·德·法布里蒂斯。  \n*预印本，2022年12月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2212.07492)]\n\n**用归一化流跳过副本交换阶梯。**  \n米歇莱·因韦尔尼齐、安德烈亚斯·克雷默、塞西莉亚·克莱门蒂、弗兰克·诺埃。  \n*预印本，2022年10月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2210.14104)]\n\n**从数据到噪声再到数据：利用生成式人工智能在不同温度下混合物理规律。**  \n王一航、卢卡斯·赫伦和普拉提尤什·蒂瓦里。  \n*PNAS，2022年8月。*  \n[[10.1073\u002Fpnas.2203656119](https:\u002F\u002Fdoi.org\u002F10.1073\u002Fpnas.2203656119)]\n\n**无需分子的分子动力学：用生成式神经网络搜索蛋白质构象空间。**  \n格雷戈里·施温格、路易吉·L·帕莱塞、阿里埃尔·费尔南德斯、洛伦·施维伯特、多梅尼科·L·加蒂。  \n*预印本，2022年6月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2206.04683)]\n\n### 预测稳定性\n\n**蛋白质稳定性的遗传架构。**  \n安德烈·J·福雷、艾娜·马尔蒂-阿兰达、克里斯蒂娜·伊达尔戈-卡尔塞多、约恩·M·施密德尔、本·莱纳。  \n*预印本，2023年10月。*  \n[[10.1101\u002F2023.10.27.564339](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.10.27.564339)]\n\n**结合新大型数据集与深度神经网络，在预测突变对蛋白质稳定性影响方面取得进展。**  \n玛丽娜·A·帕克、尼基塔·V·多维琴科、萨蒂亚尔特·米什拉·夏尔马、德米特里·N·伊万科夫。  \n*预印本，2023年1月。*  \n[[10.1101\u002F2022.12.31.522396](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.12.31.522396)]\n\n**PROSTATA：基于Transformer的蛋白质稳定性评估。**  \n德米特里·乌梅连科夫、塔季亚娜·I·沙什科娃、帕维尔·V·斯特拉什诺夫、费多尔·尼古拉耶夫、玛丽亚·辛杰耶娃、尼基塔·V·伊万尼森科、奥尔加·L·卡尔迪蒙。  \n*预印本，2022年12月。*  \n[[10.1101\u002F2022.12.25.521875](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.12.25.521875)]\n\n**利用深度学习表示快速预测蛋白质稳定性。**  \n拉斯·M·布劳比耶尔、马赫尔·M·卡塞姆、莉迪娅·L·古德、尼古拉斯·约翰逊、马泰奥·卡吉亚达、克里斯托弗·E·约翰逊、沃特·布姆斯马、阿梅莉·斯坦、克雷斯滕·林多夫-拉尔森。  \n*预印本，2022年8月。*  \n[[10.1101\u002F2022.07.14.500157](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.07.14.500157)]\n\n**人工神经网络用于根据Rosetta计算的性质预测基于结构的蛋白质—蛋白质结合自由能。**  \n马修斯·费拉兹、若泽·内托、罗伯托·林斯、埃里科·特谢拉。  \n*预印本，2022年8月。*  \n[[10.26434\u002Fchemrxiv-2022-zhd87](https:\u002F\u002Fdoi.org\u002F10.26434\u002Fchemrxiv-2022-zhd87)]\n\n**用于蛋白质物理的深度神经网络能量函数构建。**  \n黄欢、熊兆平、弗朗切斯科·宗塔。  \n*《化学理论与计算杂志》，2008年8月。*  \n[[10.1021\u002Facs.jctc.2c00069](https:\u002F\u002Fdoi.org\u002F10.1021\u002Facs.jctc.2c00069)]\n\n**基于序列和结构特征的机器学习用于可泛化的抗体热稳定性预测。**  \n阿梅亚·哈马尔卡尔、罗山·拉奥、乔纳斯·霍纳、维布克·代斯廷、乔纳斯·安拉尔、安雅·霍尼格、朱莉娅·茨维克拉、伊娃·西恩茨-维德曼、多丽丝·劳、奥斯汀·赖斯、蒂莫西·P·莱利、李丹青、汉娜·B·卡特罗尔、克里斯汀·E·廷伯格、杰弗里·J·格雷、凯茜·Y·魏。  \n*预印本，2022年6月。*  \n[[10.1101\u002F2022.06.03.494724](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.06.03.494724)]\n\n**酶热适应性的深度表征学习。**  \n李刚、菲利普·布里奇、扬·日里梅茨、桑德拉·维克南德、延斯·尼尔森、阿列克谢·泽列兹尼亚克、马丁·K·M·英奎斯特。  \n*预印本，2022年3月。*  \n[[10.1101\u002F2022.03.14.484272](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.03.14.484272)]\n\n**利用独立生成的数据集评估蛋白质工程热稳定性预测工具。**\n黄沛珊、西蒙·K·S·楚、恩里克·N·弗里佐、摩根·P·康诺利、瑞安·W·卡斯特以及贾斯汀·B·西格尔。  \n*ACS Omega，2020年3月。*  \n[[10.1021\u002Facsomega.9b04105](https:\u002F\u002Fdoi.org\u002F10.1021\u002Facsomega.9b04105)]\n\n**使用深度3D卷积神经网络预测点突变引起的蛋白质热稳定性变化。**  \n卞莉、杨宇成T、约翰·A·卡普拉、马克·B·格斯坦。  \n*预印本，2020年2月。*  \n[[10.1101\u002F2020.02.28.959874](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.02.28.959874)]\n\n**机器学习在G蛋白偶联受体热稳定化突变优先级排序中的应用。**  \nS·穆克、S·戈什、S·阿丘坦、X·陈、X·姚、M·桑杜、M·C·格里福尔、K·F·费内尔、Y·谢、V·沙姆古苏达拉姆、X·邱、C·G·泰特、N·瓦伊德希。  \n*预印本，2019年7月。*  \n[[10.1101\u002F715375](https:\u002F\u002Fdoi.org\u002F10.1101\u002F715375)]\n\n**机器学习在预测微生物生长温度和酶催化最适条件中的应用**\n李刚、克尔斯滕·S·拉贝、延斯·尼尔森、马丁·K·M·英奎斯特。  \n*ACS合成生物学，2019年5月*  \n[[10.1021\u002Facssynbio.9b00099](https:\u002F\u002Fdoi.org\u002F10.1021\u002Facssynbio.9b00099)]\n\n**mGPfusion：利用高斯过程核学习与数据融合预测蛋白质稳定性变化。**\n埃米·约基宁、马库斯·海诺宁、哈里·莱赫德斯马基。  \n*生物信息学，2018年7月。*  \n[[10.1093\u002Fbioinformatics\u002Fbty238](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbty238)]\n\n**基于结构的机器学习工具用于蛋白质单点突变热稳定性预测模型。**  \n贾蕾、拉米娅·亚拉加达、查尔斯·C·里德。  \n*PLOS One，2015年9月。*  \n[[10.1371\u002Fjournal.pone.0138022](https:\u002F\u002Fdoi.org\u002F10.1371\u002Fjournal.pone.0138022)]\n\n**NeEMO：一种利用残基相互作用网络提高突变导致蛋白质稳定性预测准确性的方法。**  \n曼努埃尔·吉奥洛、阿尔贝托·J·M·马丁†、伊恩·沃尔什、卡洛·费拉里、西尔维奥·C·E·托萨托。  \n*BMC基因组学，2014年5月。*  \n[[10.1186\u002F1471-2164-15-S4-S7](https:\u002F\u002Fdoi.org\u002F10.1186\u002F1471-2164-15-S4-S7)]\n\n**mCSM：利用图论签名预测蛋白质中突变的影响。**  \n道格拉斯·E·V·皮雷斯、大卫·B·阿舍、汤姆·L·布伦德尔。  \n*生物信息学，2014年2月。*  \n[[10.1093\u002Fbioinformatics\u002Fbtt691](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbtt691)]\n\n**PROTS-RF：一种稳健的模型，用于预测突变诱导的蛋白质稳定性变化。**  \n李云琪、方建文。  \n*PLOS One，2012年10月。*  \n[[10.1371\u002Fjournal.pone.0047247](https:\u002F\u002Fdoi.org\u002F10.1371\u002Fjournal.pone.0047247)]\n\n**预测由单点或多点突变引起的蛋白质热稳定性变化。**  \n田健、吴宁峰、楚晓宇、范云柳。  \n*BMC生物信息学，2010年7月。*  \n[[10.1186\u002F1471-2105-11-370](https:\u002F\u002Fdoi.org\u002F10.1186\u002F1471-2105-11-370)]\n\n**利用统计势能和神经网络快速准确地预测突变引起的蛋白质稳定性变化：PoPMuSiC-2.0。**  \n伊夫·德胡克、阿琳·格罗斯菲尔、本杰明·福尔什、迪米特里·吉利斯、菲利普·博加尔茨、玛丽安娜·鲁曼。  \n*生物信息学，2009年10月。*  \n[[10.1093\u002Fbioinformatics\u002Fbtp445](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbtp445)]\n\n**使用支持向量机预测单点突变引起的蛋白质稳定性变化。**  \n程建林、阿洛·兰德尔、皮埃尔·巴尔迪。  \n*Proteins，2005年12月。*  \n[[10.1002\u002Fprot.20810](https:\u002F\u002Fdoi.org\u002F10.1002\u002Fprot.20810)]\n\n**利用支持向量机从序列预测蛋白质稳定性变化。**  \n埃米迪奥·卡普里奥蒂、皮耶罗·法里塞利、雷莫·卡拉布雷塞、丽塔·卡萨迪奥。  \n*生物信息学，2005年9月。*  \n[[10.1093\u002Fbioinformatics\u002Fbti1109](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbti1109)]\n\n**I-Mutant2.0：根据蛋白质序列或结构预测突变引起的稳定性变化。**  \n埃米迪奥·卡普里奥蒂、皮耶罗·法里塞利、丽塔·卡萨迪奥。  \n*核酸研究，2005年7月。*  \n[[10.1093\u002Fnar\u002Fgki375](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fnar\u002Fgki375)]\n\n**基于神经网络的方法，用于预测单点突变引起的蛋白质稳定性变化。**  \n埃米迪奥·卡普里奥蒂、皮耶罗·法里塞利、丽塔·卡萨迪奥。  \n*生物信息学，2004年8月。*  \n[[10.1093\u002Fbioinformatics\u002Fbth928](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbth928)]\n\n**用于判别式蛋白质分类的不匹配字符串核。**  \n克里斯蒂娜·S·莱斯利、埃利亚扎尔·埃斯金、阿迪埃尔·科恩、杰森·韦斯顿、威廉·斯塔福德·诺布尔。  \n*生物信息学，2004年3月。*  \n[[10.1093\u002Fbioinformatics\u002Fbtg431](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbtg431)]\n\n\n\n### 从序列预测结构\n\n**利用AlphaFold 3精确预测生物分子相互作用的结构。**    \n乔什·艾布拉姆森、乔纳斯·阿德勒、杰克·邓格、理查德·埃文斯、蒂姆·格林、亚历山大·普里策尔、奥拉夫·罗嫩贝格、林赛·威尔莫尔、安德鲁·J·巴拉德、乔舒亚·班布里克、塞巴斯蒂安·W·博登斯坦、戴维·A·埃文斯、洪家春、迈克尔·奥尼尔、戴维·雷曼、凯瑟琳·图尼亚苏瓦努尔、扎卡里·吴、阿克维莱·热姆古利特、艾琳妮·阿尔瓦尼蒂、查尔斯·比蒂、奥塔维娅·贝尔托利、亚历克斯·布里奇兰、阿列克谢·切列帕诺夫、迈尔斯·康格里夫、…约翰·M·詹珀。  \n*自然杂志，2024年5月。*  \n[[10.1038\u002Fs41586-024-07487-w](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41586-024-07487-w)]\n\n\n**ScaleFold：将AlphaFold初始训练时间缩短至10小时。**  \n朱飞文、阿尔卡迪乌什·诺瓦钦斯基、李润东、辛杰、宋一飞、米哈尔·马尔琴凯维奇、苏克鲁·布尔克·埃里尔马兹、杨俊、米夏埃尔·安德施。  \n*预印本，2024年4月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2404.11068)]\n\n**利用RoseTTAFold全原子模型进行通用的生物分子建模与设计。**  \n罗希特·克里希纳、王珏、伍迪·阿亨、帕斯卡尔·斯图姆费尔斯、普里塔姆·文卡特什、因德雷克·卡尔韦特、李圭里、费利克斯·S·莫雷-伯罗斯、伊万·阿尼申科、伊恩·R·汉弗里斯、瑞安·麦克休、迪昂妮·瓦菲阿多斯、李欣婷、乔治·A·萨瑟兰、安德鲁·希奇科克、C·尼尔·亨特、白敏京、弗兰克·迪马约、戴维·贝克。  \n*预印本，2023年10月。*  \n[[10.1101\u002F2023.10.09.561603](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.10.09.561603)]\n\n**利用仿生抗体语言模型准确预测抗体功能与结构。**  \n景宏泰、高正涛、徐盛、沈涛、彭章志、何帅、游涛、叶双、林伟、孙思琪。  \n*预印本，2023年8月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2308.16713)]\n\n**利用AlphaFold2系统性地识别条件折叠的固有无序区域。**  \nT. Reid Alderson、Iva Pritišanac、Đesika Kolarić 和 Julie D. Forman-Kay。  \n*PNAS，2023年8月。*  \n[[10.1073\u002Fpnas.2304302120](https:\u002F\u002Fdoi.org\u002F10.1073\u002Fpnas.2304302120)]\n\n**Highfold：使用AlphaFold准确预测环肽单体及复合物。**  \nChenhao Zhang、Chengyun Zhang、Tianfeng Shang、Xinyi Wu、Hongliang Duan。  \n*预印本，2023年8月。*  \n[[10.1101\u002F2023.08.27.554979](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.08.27.554979)]\n\n**通过多序列比对生成提升蛋白质三级结构预测精度。**  \nLe Zhang、Jiayang Chen、Tao Shen、Yu Li、Siqi Sun。  \n*预印本，2023年6月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2306.01824)]\n\n**通过多序列比对生成提升蛋白质三级结构预测精度。**  \nLe Zhang、Jiayang Chen、Tao Shen、Yu Li、Siqi Sun。  \n*预印本，2023年6月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2306.01824)]\n\n**利用RoseTTAFold2高效且准确地预测蛋白质结构。**  \nMinkyung Baek、Ivan Anishchenko、Ian R. Humphreys、Qian Cong、David Baker、Frank DiMaio。  \n*预印本，2023年5月。*  \n[[10.1101\u002F2023.05.24.542179](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.05.24.542179)]\n\n**EigenFold：基于扩散模型的生成式蛋白质结构预测。**  \nBowen Jing、Ezra Erives、Peter Pao-Huang、Gabriele Corso、Bonnie Berger、Tommi Jaakkola。  \n*预印本，2023年4月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2304.02198)]\n\n**利用语言模型在进化尺度上预测原子级蛋白质结构。**  \nZeming Lin、Halil Akin、Roshan Rao、Brian Hie、Zhongkai Zhu、Wenting Lu、Nikita Smetanin、Robert Verkuil、Ori Kabeli、Yaniv Shmueli、Allan dos Santos Costa、Maryam Fazel-Zarandi、Tom Sercu、Salvatore Candido、Alexander Rives。  \n*Science，2023年3月。*  \n[[10.1126\u002Fscience.ade2574](https:\u002F\u002Fdoi.org\u002F10.1126\u002Fscience.ade2574)]\n\n**DR-BERT：用于标注无序区域的蛋白质语言模型。**  \nAnanthan Nambiar、John Malcolm Forsyth、Simon Liu、Sergei Maslov。  \n*预印本，2023年2月。*  \n[[10.1101\u002F2023.02.22.529574](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.02.22.529574)]\n\n\n**AlphaFold预测无序蛋白质的结构集合。**  \nZ. Faidon Brotzakis、Shengyu Zhang、Michele Vendruscolo。  \n*预印本，2023年1月。*  \n[[10.1101\u002F2023.01.19.524720](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.01.19.524720)]\n\n**AFsample：通过激进采样改进AlphaFold的多聚体预测。**  \nBjörn Wallner。  \n*预印本，2022年12月。*  \n[[10.1101\u002F2022.12.20.521205](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.12.20.521205)]\n\n**OpenFold：重训AlphaFold2揭示其学习机制与泛化能力的新见解。**  \nGustaf Ahdritz、Nazim Bouatta、Sachin Kadyan、Qinghui Xia、William Gerecke、Timothy J O’Donnell、Daniel Berenberg、Ian Fisk、Niccolò Zanichelli、Bo Zhang、Arkadiusz Nowaczynski、Bei Wang、Marta M Stepniewska-Dziubinska、Shang Zhang、Adegoke Ojewole、Murat Efe Guney、Stella Biderman、Andrew M Watkins、Stephen Ra、Pablo Ribalta Lorenzo、Lucas Nivon、Brian Weitzner、Yih-En Andrew Ban、Peter K Sorger、Emad Mostaque、Zhao Zhang、Richard Bonneau、Mohammed AlQuraishi。  \n*预印本，2022年11月。*  \n[[10.1101\u002F2022.11.20.517210](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.11.20.517210)]\n\n**利用蛋白质语言模型改进蛋白质复合物预测。**  \nBo Chen、Ziwei Xie、Jiezhong Qiu、Zhaofeng Ye、Jinbo Xu、Jie Tang。  \n*预印本，2022年11月。*  \n[[10.1101\u002F2022.09.15.508065](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.09.15.508065)]\n\n**tFold-Ab：无需序列同源即可快速准确地预测抗体结构。**  \nJiaxiang Wu、Fandi Wu、Biaobin Jiang、Wei Liu、Peilin Zhao。  \n*预印本，2022年11月。*  \n[[10.1101\u002F2022.11.10.515918](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.11.10.515918)]\n\n**超快速蛋白质结构预测以捕捉突变动态中序列变异的影响。**  \nKonstantin Weissenow、Michael Heinzinger、Martin Steinegger、Burkhard Rost。  \n*预印本，2022年11月。*  \n[[10.1101\u002F2022.11.14.516473](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.11.14.516473)]\n\n**利用深度语言模型和Transformer网络改进蛋白质二级结构预测。**  \nTianqi Wu、Weihang Cheng、Jianlin Cheng。  \n*预印本，2022年11月。*  \n[[10.1101\u002F2022.11.21.517442](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.11.21.517442)]\n\n**利用深度学习势函数实现快速准确的从头蛋白质结构预测。**  \nRobin Pearce、Yang Li、Gilbert S. Omenn、Yang Zhang。  \n*PLoS Computational Biology，2022年9月。*  \n[[10.1371\u002Fjournal.pcbi.1010539](https:\u002F\u002Fdoi.org\u002F10.1371\u002Fjournal.pcbi.1010539)]\n\n**利用RoseTTAFoldNA准确预测核酸及蛋白质–核酸复合物结构。**  \nMinkyung Baek、Ryan McHugh、Ivan Anishchenko、David Baker、Frank DiMaio。  \n*预印本，2022年9月。*  \n[[10.1101\u002F2022.09.09.507333](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.09.09.507333)]\n\n**幻化出含有中心口袋的闭合重复蛋白。**  \nLinna An、Derrick R Hicks、Dmitri Zorine、Justas Dauparas、Basile I. M. Wicky、Lukas F. Milles、Alexis Courbet、Asim K. Bera、Hannah Nguyen、Alex Kang、Lauren Carter、David Baker。  \n*预印本，2022年9月。*  \n[[10.1101\u002F2022.09.01.506251](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.09.01.506251)]\n\n**作为基于能量模型的蛋白质侧链构象SE(3)等变图注意力网络。**  \nDeqin Liu、Sheng Chen、Shuangjia Zheng、Sen Zhang、Yuedong Yang。  \n*预印本，2022年9月。*  \n[[10.1101\u002F2022.09.05.506704](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.09.05.506704)]\n\n**SPEACH_AF：利用Alphafold2采样蛋白质集合与构象异质性。**  \nRichard A. Stein、Hassane S. Mchaourab。  \n*PLoS Computational Biology，2022年8月。*  \n[[10.1371\u002Fjournal.pcbi.1010483](https:\u002F\u002Fdoi.org\u002F10.1371\u002Fjournal.pcbi.1010483)]\n\n**少量样本学习精确的折叠景观用于蛋白质结构预测。**  \nJun Zhang、Sirui Liu、Mengyun Chen、Haotian Chu、Min Wang、Zidong Wang、Jialiang Yu、Ningxi Ni、Fan Yu、Diqing Chen、Yi Isaac Yang、Boxin Xue、Lijiang Yang、Yuan Liu、Yi Qin Gao。  \n*预印本，2022年8月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2208.09652)]\n\n**利用全原子图表示和SE(3)等变图神经网络进行原子级蛋白质结构精修。**  \nTianqi Wu、Jianlin Cheng。  \n*预印本，2022年8月。*  \n[[10.1101\u002F2022.05.06.490934](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.05.06.490934)]\n\n**HelixFold-Single：以蛋白质语言模型替代MSA进行蛋白质结构预测。**  \nXiaomin Fang、Fan Wang、Lihang Liu、Jingzhou He、Dayong Lin、Yingfei Xiang、Xiaonan Zhang、Hua Wu、Hui Li、Le Song。  \n*预印本，2022年8月。*  \n[[arxiv]https:\u002F\u002Farxiv.org\u002Fabs\u002F2207.13921]\n\n**NetSurfP-3.0：基于蛋白质语言模型和深度学习的蛋白质结构特征准确快速预测。**  \n马格努斯·哈拉尔德松·霍伊、埃里克·尼古拉斯·基尔、本特·彼得森、莫滕·尼尔森、奥莱·温特、亨里克·尼尔森、耶佩·霍尔格伦、保罗·马卡蒂利。  \n*核酸研究，2022年7月。*  \n[[10.1093\u002Fnar\u002Fgkac439](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fnar\u002Fgkac439)]\n\n\n**从一级序列进行高分辨率从头结构预测。**  \n吴瑞东、丁帆、王睿、沈锐、张希文、罗世通、苏晨鹏、吴作凡、谢琪、邦妮·伯杰、马建竹、彭健。  \n*预印本，2022年7月。*  \n[[10.1101\u002F2022.07.21.500999](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.07.21.500999)]\n\n**基于期望反射的蛋白质结构预测。**  \n埃文·克雷斯韦尔-克莱、丹泰·黄、乔·麦肯纳、克里斯·杨、埃里克·张、维普尔·佩里瓦尔。  \n*预印本，2022年7月。*  \n[[10.1101\u002F2022.07.12.499755](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.07.12.499755)]\n\n**PSP：用于蛋白质结构预测的百万级蛋白质序列数据集。**  \n刘思睿、张俊、褚浩天、王敏、薛博欣、倪宁熙、于佳亮、谢宇豪、陈振宇、陈梦云、刘源、皮娅·帕特拉、徐凡、陈杰、王子东、杨立江、余凡、陈磊、秦毅高。  \n*预印本，2022年6月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2206.12240)]\n\n**同源寡聚蛋白复合物中蛋白质残基间接触的准确预测。**  \n严雨萌、黄圣友。  \n*生物信息学简报，2021年9月。*  \n[[10.1093\u002Fbib\u002Fbbab038](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbib\u002Fbbab038)]\n\n**利用AlphaFold2和扩展的多序列比对改进蛋白质—蛋白质相互作用的预测。**  \nP·布莱恩特、G·波扎蒂、A·埃洛夫松。  \n*预印本，2021年9月。*  \n[[10.1101\u002F2021.09.15.460468](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.09.15.460468)]\n\n**利用三通道神经网络准确预测蛋白质结构及相互作用。**  \nMINKYUNG BAEK… DAVID BAKER。  \n*科学，2021年8月。*  \n[[10.1126\u002Fscience.abj8754](https:\u002F\u002Fdoi.org\u002F10.1126\u002Fscience.abj8754)]\n\n**通过图变换器将MSA嵌入蒸馏为折叠的蛋白质结构。**  \n艾伦·科斯塔、曼维塔·蓬纳帕蒂、约瑟夫·M·雅各布森、普拉南·查特吉。  \n*预印本，2021年6月。*  \n[[10.1101\u002F2021.06.02.446809](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.06.02.446809)]\n\n**通过深度残差卷积网络从三重共进化矩阵推导出高精度蛋白质接触图。**  \n李阳、张成鑫、埃里克·W·贝尔、郑伟、周晓根、于东军、张洋。  \n*PLOS计算生物学，2021年3月。*  \n[[10.1371\u002Fjournal.pcbi.1008865](https:\u002F\u002Fdoi.org\u002F10.1371\u002Fjournal.pcbi.1008865)]\n\n**用于同时预测蛋白质结构属性的多任务深度学习。**  \n张步忠、李金燕、权丽君、吕强。  \n*预印本，2021年2月。*  \n[[10.1101\u002F2021.02.04.429840](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.02.04.429840)]\n\n**用于预测蛋白质膜结合特性及二级结构的多任务深度学习系统。**  \n李彬、杰弗里·门登霍尔、约翰·安东尼·卡普拉、延斯·迈勒。  \n*预印本，2020年12月。*  \n[[10.1101\u002F2020.12.02.409045](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.12.02.409045)]\n\n**单层注意力机制足以预测蛋白质接触。**  \n尼古拉斯·巴塔查亚、尼尔·托马斯、罗山·拉奥、尤斯塔斯·道帕拉斯、彼得·K·库、大卫·贝克、孙允锡、谢尔盖·奥夫钦尼科夫。  \n*预印本，2020年12月。*  \n[[10.1101\u002F2020.12.21.423882](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.12.21.423882)]\n\n**利用深度图神经网络快速有效地优化蛋白质模型。**  \n景晓阳、许进波。  \n*预印本，2020年12月。*  \n[[10.1101\u002F2020.12.10.419994](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.12.10.419994)]\n\n**从序列进行蛋白质结构比对。**  \n詹姆斯·T·莫顿、查理·E·M·斯特劳斯、罗伯特·布莱克威尔、丹尼尔·贝伦伯格、弗拉基米尔·格利戈里耶维奇、理查德·邦诺。  \n*预印本，2020年11月。*  \n[[10.1101\u002F2020.11.03.365932](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.11.03.365932)]\n\n**基于深度学习，利用多序列比对的习得表征预测蛋白质结构。**  \n肖恩·M·坎达希尔、乔·G·格林纳、安迪·M·劳、戴维·T·琼斯。  \n*预印本，2020年11月。*  \n[[10.1101\u002F2020.11.27.401232](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.11.27.401232)]\n\n**基于深度学习的蛋白质结构预测中实数值距离预测的研究。**  \n李进、许进波。  \n*预印本，2020年11月。*  \n[[10.1101\u002F2020.11.26.400523](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.11.26.400523)]\n\n**REALDIST：实数值蛋白质距离预测。**  \n巴德里·阿迪卡里。  \n*预印本，2020年11月。*  \n[[10.1101\u002F2020.11.28.402214](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.11.28.402214)]\n\n**基于深度学习，利用多序列比对的习得表征预测蛋白质结构。**  \n肖恩·M·坎达希尔、乔·G·格林纳、安迪·M·劳、戴维·T·琼斯。  \n*预印本，2020年11月。*  \n[[10.1101\u002F2020.11.27.401232](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.11.27.401232)]\n\n**深度神经网络与注意力机制相结合可增强蛋白质接触预测的可解释性。**  \n陈晨、吴天奇、郭志业、程建林。  \n*预印本，2020年9月。*  \n[[10.1101\u002F2020.09.04.283937](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.09.04.283937)]\n\n**系统发育相关性对基于共进化的蛋白质接触预测影响有限。**  \n埃德温·罗德里格斯·奥尔塔、马丁·魏格特。  \n*预印本，2020年8月。*  \n[[10.1101\u002F2020.08.12.247577](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.08.12.247577)]\n\n**最小基因组的近乎完整蛋白质结构建模。**  \n乔·G·格林纳、尼基塔·德赛、肖恩·M·坎达希尔、戴维·T·琼斯。  \n*预印本，2020年7月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2007.06623)]\n\n**基于模板的深度学习蛋白质结构预测。**  \n张海仓、申玉峰。  \n*预印本，2020年6月。*  \n[[2020.06.02.129270](https:\u002F\u002Fdoi.org\u002F2020.06.02.129270)]\n\n**基于能量模型的原子分辨率蛋白质构象。**  \n杜一伦、乔舒亚·迈尔、杰里·马、罗布·费格斯、亚历山大·里夫斯。  \n*ICLR，2020年4月。*  \n[[arXiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2004.13167)]\n\n**一个完全开源的框架，用于深度学习蛋白质实数值距离。**  \n巴德里·阿迪卡里。  \n*预印本，2020年4月。*  \n[[10.1101\u002F2020.04.26.061820]( https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.04.26.061820)]\n\n**PhANNs：一种快速准确的工具和网页服务器，用于分类噬菌体结构蛋白。**  \n维克多·塞古里坦、杰克逊·雷德菲尔德、大卫·萨拉蒙、罗伯特·A·爱德华兹、安卡·M·塞加尔。  \n*预印本，2020年4月。*  \n[[10.1101\u002F2020.04.03.023523]( https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.04.03.023523)]\n\n**DeepDist：利用深度残差卷积网络进行实数值残基间距离预测。**  \n吴天奇、郭志业、侯杰、程建林。  \n*预印本，2020年3月。*  \n[[10.1101\u002F2020.03.17.995910)](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.03.17.995910))]\n\n**利用预测的残基间取向改进蛋白质结构预测。**  \n杨建义、伊万·阿尼申科、朴汉范、彭振岭、谢尔盖·奥夫钦尼科夫、大卫·贝克。  \n*PNAS，2020年1月。*  \n[[10.1073\u002Fpnas.1914677117]( https:\u002F\u002Fdoi.org\u002F10.1073\u002Fpnas.1914677117)]\n\n**蛋白质结构预测中的深度学习方法。**  \n米尔科·托里西、詹卢卡·波拉斯特里、权莉娅。  \n*计算与结构生物技术期刊，2020年1月。*  \n[[10.1016\u002Fj.csbj.2019.12.011](https:\u002F\u002Fdoi.org\u002F10.1016\u002Fj.csbj.2019.12.011)]\n\n**利用深度学习势能改进蛋白质结构预测。**  \n安德鲁·W·塞尼尔、理查德·埃文斯、约翰·贾姆珀、詹姆斯·柯克帕特里克、洛朗·西弗雷、蒂姆·格林、秦崇礼、奥古斯丁·齐德克、亚历山大·W·R·尼尔森、亚历克斯·布里奇兰、雨果·佩内多内斯、斯蒂格·彼得森、凯伦·西蒙扬、史蒂夫·克罗斯恩、普什米特·科利、戴维·T·琼斯、戴维·西尔弗、科雷·卡武克乔卢、德米斯·哈萨比斯。  \n*Nature，2020年1月。*  \n[[10.1038\u002Fs41586-019-1923-7](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41586-019-1923-7)]\n\n**深度学习通过迭代预测的结构约束扩展从头设计蛋白质模型对基因组的覆盖范围。**  \n乔·G·格里纳、肖恩·M·坎达希尔、戴维·T·琼斯。  \n*Nature Communications，2019年9月。*  \n[[10.1038\u002Fs41467-019-11994-0](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41467-019-11994-0)]\n\n**DeepPrime2Sec：基于一级序列的蛋白质二级结构深度学习预测。**  \n埃赫桑丁·阿斯加里、妮娜·珀纳、爱丽丝·C·麦克哈迪、穆罕默德·R·K·莫夫拉德。  \n*预印本，2019年7月。*  \n[[10.1101\u002F705426](https:\u002F\u002Fdoi.org\u002F10.1101\u002F705426)]\n\n**端到端可微分的蛋白质结构学习。**  \n穆罕默德·阿尔库赖希。  \n*Cell Systems，2019年4月。*  \n[[10.1016\u002Fj.cels.2019.03.006](https:\u002F\u002Fdoi.org\u002F10.1016\u002Fj.cels.2019.03.006)]\n\n**DESTINI：一种基于接触信息的深度学习蛋白质结构预测方法。**  \n高牧、周宏毅、杰弗里·斯科尔尼克。  \n*Scientific Reports，2019年3月。*  \n[[10.1038\u002Fs41598-019-40314-1](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41598-019-40314-1)]\n\n\n**利用结构信息学习蛋白质序列嵌入。**  \n特里斯坦·贝普勒、博尼尔·伯杰。  \n*国际表征学习会议，2019年2月。*  \n[[ICLR](https:\u002F\u002Farxiv.org\u002Fabs\u002F1902.08661)] \n\n**蛋白质结构的生成式建模。**  \n南拉塔·阿南德、蒲思苏·黄。  \n*NeurIPS，2018年12月。*  \n[[NeurIPS](https:\u002F\u002Fpapers.nips.cc\u002Fpaper\u002F7978-generative-modeling-for-protein-structures.pdf)]\n\n**基于距离的深度学习驱动的蛋白质折叠。**  \n徐金波。  \n*预印本，2018年11月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F1811.03481)]\n\n**Porter 5：快速、最先进的从头预测蛋白质二级结构（3类和8类）。**  \n米尔科·托里西、马纳兹·卡利尔、詹卢卡·波拉斯特里。  \n*预印本，2018年10月。*  \n[[10.1101\u002F289033](https:\u002F\u002Fdoi.org\u002F10.1101\u002F289033)] [[bioRxiv](https:\u002F\u002Fwww.biorxiv.org\u002Fcontent\u002F10.1101\u002F289033v4)]\n\n**基于数据划分和半随机子空间方法的蛋白质二级结构预测。**  \n马宇明、刘一辉、程金勇。  \n*Scientific Reports，2018年6月。*  \n[[10.1038\u002Fs41598-018-28084-8](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41598-018-28084-8)]\n\n\n**利用长短期记忆网络进行蛋白质二级结构预测。**  \n索伦·卡埃·松德比、奥莱·温特。  \n*预印本，2014年12月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F1412.7828)] \n\n**用于蛋白质二级结构预测的深度监督与卷积生成随机网络。**  \n周健、奥尔加·G·特罗扬斯卡娅。  \n*预印本，2014年3月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F1403.1347)]\n\n### 从结构预测序列\n\n**基于上下文感知几何深度学习的蛋白质序列设计。**  \n吕西安·F·克拉普、费尔南多·A·梅雷莱斯、卢西亚诺·A·阿布里亚塔、马泰奥·达尔·佩拉罗。  \n*预印本，2023年6月。*  \n[[10.1101\u002F2023.06.19.545381](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.06.19.545381)]\n\n**利用深度贝叶斯优化进行逆向蛋白质折叠。**  \n娜塔莉·莫斯、曾怡萌、丹尼尔·艾伦·安德森、菲利普·马费托内、亚伦·所罗门、佩顿·格林赛德、奥斯伯特·巴斯塔尼、雅各布·R·加德纳。  \n*预印本，2023年3月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2305.18089)]\n\n**基于物理信息神经网络的蛋白质设计。**  \nSI·奥马尔、C·凯萨尔、AJ·本-萨松、E·哈伯。  \n*生物分子，2023年2月。*\n[[10.3390\u002Fbiom13030457](https:\u002F\u002Fdoi.org\u002F10.3390\u002Fbiom13030457)]\n\n**利用松弛的序列空间进行高效且可扩展的从头蛋白质设计。**  \n克里斯托弗·弗兰克、阿里·霍绍伊、约斯塔·德·斯蒂赫特、多米尼克·希维茨、冯世浩、谢尔盖·奥夫钦尼科夫、亨德里克·迪茨。  \n*预印本，2023年2月。*  \n[[10.1101\u002F2023.02.24.529906](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.02.24.529906)]\n\n**通过反转AlphaFold结构预测网络进行从头蛋白质设计。**  \n卡斯珀·戈韦尔德、本尼迪克特·沃尔夫、哈迈德·哈克扎德、斯特凡·罗塞、布鲁诺·E·科雷亚。  \n*预印本，2022年12月。*  \n[[10.1101\u002F2022.12.13.520346](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.12.13.520346)]\n\n**基于ProteinMPNN的稳健深度学习蛋白质序列设计。**  \nJ·道帕拉斯、I·阿尼申科、N·贝内特、H·白、R·J·拉戈特、L·F·米勒斯、B·I·M·威基、A·库尔贝、R·J·德哈斯、N·贝塞尔、P·J·Y·梁、T·F·哈迪、S·佩洛克、D·提舍尔、F·陈、B·科普尼克、H·阮、A·康、B·桑卡拉恩、A·K·贝拉、N·P·金、D·贝克。  \n*科学，2022年9月。*  \n[[10.1126\u002Fscience.add2187](https:\u002F\u002Fdoi.org\u002F10.1126\u002Fscience.add2187)]\n\n**PiFold：迈向有效且高效的蛋白质逆向折叠。**  \n高张阳、谭成、李斯坦泽。  \n*预印本，2022年9月。*  \n[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2209.12643)\n\n**PeTriBERT：通过三维编码增强BERT以用于逆向蛋白质折叠和设计。**  \n鲍德温·杜莫蒂埃、安托万·留特库斯、克莱芒·卡雷、加布里埃尔·克鲁克。  \n*预印本，2022年8月。*  \n[[10.1101\u002F2022.08.10.503344](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.08.10.503344)]\n\n**SIPF：用于逆向蛋白质折叠的采样方法。**  \n付天帆、孙继明。  \n*KDD，2022年8月。*  \n[[10.1145\u002F3534678.3539284](https:\u002F\u002Fdoi.org\u002F10.1145\u002F3534678.3539284)]\n\n\n**基于深度学习和自洽性的无旋转异构体蛋白质序列设计。**  \n刘宇峰、张璐、王伟伦、朱敏、王晨晨、李福东、张家海、李厚强、陈权与刘海燕。  \n*自然计算科学，2022年7月。*  \n[[10.1038\u002Fs43588-022-00273-6](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs43588-022-00273-6)]\n\n**通过学习残基的简洁局部环境实现准确高效的蛋白质序列设计。**  \n黄斌、范廷文、王凯悦、张海沧、于春功、聂淑玉、齐杨硕、郑伟谋、韩建、范正、孙世伟、叶生、杨怀义、卜东波。  \n*预印本，2022年7月。*  \n[[10.1101\u002F2022.06.25.497605](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.06.25.497605)]\n\n**基于结构数据的蛋白质序列采样与预测。**  \n加布里埃尔·安德烈斯·奥雷利亚纳、哈维尔·卡塞雷斯-德尔皮亚诺、罗伯托·伊巴涅斯、迈克尔·P·邓恩、莱昂纳多·阿尔瓦雷斯。  \n*预印本，2021年11月。*  \n[[10.1101\u002F2021.09.06.459171](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.09.06.459171)]\n\n**利用深度学习设计具有不连续功能位点的蛋白质。**  \n道格·提舍尔、西德尼·利桑扎、王珏、董润泽、伊万·阿尼申科、卢卡斯·F·米勒斯、谢尔盖·奥夫钦尼科夫、大卫·贝克。  \n*预印本，2020年11月。*  \n[[10.1101\u002F2020.11.29.402743](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.11.29.402743)]\n\n**利用几何向量感知器从蛋白质结构中学习。**  \n景博文、施特凡·艾斯曼、帕特里夏·苏里亚纳、拉斐尔·J.L·汤森德、罗恩·德罗尔。  \n*预印本，2020年9月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2009.01411)]\n\n**基于学习势能的蛋白质序列设计。**  \n纳姆拉塔·阿南德、拉斐尔·R·江口、亚历山大·德里、罗斯·B·奥特曼、黄博思。  \n*预印本，2020年1月。*  \n[[10.1101\u002F2020.01.06.895466](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.01.06.895466)]\n\n**利用深度图神经网络设计真正的新型蛋白质。**  \n阿列克谢·斯特罗卡奇、大卫·贝塞拉、卡尔莱斯·科尔比、阿尔伯特·佩雷斯-里瓦、菲利普·M·金。  \n*预印本，2019年12月。*  \n[[10.1101\u002F868935](https:\u002F\u002Fdoi.org\u002F10.1101\u002F868935)] [[bioRxiv](https:\u002F\u002Fwww.biorxiv.org\u002Fcontent\u002F10.1101\u002F868935v1)]\n\n**ProDCoNN：利用卷积神经网络进行蛋白质设计。**  \n张源、陈洋、王晨然、罗春潮、刘秀文、吴伟、张金峰。  \n*蛋白质：结构、功能、生物信息学，2019年12月。*  \n[[10.1002\u002Fprot.25868]( https:\u002F\u002Fdoi.org\u002F10.1002\u002Fprot.25868)]\n\n**RamaNet：利用长短期记忆生成对抗神经网络进行从头蛋白质计算设计。**  \n萨丽·萨班、米哈伊尔·马尔科夫斯基。  \n*预印本，2019年6月。*  \n[[10.1101\u002F671552](https:\u002F\u002Fdoi.org\u002F10.1101\u002F671552)] [[bioRxiv](https:\u002F\u002Fwww.biorxiv.org\u002Fcontent\u002F10.1101\u002F671552v1)]\n\n**基于图的蛋白质生成模型。**  \n约翰·英格拉姆、维卡斯·K·加格、雷吉娜·巴尔齐莱、汤米·雅科拉。  \n*ICLR关于高度结构化数据的深度生成模型研讨会，2019年5月。*  \n[[OpenReview](https:\u002F\u002Fopenreview.net\u002Fpdf?id=SJgxrLLKOE)]\n\n**SPIN2：利用深度神经网络从蛋白质结构预测序列谱。**  \n詹姆斯·奥康奈尔、李志秀、杰克·汉森姆、里斯·赫弗南、詹姆斯·莱昂斯、库尔迪普·帕利瓦尔、阿卜杜拉·德赫赞吉、杨跃东、周耀奇。  \n*蛋白质，2018年3月。*  \n[[10.1002\u002Fprot.25489](https:\u002F\u002Fdoi.org\u002F10.1002\u002Fprot.25489)]\n\n### 分类、注释、搜索与比对\n\n**FAPM：利用超越结构建模的多模态模型对蛋白质进行功能注释。**  \n向文凯、熊兆平、陈欢、熊嘉诚、张伟、傅尊云、郑明月、刘冰、石倩。  \n*预印本，2024年5月。*  \n[[10.1101\u002F2024.05.07.593067](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2024.05.07.593067)]\n\n**使用大型蛋白质结构字母表进行序列比对，可将对远缘同源物的敏感性提高一倍。**   \n罗伯特·C·埃德加。  \n*预印本，2024年5月。*  \n[[10.1101\u002F2024.05.24.595840](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2024.05.24.595840)]\n\n**ProteinCLIP：用自然语言增强蛋白质语言模型。**  \n凯文·E·吴、霍华德·张、詹姆斯·邹。  \n*预印本，2024年5月。*  \n[[10.1101\u002F2024.05.14.594226](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2024.05.14.594226)]\n\n**蛋白质语言模型揭示病毒模拟与免疫逃逸。**  \n丹·奥弗、米哈尔·利尼亚尔。  \n*预印本，2024年3月。*  \n[[10.1101\u002F2024.03.14.585057](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2024.03.14.585057)]\n\n**利用注意力机制预测蛋白质序列的酶功能。**  \n尼古拉斯·布通、弗朗索瓦·科斯特、扬·勒孔夫。  \n*生物信息学，2023年10月。*  \n[[10.1093\u002Fbioinformatics\u002Fbtad620](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbtad620)]\n\n**在已知蛋白质宇宙的尺度上对预测结构进行聚类。**  \n伊尼戈·巴里奥-埃尔南德斯、郑基·余、尤尔根·雅内斯、米洛特·米尔迪塔、卡梅伦·L·M·吉尔克里斯特、塔尼塔·温、米哈伊·瓦拉迪、萨米尔·维兰卡尔、佩德罗·贝尔特劳和马丁·施泰因格。  \n《自然》杂志，2023年9月。  \n[[10.1038\u002Fs41586-023-06510-w](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41586-023-06510-w)]\n\n**TEMPROT：利用Transformer嵌入和同源搜索进行蛋白质功能注释。**  \n加布里埃尔·B·奥利维拉、埃利奥·佩德里尼和扎诺尼·迪亚斯。  \n《BMC生物信息学》，2023年6月。  \n[[10.1186\u002Fs12859-023-05375-0](https:\u002F\u002Fdoi.org\u002F10.1186\u002Fs12859-023-05375-0)]\n\n**基于对比学习的酶功能预测。**  \n于天浩、崔海洋、李嘉楠、罗宇楠、蒋广德、赵慧敏。  \n《科学》杂志，2023年3月。  \n[[10.1126\u002Fscience.adf2465](https:\u002F\u002Fdoi.org\u002F10.1126\u002Fscience.adf2465)]\n\n**ProteInfer：用于蛋白质功能推断的深度神经网络。**  \n西奥·桑德森、麦克斯韦尔·L·拜莱斯基、大卫·贝朗热、露西·J·科尔威尔。  \n《eLife》，2023年2月。  \n[[10.7554\u002FeLife.80942](https:\u002F\u002Fdoi.org\u002F10.7554\u002FeLife.80942)]\n\n**用于预测酶性质的机器学习模型应在未用于模型训练的蛋白质上进行测试。**  \n亚历山大·克罗尔、马丁·J·勒歇尔。  \n预印本，2023年2月。  \n[[10.1101\u002F2023.02.06.526991](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.02.06.526991)]\n\n**语言模型可以识别蛋白质序列中的酶活性位点。**  \n伊夫斯·盖坦·纳纳·特乌坎、洛伊克·夸特·达西、马泰奥·马尼卡、丹尼尔·普罗布斯特、菲利普·施瓦勒、特奥多罗·莱诺。  \n预印本，2023年2月。  \n[[10.26434\u002Fchemrxiv-2021-m20gg-v3](https:\u002F\u002Fdoi.org\u002F10.26434\u002Fchemrxiv-2021-m20gg-v3)]\n\n**基于蛋白质序列嵌入的无比对序列保守性估计方法用于识别功能位点。**  \n韦兰·杨、周中亮、李胜、纳塔拉詹·坎南。  \n《生物信息学简报》，2023年1月。  \n[[10.1093\u002Fbib\u002Fbbac599](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbib\u002Fbbac599)]\n\n**通过预训练语言模型和基于同源性的标签传播，实现快速且准确的蛋白质功能序列预测。**  \n袁千木、谢俊杰、谢建聪、赵慧英、杨跃东。  \n预印本，2022年12月。  \n[[10.1101\u002F2022.12.05.519119](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.12.05.519119)]\n\n**向量聚类多重序列比对：利用蛋白质语言模型将序列比对推进至蛋白质序列相似度的“暮光区”。**  \n克莱尔·D·麦克怀特、莫娜·辛格。  \n预印本，2022年10月。  \n[[10.1101\u002F2022.10.21.513099](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.10.21.513099)]\n\n**AlphaFold2显著提升蛋白质序列比对效果。**  \n阿塔纳西奥斯·巴尔齐斯、莱拉·曼苏里、苏珊娜·金、比约恩·E·兰格、伊奥纳斯·埃尔布、塞德里克·诺特雷达姆。  \n《生物信息学》，2022年9月。  \n[[doi.org\u002F10.1093\u002Fbioinformatics\u002Fbtac625](https:\u002F\u002Fdoi.org\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbtac625)]\n\n**GO Bench：基于机器学习的蛋白质功能注释通用基准测试共享平台。**  \n安德鲁·迪克森、埃赫萨内丁·阿斯加里、爱丽丝·C·麦克哈迪、穆罕默德·R·K·莫夫拉德。  \n预印本，2022年7月。  \n[[10.1101\u002F2022.07.19.500685](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.07.19.500685)]\n\n**SETH模型可根据蛋白质嵌入预测残基无序性的细微差异。**  \n达格玛·伊尔茨霍费尔、迈克尔·海因津格、布尔哈德·罗斯特。  \n预印本，2022年6月。  \n[[10.1101\u002F2022.06.23.497276](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.06.23.497276)]\n\n**TSignal：用于信号肽预测的Transformer模型。**  \n亚历山德鲁·杜米特雷斯库、艾米·约基宁、尤霍·凯洛萨洛、维勒·帕维莱宁、哈里·莱赫德斯马基。  \n预印本，2022年6月。  \n[[10.1101\u002F2022.06.02.493958](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.06.02.493958)]\n\n**TMbed——基于语言模型嵌入预测跨膜蛋白。**  \n迈克尔·伯恩霍弗、布尔哈德·罗斯特。  \n预印本，2022年6月。  \n[[10.1101\u002F2022.06.12.495804](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.06.12.495804)]\n\n**基于蛋白质嵌入的对比学习以闪电般的速度揭示“午夜地带”的奥秘。**  \n迈克尔·海因津格、玛丽亚·利特曼、伊恩·西利托、尼古拉·博尔丁、克里斯蒂娜·奥伦戈、布尔哈德·罗斯特。  \n预印本，2021年11月。  \n[[10.1101\u002F2021.11.14.468528](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.11.14.468528)]\n\n**SignalP 6.0利用蛋白质语言模型实现所有类型信号肽的精准预测。**  \n费利克斯·特乌费尔、何塞·胡安·阿尔马格罗·阿门特罗斯、亚历山大·罗森贝格·约翰森、马格努斯·哈尔多尔·吉斯拉松、西拉斯·厄比·皮尔、康斯坦提诺斯·D·齐里戈斯、奥莱·温特、索伦·布鲁纳克、冈纳尔·冯·海涅、亨里克·尼尔森。  \n预印本，2021年7月。  \n[[10.1101\u002F2021.06.09.447770](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.06.09.447770)]\n\n**采用氨基酸序列图像表示的卷积神经网络用于蛋白质功能预测。**  \n萨米娅·塔斯尼姆·萨拉、Md·梅赫迪·哈桑、阿赫桑·艾哈迈达、斯瓦克哈尔·沙塔布达。  \n《计算生物学与化学》，2021年6月。  \n[[10.1016\u002Fj.compbiolchem.2021.107494](https:\u002F\u002Fdoi.org\u002F10.1016\u002Fj.compbiolchem.2021.107494)]\n\n**针对3D蛋白质结构学习的内生-外生卷积与池化技术。**  \n佩德罗·埃尔莫西利亚、马可·舍费尔、马捷伊·朗、格洛丽亚·法克尔曼、佩雷·保·巴斯克斯、芭芭拉·科兹利科娃、迈克尔·克罗内、托比亚斯·里切尔、蒂莫·罗平斯基。  \n预印本，2021年4月。  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2007.06252)]\n\n**深度学习生成的嵌入可使GO注释超越同源性范围。**  \n玛丽亚·利特曼、迈克尔·海因津格、克里斯蒂安·达拉戈、托比亚斯·奥列尼、布尔哈德·罗斯特。  \n预印本，2020年9月。  \n[[10.1101\u002F2020.09.04.282814](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.09.04.282814)]\n\n**基于图卷积网络的结构导向蛋白质功能预测。**  \n弗拉基米尔·格利戈里耶维奇、P·道格拉斯·伦弗鲁、托马什·科希奥莱克、朱莉娅·科勒勒·莱曼、丹尼尔·贝伦堡、汤米·瓦塔宁、克里斯·钱德勒、布林·C·泰勒、伊恩·M·菲斯克、赫拉·弗拉马基斯、拉姆尼克·J·泽维尔、罗布·奈特、京炯贤、理查德·邦诺。  \n预印本，2020年6月。  \n[[10.1101\u002F786236](https:\u002F\u002Fdoi.org\u002F10.1101\u002F786236)]\n\n**无监督蛋白质嵌入在预测分子功能方面优于手工设计的序列和结构特征。**  \n阿梅莉亚·比列加斯-莫尔西略、斯塔夫罗斯·马克罗迪米特里斯、罗兰·范·哈姆、安赫尔·M·戈麦斯、维多利亚·桑切斯、马塞尔·赖因德斯。  \n预印本，2020年4月。  \n[[10.1101\u002F2020.04.07.028373](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.04.07.028373)]\n\n**机器学习预测新型抗CRISPR蛋白。**  \n加文·J·诺特、珍妮弗·A·杜德纳、法亚兹·乌尔·阿米尔·阿夫萨尔·明哈斯。  \n预印本，2019年11月。  \n[[10.1101\u002F854950](https:\u002F\u002Fdoi.org\u002F10.1101\u002F854950)]\n\n**利用生成对抗网络创建的合成特征样本改进蛋白质功能预测。**  \n岑万、戴维·T·琼斯。  \n预印本，2019年8月。  \n[[10.1101\u002F730143](https:\u002F\u002Fdoi.org\u002F10.1101\u002F730143)]\n\n**用于蛋白质分类的通用深度序列模型。**  \n尼尔斯·施罗特霍夫、帕特里克·瓦格纳、马库斯·文策尔、沃伊切赫·萨梅克。  \n预印本，2019年7月。  \n[[10.1101\u002F704874](https:\u002F\u002Fdoi.org\u002F10.1101\u002F704874)]\n\n**利用充分的输入子集评估蛋白质家族分类模型。**  \n布兰登·卡特、麦克斯韦尔·L·比莱斯基、杰米·史密斯、西奥·桑德森、德鲁·布莱恩特、大卫·贝朗热、露西·J·科尔威尔。  \n*预印本，2019年6月。*  \n[[10.1101\u002F674119](https:\u002F\u002Fdoi.org\u002F10.1101\u002F674119)] [[bioRxiv](https:\u002F\u002Fwww.biorxiv.org\u002Fcontent\u002F10.1101\u002F674119v1)]\n\n**蛋白质分选预测的简要历史。**  \n亨里克·尼尔森、康斯坦蒂诺斯·D·齐里戈斯、索伦·布鲁纳克、冈纳尔·冯·海涅。  \n《蛋白质期刊》，2019年5月。  \n[[10.1007\u002Fs10930-019-09838-3](https:\u002F\u002Fdoi.org\u002F10.1007\u002Fs10930-019-09838-3)]\n\n**DEEPred：基于多任务前馈深度神经网络的自动化蛋白质功能预测。**  \n阿赫迈特·苏雷亚·里法伊奥卢、通查·多安、玛丽亚·赫苏斯·马丁、伦古尔·切廷-阿塔莱、沃尔坎·阿塔莱。  \n《科学报告》，2019年5月。  \n[[10.1038\u002Fs41598-019-43708-3](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41598-019-43708-3)]\n\n**利用深度学习标注蛋白质世界。**  \n麦克斯韦尔·L·比莱斯基、大卫·贝朗热、德鲁·布莱恩特、西奥·桑德森、布兰登·卡特、D·斯库利、马克·A·德普里斯托、露西·J·科尔威尔。  \n*预印本，2019年5月。*  \n[[10.1101\u002F626507](https:\u002F\u002Fdoi.org\u002F10.1101\u002F626507)] [[bioRxiv](https:\u002F\u002Fwww.biorxiv.org\u002Fcontent\u002F10.1101\u002F626507v3)]\n\n**ECPred：一种基于EC命名法预测蛋白质序列酶功能的工具。**  \n阿尔佩伦·达尔基兰、阿赫迈特·苏雷亚·里法伊奥卢、玛丽亚·赫苏斯·马丁、伦古尔·切廷-阿塔莱、沃尔坎·阿塔莱、通查·多安。  \n《BMC生物信息学》，2018年9月。  \n[[10.1186\u002Fs12859-018-2368-y](https:\u002F\u002Fdoi.org\u002F10.1186\u002Fs12859-018-2368-y)]\n\n**DeepGO：利用深度本体论感知分类器从序列和相互作用中预测蛋白质功能。**  \n马哈特·库尔曼诺夫、穆罕默德·阿西夫·汗、罗伯特·霍恩多夫。  \n《生物信息学》，2018年2月。  \n[[10.1093\u002Fbioinformatics\u002Fbtx624](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbtx624)]\n\n**利用深度神经网络实现近乎完美的蛋白质多标签分类。**  \n巴拉兹·萨尔凯亚、文策·格罗穆什布。  \n《方法》，2018年1月。  \n[[10.1016\u002Fj.ymeth.2017.06.034](https:\u002F\u002Fdoi.org\u002F10.1016\u002Fj.ymeth.2017.06.034)]\n\n**大规模自动化蛋白质序列功能预测及针对PTEN转录本变异体的实验案例验证。**  \n阿赫迈特·苏雷亚·里法伊奥卢、通查·多安、奥梅尔·希南·萨拉奇、图林·埃尔萨欣、拉比·赛迪、梅赫梅特·沃尔坎·阿塔莱、玛丽亚·赫苏斯·马丁、伦古尔·切廷-阿塔莱。  \n《蛋白质》，2017年11月。  \n[[10.1002\u002Fprot.25416](https:\u002F\u002Fdoi.org\u002F10.1002\u002Fprot.25416)]\n\n**ProLanGO：基于循环神经网络的神经机器翻译用于蛋白质功能预测。**  \n任志曹、科尔顿·弗雷塔斯、梁光灿、苗孙、海青江、张新辰。  \n《分子》，2017年10月。  \n[[10.3390\u002Fmolecules22101732](https:\u002F\u002Fdoi.org\u002F10.3390\u002Fmolecules22101732)]\n\n**用于深度蛋白质组学和基因组学的生物序列连续分布式表示。**  \n埃赫萨内丁·阿斯加里、穆罕默德·R·K·莫夫拉德  \n《PLOS One》，2015年11月。  \n[[10.1371\u002Fjournal.pone.0141287](https:\u002F\u002Fdoi.org\u002F10.1371\u002Fjournal.pone.0141287)]\n\n**蛋白质结构的结构比对核函数。**  \n钱建秋、马蒂厄·于、阿萨·本-胡尔、让-菲利普·韦尔、威廉·斯塔福德·诺布尔  \n《生物信息学》，2007年1月。  \n[[10.1093\u002Fbioinformatics\u002Fbtl642](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbtl642)]  \n\n**谱核：用于SVM蛋白质分类的字符串核函数。**  \n克里斯蒂娜·S·莱斯利、埃莱亚扎尔·埃斯金、威廉·斯塔福德·诺布尔。  \n《太平洋生物计算研讨会》，2002年1月。  \n[[pdf](http:\u002F\u002Fpsb.stanford.edu\u002Fpsb-online\u002Fproceedings\u002Fpsb02\u002Fleslie.pdf)]\n\n\n\n### 预测与其他分子的相互作用\n\n**用于分子系统精确高效几何深度学习的通用框架。**  \n张硕、刘洋、谢磊。  \n《科学报告》，2023年11月。  \n[[10.1038\u002Fs41598-023-46382-8](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41598-023-46382-8)]\n\n**利用掩码语言模型配对相互作用的蛋白质序列。**  \n翁贝托·卢波、达米亚诺·斯加博萨、安妮-弗洛伦斯·比特博尔。  \n*预印本，2023年8月。*  \n[[10.1101\u002F2023.08.14.553209](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.08.14.553209)]\n\n**从蛋白质到配体：解析用于结合亲和力预测的深度学习方法。**  \n罗汉·戈兰特拉、阿日贝塔·库宾科娃、安德烈娅·Y·魏瑟、安东尼娅·S·J·S·梅伊。  \n*预印本，2023年8月。*  \n[[10.1101\u002F2023.08.01.551483](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.08.01.551483)]\n\n**利用生成式深度学习框架从头设计κ-阿片受体拮抗剂。**  \n莱斯利·萨拉斯-埃斯特拉达、达维德·普罗瓦西、邱兴、胡斯努·于米特·卡尼斯坎、奚平·黄、杰弗里·F·迪贝尔托、若昂·马塞洛·拉米姆·里贝罗、金建、布莱恩·L·罗斯以及玛尔塔·菲利佐拉。  \n《化学信息学与建模杂志》，2023年8月。  \n[[10.1021\u002Facs.jcim.3c00651](https:\u002F\u002Fdoi.org\u002F10.1021\u002Facs.jcim.3c00651)]\n\n**基于序列的纳米抗体-抗原结合预测。**  \n乌萨马·萨达尔、萨尔万·阿里、穆罕默德·索海卜·阿尤布、穆罕默德·绍伊卜、库拉姆·巴希尔、伊姆达德·乌拉·汗、默里·帕特森。  \n*预印本，2023年7月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2308.01920)]\n\n**机器学习优化候选抗体，获得高度多样化的亚纳摩尔级亲和力抗体库。**  \n林莉、埃丝特·古普塔、约翰·斯皮思、莱斯利·辛格、拉斐尔·海梅斯、艾米丽·恩格尔哈特、兰多夫·洛佩斯、拉蒙达·S·卡塞雷斯、特里斯坦·贝普勒以及马修·E·沃尔什。  \n《自然通讯》，2023年6月。  \n[[10.1038\u002Fs41467-023-39022-2](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41467-023-39022-2)]\n\n**利用蛋白质语言和图神经网络匹配受体与气味分子。**  \n马泰伊·赫拉迪什、马克桑斯·拉利斯、塞巴斯蒂安·菲奥鲁奇、热雷米·托潘。  \n*ICLR，2023年5月。*  \n[ICLR](https:\u002F\u002Fopenreview.net\u002Fforum?id=q9VherQJd8_)\n\n**基于机器学习和深度学习预测酶小分子底物的一般模型。**  \n亚历山大·克罗尔、萨哈斯拉·兰詹、马丁·K·M·英奎斯特以及马丁·J·莱彻。  \n《自然通讯》，2023年5月。  \n[[10.1038\u002Fs41467-023-38347-2](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41467-023-38347-2)]\n\n**利用学习到的表面指纹从头设计蛋白质相互作用。**  \n巴勃罗·盖因萨、莎拉·韦尔勒、亚历山德拉·范·霍尔-博沃伊斯、安东尼·马尚、安德烈亚斯·谢克、赞德·哈特韦尔德、斯蒂芬·巴克利、董春尼、宋广谭、弗雷尔·斯韦里松、卡斯珀·戈弗德、普里西拉·图雷利、夏琳·拉克洛、亚历山德拉·特斯连科、马丁·帕塞萨、斯蒂芬·罗塞特、桑德琳·乔治翁、简·马斯登、亚伦·佩特鲁泽拉、李克芳、徐泽鹏、严柴、浦韩、乔治·F·高……以及布鲁诺·E·科雷亚。  \n《自然》，2023年4月。  \n[[10.1038\u002Fs41586-023-05993-x](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41586-023-05993-x)]\n\n**PeSTo：无参数几何深度学习，用于精确预测蛋白质结合界面。**  \n吕西安·F·克拉普、卢西亚诺·A·阿布里亚塔、法比奥·科尔特斯·罗德里格斯以及马泰奥·达尔·佩拉罗。  \n《自然通讯》，2023年4月。  \n[[10.1038\u002Fs41467-023-37701-8](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41467-023-37701-8)]\n\n**DRPBind：预测内在无序蛋白质序列中的DNA、RNA和蛋白质结合残基。**  \n罗内什·夏尔马、津田达彦、阿洛克·夏尔马。  \n*预印本，2023年3月。*  \n[[10.1101\u002F2023.03.20.533427](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.03.20.533427)]\n\n**FlexVDW：一种用于在配体对接中考虑蛋白质柔性的机器学习方法。**  \n帕特里夏·苏里亚纳、约瑟夫·M·帕吉、罗恩·O·德罗尔。  \n*预印本，2023年3月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2303.11494)]\n\n**端到端的序列-结构-功能元学习可预测全基因组范围内暗蛋白的化学-蛋白质相互作用。**  \n蔡天、谢丽、张硕、陈木格、何迪、阿米特什·巴德库尔、刘洋、哈里·克里希纳·南巴拉、迈克尔·多罗甘、韦恩·W·哈丁、卡梅伦·穆拉、菲利普·E·伯恩、谢磊。  \n*《PLOS 计算生物学》，2023年1月。*  \n[[10.1371\u002Fjournal.pcbi.1010851](https:\u002F\u002Fdoi.org\u002F10.1371\u002Fjournal.pcbi.1010851)]\n\n**人工智能在解析嗅觉、嗅觉受体与小分子之间关系中的应用。**  \n雷亚娜·阿切布什、安妮·特罗梅兰、卡琳·奥杜兹和奥利维埃·塔布尔欧。  \n*《科学报告》，2022年11月。*  \n[[10.1038\u002Fs41598-022-23176-y](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41598-022-23176-y)]\n\n**DiffBP：用于靶向蛋白质结合的三维分子生成扩散模型。**  \n林海涛、黄宇飞、刘猛、李璇静、季水旺、李三祥。  \n*预印本，2022年11月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2211.11214)]\n\n**DiffDock：用于分子对接的扩散步骤、扭转与转向。**  \n加布里埃莱·科尔索、汉内斯·施塔克、景博文、雷吉娜·巴尔齐莱、汤米·雅科拉。  \n*预印本，2022年10月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2210.01776)]\n\n**基于AlphaFold的分子对接预测在抗生素发现中的基准测试。**  \n费利克斯·王、阿蒂·克里希南、艾丽卡·J·郑、汉内斯·施塔克、阿比盖尔·L·曼森、阿什莉·M·厄尔、汤米·雅科拉、詹姆斯·J·柯林斯。  \n*《分子系统生物学》，2022年9月。*  \n[[10.15252\u002Fmsb.202211081](https:\u002F\u002Fdoi.org\u002F10.15252\u002Fmsb.202211081)]\n\n**利用多尺度生成扩散模型进行动态主链蛋白质-配体结构预测。**  \n乔卓然、聂伟力、阿拉什·瓦赫达特、托马斯·F·米勒三世、阿尼玛·阿南德库马尔。  \n*预印本，2022年9月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2209.15171)]\n\n**基于蛋白质序列的强化学习模型实现广泛使用且快速的从头药物设计。**  \n李亚琴、李玲丽、徐永进、于毅。  \n*预印本，2022年8月。*  \n[[10.1101\u002F2022.08.18.504370](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.08.18.504370)]\n\n**通过层次化等变精炼进行抗体-抗原对接与设计。**  \n金文功、雷吉娜·巴尔齐莱、汤米·雅科拉。  \n*预印本，2022年7月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2207.06616)]\n\n**用于化合物-蛋白质亲和力及接触预测的跨模态自监督蛋白质嵌入。**  \n尤云宁、沈阳。  \n*预印本，2022年7月。*  \n[[10.1101\u002F2022.07.18.500559](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.07.18.500559)]\n\n**EvoBind：利用AlphaFold进行肽结合物的计算机定向进化。**  \n帕特里克·布莱恩特、阿尔内·埃洛夫松。  \n*预印本，2022年7月。*  \n[[10.1101\u002F2022.07.23.501214](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.07.23.501214)]\n\n**BepiPred-3.0：利用蛋白质语言模型改进B细胞表位预测。**  \n约阿基姆·克利福德、马格努斯·哈拉尔森·霍伊、莫滕·尼尔森、塞巴斯蒂安·德勒兰、比约恩·彼得斯、保罗·马尔卡蒂利。  \n*预印本，2022年7月。*  \n[[10.1101\u002F2022.07.11.499418](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.07.11.499418)]\n\n**利用BERT语言模型预测跨膜转运蛋白的特定底物。**  \n西玛·阿泰伊、格雷戈里·巴特勒。  \n*预印本，2022年7月。*  \n[[10.1101\u002F2022.07.23.501263](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.07.23.501263)]\n\n**利用微调后的蛋白质结构预测网络预测肽结合特异性。**  \n阿米尔·莫特曼、尤斯塔斯·道帕拉斯、白敏京、穆罕默德·H·阿贝迪、大卫·贝克、菲利普·布拉德利。  \n*预印本，2022年7月。*  \n[[10.1101\u002F2022.07.12.499365](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.07.12.499365)]\n\n**利用PocketMiner图神经网络从单个蛋白质结构中预测隐匿性口袋的位置。**  \n阿图尔·梅勒、迈克尔·沃德、乔纳森·博罗夫斯基、杰弗里·M·洛特哈默、梅格纳·克希尔萨加尔、费利佩·奥维多、胡安·拉维斯塔·费雷斯、格雷戈里·R·鲍曼。  \n*预印本，2022年6月。*  \n[[10.1101\u002F2022.06.28.497399](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.06.28.497399)]\n\n**上下颠倒：将全局视角整合到基于序列的蛋白质-蛋白质相互作用预测中。**  \n罗希特·辛格、卡皮尔·德夫科塔、塞缪尔·斯莱济斯基、邦妮·伯格、莱诺尔·考恩。  \n*《生物信息学》，2022年7月。*  \n[[10.1093\u002Fbioinformatics\u002Fbtac258](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbtac258)]\n\n**利用深度学习构建蛋白质功能位点支架。**  \n王珏、西德尼·利桑扎、戴维·尤尔根斯、道格·提舍尔、约瑟夫·L·沃森、卡拉·M·卡斯特罗、罗伯特·拉戈特、阿米贾伊·萨拉戈维、卢卡斯·F·米尔斯、白敏京、伊万·阿尼申科、魏杨、德里克·R·希克斯、马克·埃克斯波西特、托马斯·施利希特哈尔勒、春正浩、尤斯塔斯·道帕拉斯、纳撒尼尔·贝内特、巴西勒·I·M·威基、安德鲁·门克斯、弗兰克·迪马约、布鲁诺·科雷亚、谢尔盖·奥夫钦尼科夫以及大卫·贝克。  \n*《科学》，2022年7月。*  \n[[10.1126\u002Fscience.abn2100](https:\u002F\u002Fdoi.org\u002F10.1126\u002Fscience.abn2100)]\n\n**酶的底物范围：基于机器学习和深度学习的一般预测模型。** 亚历山大·克罗尔、萨哈斯拉·兰詹、马丁·K·M·英奎斯特、马丁·J·莱彻。  \n*预印本，2022年5月。*  \n[[10.1101\u002F2022.05.24.493213](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.05.24.493213)]\n\n**家族级酶-底物特异性筛选的机器学习建模。**  \n塞缪尔·戈德曼、里亚·达斯、凯文·K·杨、康纳·W·科利。  \n*《PLoS 计算生物学》，2022年2月。*  \n[[10.1371\u002Fjournal.pcbi.1009853](https:\u002F\u002Fdoi.org\u002F10.1371\u002Fjournal.pcbi.1009853)]\n**酶的底物范围：基于机器学习和深度学习的一般预测模型**\n亚历山大·克罗尔、萨哈斯拉·兰詹、马丁·K·M·英奎斯特、马丁·J·莱彻。  \n*预印本，2022年5月。*  \n[[10.1101\u002F2022.05.24.493213](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.05.24.493213)]\n\n**AlphaFold编码了识别高亲和力肽结合物的原则。**  \n常立伟、阿尔贝托·佩雷斯。  \n*预印本，2022年3月。*  \n[[10.1101\u002F2022.03.18.484931](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.03.18.484931)]\n\n**利用非结构数据预测蛋白质-配体复合物的结构与亲和力。**  \n约瑟夫·M·帕吉、朱莉娅·A·贝尔克、斯科特·A·霍林斯沃思、尼古拉斯·维利亚纽瓦、亚历山大·S·鲍尔斯、玛丽·J·克拉克、奥古斯丁·G·钱帕拉蒂、乔纳森·E·蒂南、托马斯·K·劳、罗杰·K·苏纳哈拉以及罗恩·O·德罗尔。  \n*《PNAS》，2021年12月。*  \n[[10.1073\u002Fpnas.2112621118](https:\u002F\u002Fdoi.org\u002F10.1073\u002Fpnas.2112621118)]\n\n**AlphaFill：用配体和辅因子丰富AlphaFold模型。**  \n马尔滕·L·赫克尔曼、伊达·德·德·弗里斯、罗比·P·约斯滕、阿纳斯塔西斯·佩拉基斯。  \n*预印本，2021年11月。*  \n[[10.1101\u002F2021.11.26.470110](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.11.26.470110)]\n\n**深度学习可根据结构特征实现基因组规模的米氏常数预测。**  \n亚历山大·克罗尔、马丁·K·M·英奎斯特、大卫·赫克曼、马丁·J·莱彻尔。  \n*PLoS生物学，2021年10月*  \n[[10.1371\u002Fjournal.pbio.3001402](https:\u002F\u002Fdoi.org\u002F10.1371\u002Fjournal.pbio.3001402)]\n\n**基于序列的概率模型探究T细胞应答。**  \n芭芭拉·布拉维、维诺德·P·巴拉昌德兰、本杰明·D·格林鲍姆、亚历山德拉·M·瓦尔恰克、蒂埃里·莫拉、雷米·莫纳松、西蒙娜·科科。  \n*PLOS计算生物学，2021年9月。*    \n[[10.1371\u002Fjournal.pcbi.1009297](https:\u002F\u002Fdoi.org\u002F10.1371\u002Fjournal.pcbi.1009297)]\n\n**具有生物学意义的迁移学习可提升转录因子结合位点预测性能。**  \n格尔曼·诺瓦科夫斯基、马努·萨拉斯瓦特、奥里奥尔·福尔内斯、萨拉·莫斯塔菲及怀思·W·沃瑟曼。   \n*基因组生物学，2021年9月。*  \n[[10.1186\u002Fs13059-021-02499-5](https:\u002F\u002Fdoi.org\u002F10.1186\u002Fs13059-021-02499-5)]\n\n**基于深度学习的kcat预测有助于改进酶约束模型重建。**  \n李飞然、袁乐、陆洪忠、李刚、陈宇、马丁·K·M·英奎斯特、爱德华·J·刻尔霍文、延斯·尼尔森。  \n*预印本，2021年8月*  \n[[10.1101\u002F2021.08.06.455417 ](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.08.06.455417 )]\n\n**十亿个合成的三维抗体-抗原复合物实现了对抗体特异性预测不受限制的机器学习研究。**  \n菲利普·A·罗伯特、拉赫马德·阿克巴尔、罗伯特·弗兰克、米莱娜·帕夫洛维奇、迈克尔·维德里希、伊戈尔·斯纳普科夫、玛丽亚·切尔尼戈夫斯卡娅、洛内克·谢费尔、安德烈·斯拉博德金、布里吉·布尚·梅塔、麦哈·武、奥雷尔·普罗斯、克日什托夫·阿布拉姆、亚历克斯·奥拉尔、恩凯莱达·米霍、达格·特吕格韦·特里斯勒·豪格、弗里特约夫·伦德-约翰森、塞普·霍赫赖特、英格丽德·霍贝克·哈夫、君特·克拉姆鲍尔、盖尔·K·桑德韦、维克多·格莱夫。  \n*预印本，2021年7月。*    \n[[10.1101\u002F2021.07.06.451258](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.07.06.451258)]\n\n**利用CNN与GCN相结合的方法，融合序列和空间邻域信息进行互补决定簇预测。**  \n卢帅、李玉光、王飞、南晓飞、张守涛。  \n*IEEE\u002FACM计算生物学与生物信息学汇刊，2021年5月。*  \n[[10.1109\u002FTCBB.2021.3083001](https:\u002F\u002Fdoi.org\u002F10.1109\u002FTCBB.2021.3083001)]\n\n**用于互补决定簇-表位联合预测的神经消息传递方法。**  \n爱丽丝·德尔·韦基奥、安德蕾娅·迪亚克、皮耶特罗·利奥、佩塔尔·韦利奇科维奇。  \n*预印本，2021年5月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2106.00757)]\n\n**通过学习随机掩码解释生物序列的神经网络。**  \n约翰内斯·林德、阿莉莎·拉弗勒、陈子博、阿雅斯贾·柳贝季奇、大卫·贝克、斯里拉姆·坎南、格奥尔格·泽利格。  \n*预印本，2021年4月。*  \n[[10.1101\u002F2021.04.29.441979](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.04.29.441979)]\n\n**GraphProt2：一种基于图神经网络的RNA结合蛋白结合位点预测方法。**  \n迈克尔·乌尔、范丁·陈、弗洛里安·海尔、罗尔夫·巴科芬。  \n*预印本，2021年3月。*  \n[[10.1101\u002F850024](https:\u002F\u002Fdoi.org\u002F10.1101\u002F850024)]\n\n**利用抗体-抗原结合界面训练基于图像的深度神经网络进行抗体-表位分类。**  \n丹尼尔·R·里波尔、西达尔塔·乔杜里、安德斯·瓦尔克维斯特。  \n*PLOS计算生物学，2021年3月。*  \n[[10.1371\u002Fjournal.pcbi.1008864](https:\u002F\u002Fdoi.org\u002F10.1371\u002Fjournal.pcbi.1008864)]\n\n**用于新型病毒-人类蛋白质相互作用的多任务迁移学习框架。**  \n阮氏东、梅加·科斯拉。  \n*预印本，2021年3月。*  \n[[10.1101\u002F2021.03.25.437037](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.03.25.437037)]\n\n**EGRET：边缘聚合图注意力网络与迁移学习提升蛋白质-蛋白质相互作用位点预测精度。**  \n萨赞·马赫布布、穆罕默德·沙姆苏佐哈·贝济德。  \n*预印本，2021年2月。*  \n[[10.1101\u002F2020.11.07.372466](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.11.07.372466)]\n\n**迈向蛋白质复合物功能的系统性表征：自然语言处理与机器学习框架。**  \n瓦伦·S·夏尔马、安德烈亚·福萨蒂、罗道尔福·丘法、玛丽亚·布尔扬、埃文·G·威廉姆斯、陈振、邵文光、帕特里克·G·A·佩德里奥利、安东尼·W·珀塞尔、玛丽亚·罗德里格斯·马丁内斯、……李晨。  \n*预印本，2021年2月。*  \n[[10.1101\u002F2021.02.24.432789](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.02.24.432789)]\n\n**胶囊网络用于蛋白质泛素化位点预测。**  \n黄启义、蒋久磊、罗音、李伟民、王颖。  \n*预印本，2021年1月。*  \n[[10.1101\u002F2021.01.07.425697](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.01.07.425697)]\n\n**准确的新抗原预测取决于突变位置相对于患者等位基因特异性MHC锚定位点的位置。**  \n夏辉明、乔舒亚·F·麦克米歇尔、苏昂松·苏帕蓬、梅根·M·里希特斯、阿纳米卡·巴苏、科迪·A·拉米雷斯、克里斯蒂娜·普伊格-索斯、凯尔西·C·科托、贾斯里特·洪达尔、苏珊娜·基瓦拉、……马拉基·格里菲斯。  \n*预印本，2020年12月。*  \n[[10.1101\u002F2020.12.08.416271](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.12.08.416271)]\n\n**DeepPurpose：用于药物-靶标相互作用预测的深度学习库。**  \n黄克新、傅天凡、卢卡斯·M·格拉斯、马林卡·齐特尼克、肖曹、孙继明。  \n*生物信息学，2020年12月。*  \n[[10.1093\u002Fbioinformatics\u002Fbtaa1005](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbtaa1005)]\n\n**采用不同蛋白质工程和机器学习方法评估2-脱氧-D-核糖-5-磷酸醛缩酶（DERA）的底物特异性。**  \n桑妮·沃蒂莱宁、马库斯·海诺宁、马蒂娜·安德贝格、埃米·约基宁、汉努·马海莫、约翰·派科宁、妮娜·哈库利宁、尤哈·鲁维宁、哈里·莱赫德斯马基、塞缪尔·卡斯基、尤霍·鲁苏、梅尔雅·彭蒂拉及安努·科伊武拉。   \n*应用微生物学与生物技术，2020年11月。*  \n[[10.1007\u002Fs00253-020-10960-x](https:\u002F\u002Fdoi.org\u002F10.1007\u002Fs00253-020-10960-x)]\n\n**BERTMHC：利用Transformer和多实例学习提升MHC-肽II类相互作用预测精度。**  \n程俊、凯德雷·本贾马、卡罗拉·里特纳、布兰登·马龙。  \n*预印本，2020年11月。*  \n[[10.1101\u002F2020.11.24.396101](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.11.24.396101)]\n\n\n**细胞穿透肽预测：构建并解读基于随机森林的预测模型。**  \n希尔帕·亚达哈利、钱德拉·S·维尔马。  \n*预印本，2020年10月。*  \n[[10.1101\u002F2020.10.15.341149](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.10.15.341149)]\n\n**Struct2Graph：一种基于图注意力网络的蛋白质-蛋白质相互作用结构预测方法。**  \n马扬克·巴拉万、阿布拉姆·马格纳、雅各布·萨尔丁格、埃米内·S·图拉利-埃姆雷、希瓦尼·科扎雷卡尔、保罗·埃尔瓦蒂、J·斯科特·范埃普斯、尼古拉斯·A·科托、安吉拉·维奥利、阿尔弗雷德·O·英雄。  \n*预印本，2020年9月。*  \n[[10.1101\u002F2020.09.17.301200](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.09.17.301200)]\n\n**基于TCR CDR3区预测单个T细胞的抗原特异性。**  \n戴维·S·费舍尔、吴一涵、本杰明·舒伯特、法比安·J·泰斯。  \n*分子系统生物学，2020年8月。*  \n[[10.15252\u002Fmsb.20199416](https:\u002F\u002Fdoi.org\u002F10.15252\u002Fmsb.20199416)]\n\n**DeepKinZero：用于预测涉及研究较少激酶的激酶–磷酸化位点关联的零样本学习。**  \n伊曼·德兹纳比、布斯拉·阿拉巴奇、梅赫梅特·科尤图尔克、厄兹努尔·塔斯坦。  \n*生物信息学，2020年6月。*  \n[[10.1093\u002Fbioinformatics\u002Fbtaa013](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbtaa013)]\n\n**EpiDope：一种用于线性B细胞表位预测的深度神经网络。**  \n马克西米利安·科拉茨、弗洛里安·莫克、马丁·霍尔策、埃马努埃尔·巴斯、康拉德·萨克瑟、曼雅·马尔茨。  \n*预印本，2020年5月。*  \n[[10.1101\u002F2020.05.12.090019](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.05.12.090019)]\n\n**Site2Vec：一种参考系不变的算法，用于蛋白质-配体结合位点的向量嵌入表示。**  \n阿尔纳布·巴德拉、卡利达斯·Y。  \n*预印本，2020年3月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2003.08149v1)]\n\n**基于能量的图卷积网络用于评分蛋白质对接模型。**  \n曹悦、沈洋。  \n*蛋白质：结构、功能与生物信息学，2020年。*  \n[[10.1002\u002Fprot.25888](https:\u002F\u002Fdoi.org\u002F10.1002\u002Fprot.25888)]\n\n**利用深度上下文化表示学习评估突变对蛋白质-蛋白质相互作用的影响**  \n周广宇、陈慕浩、朱洁婷、王铮、江俊宇、王伟。  \n*NAR基因组学与生物信息学，2020年3月*  \n[[10.1093\u002Fnargab\u002Flqaa015](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fnargab\u002Flqaa015)]  \n\n**利用机器学习对蛋白质-肽相互作用及信号网络进行生物物理预测。**  \n约瑟夫·M·坎宁安、格里戈里·科伊蒂格、彼得·K·索格和穆罕默德·阿尔库赖希。  \n*自然方法，2020年1月。*  \n[[10.1038\u002Fs41592-019-0687-1](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41592-019-0687-1)]\n\n**从嗅觉受体的序列中解码其功能。**  \n丛晓静、任文文、乔迪·帕卡隆、克莱尔·A·德·马尔什、徐伦、松波弘明、于一群、热罗姆·戈莱比奥斯基。  \n*预印本，2020年1月。*  \n[[10.1101\u002F2020.01.06.895540](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.01.06.895540)]\n\n**用于合成生物学的序列到功能深度学习框架。**  \n杰奎琳·瓦莱里、凯瑟琳·M·柯林斯、比安卡·A·莱佩、蒂莫西·K·卢、迪奥戈·M·卡马乔。  \n*预印本，2019年12月。*  \n[[10.1101\u002F870055](https:\u002F\u002Fdoi.org\u002F10.1101\u002F870055)]\n\n**可解释的深度关系网络用于预测化合物-蛋白质亲和力和接触。**  \n穆斯塔法·卡里米、吴迪、王张阳、沈洋。  \n*预印本，2019年12月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F1912.12553v1)]\n\n**利用单个蛋白质\u002F配体结合模型预测从未见过的蛋白质的活性配体。**  \n维克拉姆·桑达尔、露西·科尔韦尔。  \n*NeurIPS机器学习与物理科学研讨会，2019年12月。*  \n[[ML4PS](https:\u002F\u002Fml4physicalsciences.github.io\u002Ffiles\u002FNeurIPS_ML4PS_2019_66.pdf)]\n\n**利用几何深度学习从蛋白质分子表面破译相互作用指纹。**  \nP·盖恩扎、F·斯韦里森、F·蒙蒂、E·罗多拉、D·博斯凯尼、M·M·布朗斯坦、B·E·科雷亚。  \n*自然方法，2019年12月。*  \n[[10.1038\u002Fs41592-019-0666-6](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41592-019-0666-6)]\n\n**基于3D蛋白质结构的端到端学习用于界面预测**  \n拉斐尔·J·L·汤森德、里希·贝迪、帕特里夏·A·苏里亚娜、罗恩·O·德罗尔。  \n*NeurIPS，2019年12月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F1807.01297)]\n\n**USMPep：用于主要组织相容性复合物结合亲和力预测的通用序列模型。**  \n约翰娜·菲勒哈本、马库斯·文策尔、沃伊切赫·萨梅克、尼尔斯·施特罗特霍夫。  \n*预印本，2019年10月。*  \n[[10.1101\u002F816546](https:\u002F\u002Fdoi.org\u002F10.1101\u002F816546)]\n\n**DeepCLIP：利用深度学习预测突变对蛋白质-RNA结合的影响。**  \n亚历山大·古利弗·比约恩霍尔特·格伦宁、托马斯·科德·多克托尔、西蒙·乔纳斯·拉尔森、乌尔丽卡·西蒙·斯潘斯贝格·彼得森、丽瑟·洛勒·霍尔姆、吉特·霍夫曼·布鲁恩、迈克尔·比克罗德·汉森、安妮-梅特·哈通、扬·鲍姆巴赫、布拉格·斯托尔斯坦·安德烈森。  \n*预印本，2019年9月。*  \n[[10.1101\u002F757062](https:\u002F\u002Fdoi.org\u002F10.1101\u002F757062)] \n\n**基于暹罗残差RCNN的多方面蛋白质-蛋白质相互作用预测**  \n陈慕浩、朱洁婷、周广宇、陈雪璐、张天然、常凯威、卡洛·扎尼奥洛、王伟。  \n*生物信息学，2019年7月。（ISMB\u002FECCB-2019会议论文集）*  \n[[10.1093\u002Fbioinformatics\u002Fbtz328](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbtz328)]  \n\n**DeepConv-DTI：通过在蛋白质序列上进行卷积的深度学习预测药物-靶标相互作用。**  \n李英伍、金宗洙、南浩中。  \n*PLoS计算生物学，2019年6月。*  \n[[10.1371\u002Fjournal.pcbi.1007129](https:\u002F\u002Fdoi.org\u002F10.1371\u002Fjournal.pcbi.1007129)]\n\n**利用点云方法结合结合位点结构进行药物发现。**  \n文森特·马莱、卡洛斯·G·奥利维尔、尼古拉斯·莫伊泰西耶、杰罗姆·瓦尔迪斯普尔。  \n*预印本，2019年5月。*  \n[[arXiV]](https:\u002F\u002Farxiv.org\u002Fabs\u002F1905.12033)]\n\n**海鞘特异性神经肽的G蛋白偶联受体库。**  \n白石章、奥久田敏美、宫坂奈津子、大杉智宏、奥野靖史、井上淳和佐竹本雄。  \n*PNAS，2019年3月。*  \n[[10.1073\u002Fpnas.1816640116]( https:\u002F\u002Fdoi.org\u002F10.1073\u002Fpnas.1816640116)]\n\n**卷积神经网络架构的简单技巧可提高DNA-蛋白质结合预测的准确性。**  \n曹振、张世华。  \n*生物信息学，2018年10月。*  \n[[10.1093\u002Fbioinformatics\u002Fbty893](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbty893)\n\n**MHCflurry：开源I类MHC结合亲和力预测工具。**  \n蒂莫西·J·奥唐奈、亚历克斯·鲁宾斯坦、玛丽亚·邦萨克、安杰莉卡·B·里默、乌里·拉瑟森、杰夫·哈默巴赫。  \n*细胞系统，2018年6月。*  \n[[10.1016\u002Fj.cels.2018.05.014](https:\u002F\u002Fdoi.org\u002F10.1016\u002Fj.cels.2018.05.014)]\n\n**P2Rank：基于机器学习的工具，可快速准确地从蛋白质结构中预测配体结合位点。**    \n拉多斯拉夫·克里瓦克、大卫·霍克萨。  \n*化学信息学杂志，2018年8月。*  \n[[10.1186\u002Fs13321-018-0285-8](https:\u002F\u002Fdoi.org\u002F10.1186\u002Fs13321-018-0285-8)]  \n\n**DeepMHC：用于高性能肽-MHC结合亲和力预测的深度卷积神经网络。**  \n胡建君、刘忠浩。  \n*预印本，2017年12月。*  \n[[10.1101\u002F239236](https:\u002F\u002Fdoi.org\u002F10.1101\u002F239236)] [[bioRxiv](https:\u002F\u002Fwww.biorxiv.org\u002Fcontent\u002F10.1101\u002F239236v1)]\n\n**DeepSite：使用3D卷积神经网络的蛋白质结合位点预测器。**  \nJ、吉梅内斯、S·多尔、G·马丁内斯-罗塞尔、A·S·罗斯、G·德·法布里提斯。  \n*生物信息学，2017年10月。*  \n[[10.1093\u002Fbioinformatics\u002Fbtx350](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbtx350)]\n\n**利用词嵌入和循环神经网络预测蛋白质结合亲和力。**  \n卡洛·马扎费罗。  \n*预印本，2017年4月。*  \n[[10.1101\u002F128223](https:\u002F\u002Fdoi.org\u002F10.1101\u002F128223)] [[bioRxiv](https:\u002F\u002Fwww.biorxiv.org\u002Fnode\u002F37703.abstract)]\n\n**用于预测蛋白质-配体结合亲和力的原子卷积网络。**  \n约瑟夫·戈梅斯、巴拉特·拉姆孙达尔、埃文·N·费因伯格、维杰·S·潘德。  \n*预印本，2017年3月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F1703.10603)]\n\n**用于预测DNA-蛋白质结合的卷积神经网络架构。**  \n曾浩洋、马修·D·爱德华兹、刘戈、大卫·K·吉福德。  \n*生物信息学，2016年6月15日。*  \n[[10.1093\u002Fbioinformatics\u002Fbtw255](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbtw255)]\n\n**用于建模RNA结合蛋白靶标结构特征的深度学习框架。**  \n张赛、周静田、胡海林、龚海鹏、陈立功、程超、曾建阳。  \n*核酸研究，2015年10月。*  \n[[10.1093\u002Fnar\u002Fgkv1025](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fnar\u002Fgkv1025)]\n\n**利用深度学习预测DNA和RNA结合蛋白的序列特异性。**  \n巴巴克·阿里帕纳希、安德鲁·德隆、马修·T·韦劳赫、布伦丹·J·弗雷。  \n*自然生物技术，2015年7月。*  \n[[10.1038\u002Fnbt.3300](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fnbt.3300)]\n\n**基于学习到的三维表征进行蛋白质-蛋白质对接。**  \n格奥尔基·德列维扬科、纪尧姆·拉穆勒。  \n*预印本，2017年3月。*  \n[[10.1101\u002F738690](https:\u002F\u002Fdoi.org\u002F10.1101\u002F738690)][[bioRxiv](https:\u002F\u002Fwww.biorxiv.org\u002Fcontent\u002F10.1101\u002F738690v2)]\n\n\n\n\n### 其他监督学习\n\n**基于蛋白质序列的深度迁移学习框架，用于识别人类蛋白质组范围内的去泛素化酶-底物相互作用。**   \n刘源、李典科、张欣、夏思敏、屈英杰、凌新平、李阳、孔祥仁、张凌强、崔春平和李东。  \n*自然通讯，2024年5月。*  \n[[10.1038\u002Fs41467-024-48446-3](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41467-024-48446-3)]\n\n**TransMEP：在大型蛋白质语言模型上进行迁移学习，以从少量已知数据集中预测蛋白质突变效应。**   \n蒂尔曼·霍夫鲍尔、比尔吉特·施特罗德尔。  \n*预印本，2024年1月。*  \n[[10.1101\u002F2024.01.12.575432](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2024.01.12.575432)]\n\n**蛋白质序列-功能关系的简单性。**  \n朴妍宇、布莱恩·P·H·梅茨格、约瑟夫·W·桑顿。  \n*预印本，2023年9月。*  \n[[10.1101\u002F2023.09.02.556057](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.09.02.556057)]\n\n**基于深度学习的大规模同义变异数据集的密码子优化，可实现通用且可调的蛋白质表达。**  \n戴维·A·康斯坦特、贾希尔·M·古铁雷斯、阿南德·V·萨斯特里、丽贝卡·维亚佐、尼古拉斯·R·史密斯、朱拜尔·侯赛因、戴维·A·斯宾塞、海莉·卡特、阿比盖尔·B·文图拉、迈克尔·T·M·路易、克里斯塔·科恩内特、丽贝卡·康斯布鲁克、乔舒亚·贝内特、肯尼思·A·克劳福德、约翰·M·萨顿、安内莉丝·莫里森、安德烈娅·K·施泰格、凯里安娜·A·杰克逊、珍妮弗·T·斯坦顿、沙希德·阿卜杜勒哈克、格雷戈里·汉努姆、乔舒亚·迈尔、马修·魏因斯托克、迈尔斯·甘德尔。  \n*预印本，2023年2月。*  \n[[10.1101\u002F2023.02.11.528149](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.02.11.528149)]\n\n**将基于生物物理学的知识与贝叶斯神经网络有机结合，用于稳健的蛋白质性质预测。**  \n亨特·尼索诺夫、王一欣和詹妮弗·利斯特加滕。  \n*ACS合成生物学，2023年10月。*  \n[[10.1021\u002Facssynbio.3c00217](https:\u002F\u002Fdoi.org\u002F10.1021\u002Facssynbio.3c00217)]\n\n**FiTMuSiC：利用结构和（共）进化数据进行蛋白质适应度预测。**  \n马茨韦伊·季申、加布里埃尔·西亚、保琳·赫尔曼斯、让·夸西格罗赫、玛丽安娜·鲁曼、法布里齐奥·普奇。  \n*预印本，2023年8月。*  \n[[10.1101\u002F2023.08.01.551497](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.08.01.551497)]\n\n**评估蛋白质回归模型的性能。**  \n理查德·迈克尔、雅各布·凯斯特尔-汉森、彼得·莫尔奇·格罗特、西蒙·巴特尔斯、耶斯珀·萨洛蒙、田鹏飞、尼科斯·S·哈察基斯、沃特·K·博姆斯马。  \n*预印本，2023年6月。*  \n[[10.1101\u002F2023.06.18.545472](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.06.18.545472)]\n\n**可解释的神经架构搜索和迁移学习，用于理解序列依赖性酶促反应。**   \n张子俊、亚当·R·兰森、迈克尔·谢利、奥尔加·特罗扬斯卡娅。  \n*预印本，2023年5月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2305.11917)]\n\n**基于蛋白质语言模型的端到端II型聚酮化合物预测，无需序列比对。**  \n黄家权、高倩迪、唐颖、吴亚鑫、张鹤谦、秦志伟。  \n*预印本，2023年4月。*  \n[[10.1101\u002F2023.04.18.537339](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.04.18.537339)]\n\n**压平曲线——如何利用小型深度突变扫描数据集获得更好结果。**  \n格雷戈尔·维尔恩斯贝格、伊娃·普里蒂沙纳茨、古斯塔夫·奥伯多费尔、卡尔·格鲁伯。  \n*预印本，2023年3月。*  \n[[10.1101\u002F2023.03.27.534314](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.03.27.534314)]\n\n**使用结构感知图卷积网络预测和设计蛋白酶特异性。**  \n卢昌鹏、约瑟夫·H·卢宾、维杜尔·V·萨尔马、塞缪尔·Z·斯滕茨、王冠阳、王思健、萨加尔·D·卡雷。  \n*预印本，2023年2月。*  \n[[10.1101\u002F2023.02.16.528728](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2023.02.16.528728)]\n\n**针对蛋白质序列和小分子的线性尺度核，在提供不确定性量化和改进可解释性的同时，性能优于深度学习。**  \n乔纳森·帕金森、王伟。  \n*预印本，2023年2月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2302.03294)]\n\n**利用机器学习和深度学习预测动力学未表征酶的周转数。**  \n亚历山大·克罗尔、胡晓潘、妮娜·A·利布兰特、马丁·J·莱彻。  \n*预印本，2022年11月。*  \n[[10.1101\u002F2022.11.10.516024](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.11.10.516024)]\n\n**PrMFTP：基于多头自注意力机制和类别权重优化的多功能治疗肽预测。**  \n闫文辉、唐文定、王丽华、毕燕楠、夏俊峰。  \n*PLOS计算生物学，2022年9月。*  \n[[10.1371\u002Fjournal.pcbi.1010511](https:\u002F\u002Fdoi.org\u002F10.1371\u002Fjournal.pcbi.1010511)]\n\n**利用表型相似性学习提高电压门控钠通道错义突变功能效应的预测精度。**  \n克里斯蒂安·马尔特·博塞尔曼、乌尔丽克·B.S.黑德里希、霍尔格·莱尔切、尼科·普菲弗。  \n*预印本，2022年9月。*  \n[[10.1101\u002F2022.09.29.510111](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.09.29.510111)]\n\n**哺乳动物细胞中的合成蛋白质级神经网络。**  \n陈子博、詹姆斯·M·林顿、朱荣辉、迈克尔·B·埃洛维茨。  \n*预印本，2022年7月。*  \n[[10.1101\u002F2022.07.10.499405](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.07.10.499405)]\n\n**人工智能时代的蛋白质结构预测：应用于计算机模拟力谱学时的挑战与局限性。**  \n普里斯西拉·S.F.C.戈麦斯、迭戈·E.B.戈麦斯、拉斐尔·C.贝尔纳迪。  \n*预印本，2022年7月。*  \ndoi: https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.06.30.498329\n\n**哺乳动物细胞中的合成蛋白质级神经网络。**  \n陈子博、詹姆斯·M·林顿、朱荣辉、迈克尔·埃洛维茨。  \n*预印本，2022年7月。*  \n[[10.1101\u002F2022.07.10.499405](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2022.07.10.499405)]\n\n**PRESTO：基于端到端深度学习模型的快速蛋白质机械强度预测。**  \n弗兰克·Y.C.刘、倪波、马库斯·J·布勒。  \n*极端力学快报，2022年8月。*  \n[[10.1016\u002Fj.eml.2022.101803](https:\u002F\u002Fdoi.org\u002F10.1016\u002Fj.eml.2022.101803)]\n\n**基于深度学习的kcat预测有助于改进酶约束模型重建。**  \n李飞然、袁乐、陆洪忠、李刚、陈宇、马丁·K·M·恩格奎斯特、爱德华·J·克尔霍文、延斯·尼尔森。  \n《自然催化》，2022年6月。  \n[[10.1038\u002Fs41929-022-00798-z](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41929-022-00798-z)]\n\n**一种拓扑数据分析方法用于发现蛋白质动力学中的生物物理特征。**  \n唐伟成、加布里埃尔·蒙特罗·达席尔瓦、亨利·基尔韦斯拉赫蒂、艾琳·斯基恩斯、毕波·冯、蒂莫西·苏迪约诺、凯文·K·杨、萨扬·穆克吉、布伦达·鲁本斯坦、洛林·克劳福德。  \n《PLoS计算生物学》，2022年5月。  \n[[10.1371\u002Fjournal.pcbi.1010045](https:\u002F\u002Fdoi.org\u002F10.1371\u002Fjournal.pcbi.1010045)]\n\n**利用神经网络从深度突变扫描数据中学习蛋白质序列—功能关系。**  \n萨姆·盖尔曼、莎拉·A·法尔贝格、皮特·海因策尔曼、菲利普·A·罗梅罗和安东尼·吉特。  \n《PNAS》，2021年11月。  \n[[10.1073\u002Fpnas.2104878118](https:\u002F\u002Fdoi.org\u002F10.1073\u002Fpnas.2104878118)]\n\n**癌症中酶活性的多尺度分析。**  \n阿娃·P·索莱马尼、杰西·D·柯克帕特里克、凯茜·S·王、亚历克斯·M·雅格尔、苏珊·苏、圣地亚哥·纳兰霍、钱钟、克里斯蒂娜·M·卡巴纳、泰勒·杰克斯、桑吉塔·N·巴蒂亚。  \n预印本，2021年11月。  \n[[10.1101\u002F2021.11.11.468288](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.11.11.468288)]\n\n**上位性网络允许对深度神经网络进行稀疏谱正则化，以推断适应度函数。**  \n阿米拉利·阿加扎德、亨特·尼索诺夫、奥尔汗·奥卡尔、大卫·H·布鲁克斯、黄一杰、O·奥赞·科伊卢奥卢、珍妮弗·利斯特加滕和坎南·拉姆昌德兰。  \n《自然通讯》，2021年9月。  \n[[10.1038\u002Fs41467-021-25371-3](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41467-021-25371-3)]\n\n**AllerStat：通过机器学习在蛋白质序列中寻找统计显著的过敏原特异性模式。**  \n后藤健斗、田目尚正、吉田拓海、花田博之、佐久间拓人、足立玲子、近藤一成、竹内一郎。  \n预印本，2021年8月。  \n[[10.1101\u002F2021.08.17.456743](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.08.17.456743)]\n\n**一种拓扑数据分析方法用于发现蛋白质动力学中的生物物理特征。**  \n唐伟成、加布里埃尔·蒙特罗·达席尔瓦、亨利·基尔韦斯拉赫蒂、艾琳·斯基恩斯、毕波·冯、蒂莫西·苏迪约诺、凯文·K·杨、萨扬·穆克吉、布伦达·鲁本斯坦、洛林·克劳福德。  \n预印本，2021年7月。  \n[[10.1101\u002F2021.07.28.454240](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.07.28.454240)]\n\n**回归模型性能与实验噪声的关系。**  \n李刚、扬·兹里梅茨、季博文、耿军、约翰·拉尔斯布林克、阿列克谢·泽列兹尼亚克、延斯·尼尔森、马丁·K·M·恩格奎斯特。  \n《生物信息学与生物学见解》，2021年6月。  \n[[10.1177\u002F11779322211020315](https:\u002F\u002Fdoi.org\u002F10.1177\u002F11779322211020315)]\n\n**In-Pero：利用蛋白质序列的深度学习嵌入预测过氧化物酶体蛋白的定位。**  \n马可·安特吉尼、维托尔·AP·马丁斯·多斯桑托斯、爱德华多·萨肯蒂。  \n《国际分子科学杂志》，2021年6月。  \n[[10.3390\u002Fijms22126409](https:\u002F\u002Fdoi.org\u002F10.3390\u002Fijms22126409)]\n\n**利用蛋白质稳定性和保守性分析预测并解释大规模诱变数据。**  \n马格努斯·H·霍伊、马泰奥·卡吉亚达、安德斯·哈根·贝克·弗雷德里克森、阿梅莉·施泰因、克雷斯滕·林多夫-拉尔森。  \n预印本，2021年6月。  \n[[10.1101\u002F2021.06.26.450037](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.06.26.450037)]\n\n**机器学习区分蛋白质中的酶促金属与非酶促金属。**  \n瑞安·费汉、梅根·W·富兰克林、乔安娜·S·G·斯卢斯基。  \n《自然通讯》，2021年6月。  \n[[10.1038\u002Fs41467-021-24070-3](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41467-021-24070-3)]\n\n**评估计算预测工具在估计错义突变导致的蛋白质稳定性变化方面的性能。**  \n沙希德·伊克巴尔、李福义、秋津达也、戴维·B·阿舍尔、杰弗里·I·韦伯、宋江宁。  \n《生物信息学简报》，2021年5月。  \n[[10.1093\u002Fbib\u002Fbbab184](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbib\u002Fbbab184)]\n\n**使用分子变换器预测酶促反应。**  \n大卫·克罗伊特、菲利普·施瓦勒、让-路易·雷蒙德。  \n《化学科学》，2021年5月。  \n[[10.1039\u002FD1SC02362D](https:\u002F\u002Fdoi.org\u002F10.1039\u002FD1SC02362D)]\n\n**关于适应度函数的稀疏性及其对学习的影响。**  \n大卫·H·布鲁克斯、阿米拉利·阿加扎德、珍妮弗·利斯特加滕。  \n预印本，2021年5月。  \n[[10.1101\u002F2021.05.24.445506](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.05.24.445506)]\n\n**深度蛋白质表示可用于预测重组蛋白表达。**  \n汉娜-玛丽·马尔蒂尼、何塞·胡安·阿尔马格罗·阿门特罗斯、亚历山大·罗森贝格·约翰森、耶斯珀·萨洛蒙、亨里克·尼尔森。  \n预印本，2021年5月。  \n[[10.1101\u002F2021.05.13.443426](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.05.13.443426)]\n\n**利用深度学习工具和建模从二维静态图像中估算细胞周期蛋白的时间表达。**\n蒂埃里·佩科特、玛丽亚·C·库伊蒂尼奥、罗杰·H·约翰逊、辛西娅·蒂默斯、古斯塔沃·莱昂内。  \n预印本，2021年4月。  \n[[10.1101\u002F2021.03.01.433386](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.03.01.433386)]\n\n**轻量级注意力机制根据生命语言预测蛋白质位置。**  \n汉内斯·施塔克、克里斯蒂安·达拉戈、迈克尔·海因齐格、布尔哈德·罗斯特。  \n预印本，2021年4月。  \n[[10.1101\u002F2021.04.25.441334](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.04.25.441334)]\n\n**基于位置的SHAP（PoSHAP）用于解释从生物序列训练的机器学习模型。**  \n奎因·迪金森、杰西·G·梅耶。  \n预印本，2021年3月。  \n[[10.1101\u002F2021.03.04.433939](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.03.04.433939)]\n\n**利用卷积神经网络建模突变对生化表型的影响：以SARS-CoV-2为例。**  \n王博、埃里克·R·加马松。  \n预印本，2021年2月。  \n[[10.1101\u002F2021.01.28.428521](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2021.01.28.428521)]\n\n**利用双向深度循环神经网络从科学文献中识别蛋白质亚细胞定位。**  \n拉凯什·大卫、里斯-约书亚·D·梅内泽斯、扬·德·克莱克、伊恩·R·卡斯尔登、科内利亚·M·胡珀、古斯塔沃·卡内罗和马修·吉利汉。  \n《科学报告》，2021年1月。  \n[[10.1038\u002Fs41598-020-80441-8](https:\u002F\u002Fdoi.org\u002F10.1038\u002Fs41598-020-80441-8)]\n\n**DeepPSC（蛋白质结构相机）：以α碳轨迹为案例，基于计算机视觉重建蛋白质主链结构。**  \n张兴、罗俊文、蔡毅、朱伟、杨晓峰、蔡宏敏、林章林。  \n预印本，2020年8月。  \n[[10.1101\u002F2020.08.12.247312](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.08.12.247312)]\n\n**TransINT：基于界面的膜蛋白—蛋白相互作用预测。**  \nG·哈曾、A·居尔坎达尼扬、T·伊萨、R·C·马伦。  \n预印本，2020年7月。  \n[[10.1101\u002F871590](https:\u002F\u002Fdoi.org\u002F10.1101\u002F871590)]\n\n**DeepEMhancer：用于冷冻电镜体积后处理的深度学习解决方案。**  \nR·桑切斯-加西亚、J·戈麦斯-布兰科、A·库埃沃、JM·卡拉索、COS·索兰佐、J·巴尔加斯。  \n预印本，2020年6月。  \n[[10.1101\u002F2020.06.12.148296](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.06.12.148296)]\n\n**ProtTox：基于蛋白质序列的毒素识别。**  \n萨塔潘·穆蒂亚、德班詹·达塔、穆罕默德·赖哈努尔·伊斯兰、帕特里克·巴特勒、安德鲁·沃伦、纳伦·拉马克里希南。  \n*预印本，2020年4月。*  \n[[10.1101\u002F2020.04.18.048439](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.04.18.048439)]\n\n**预测β-内酰胺酶的生存能力：折叠与结合自由能如何与β-内酰胺酶适应度相关联。**  \n乔丹·杨、南迪塔·奈克、贾格迪什·苏雷什·帕特尔、克里斯托弗·S·威利、温泽·顾、杰西·黄、马蒂·伊特雷伯格、曼达尔·T·奈克、丹尼尔·M·温赖希、布伦达·M·鲁本斯坦。  \n*预印本，2020年4月。*  \n[[10.1101\u002F2020.04.15.043661](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.04.15.043661)]\n\n**利用卷积神经网络、距离图和持久同调对蛋白质结构进行折叠分类。**  \n叶灿·洪、永宇·邓、郝凡·崔、扬·塞格特、简林·程。  \n*预印本，2020年4月。*  \n[[10.1101\u002F2020.04.15.042739](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.04.15.042739)]\n\n**用于序列-功能关系的最小上位性插值法。**  \n周娟楠、大卫·M·麦坎德利什。  \n*自然通讯，2020年4月。*  \n[[10.7554\u002FeLife.16965.024](https:\u002F\u002Fdoi.org\u002F10.7554\u002FeLife.16965.024)]\n\n**机器学习用于识别A类GPCR抑制中的灵活性特征。**  \n约瑟夫·贝米斯特-巴芬顿、亚历克斯·J·沃尔夫、塞巴斯蒂安·拉斯奇卡、莱斯利·A·库恩。  \n*生物分子，2020年3月。*  \n[[10.3390\u002Fbiom10030454](https:\u002F\u002Fdoi.org\u002F10.3390\u002Fbiom10030454)]\n\n**利用深度学习从冷冻电镜密度图中提取隐藏的蛋白质动力学信息。**  \n松本茂幸、石田祥一、荒木光次、加藤隆之、寺山圭、奥野康史。  \n*预印本，2020年2月。*  \n[[10.1101\u002F2020.02.17.951863](https:\u002F\u002Fdoi.org\u002F10.1101\u002F2020.02.17.951863)]\n\n**将蛋白质特异性从头药物生成视为机器翻译问题的Transformer神经网络。**  \n达里娅·格列奇什尼科娃。  \n*预印本，2019年12月。*  \n[[10.1101\u002F863415](https:\u002F\u002Fdoi.org\u002F10.1101\u002F863415)]\n\n**基于主动学习和元学习的迭代肽建模。**  \n雷尼尔·巴雷特、安德鲁·D·怀特。  \n*预印本，2019年11月。*  \n[[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F1911.09103)]\n\n**基于深度卷积神经网络和注意力机制的泛特异性模型，用于可解释的MHC-I肽结合预测。**  \n金晶、刘忠浩、阿里雷扎·纳西里、崔宇欣、斯蒂芬·路易斯、安西·张、赵勇、胡建军。  \n*预印本，2019年11月。*  \n[[10.1101\u002F830737](https:\u002F\u002Fdoi.org\u002F10.1101\u002F830737)]\n\n**BCrystal：一种可解释的基于序列的蛋白质结晶预测器。**  \n阿卜杜拉赫曼·埃尔巴西尔、拉格文德拉·马尔、哈立德·昆吉、雷达·拉维、泽尤尔·伊斯兰、郭友庄、普拉桑纳·R·科拉特卡尔、哈利玛·本斯迈尔。  \n*生物信息学，2019年10月。*  \n[[10.1093\u002Fbioinformatics\u002Fbtz762](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbtz762)]\n\n**用于抗菌肽设计的深度学习回归模型。**  \n雅各布·维滕、扎克·维滕。  \n*预印本，2019年7月。*  \n[\u002F10.1101\u002F692681](https:\u002F\u002Fdoi.org\u002F10.1101\u002F692681)] [[bioRxiv](https:\u002F\u002Fwww.biorxiv.org\u002Fcontent\u002F10.1101\u002F692681v1)]\n\n**利用机器学习从蛋白质一级序列预测生物体生长温度。**  \n戴维·B·索尔、王大宁。  \n*预印本，2019年6月。*  \n[[10.1101\u002F677328](https:\u002F\u002Fdoi.org\u002F10.1101\u002F677328)] [[bioRxiv](https:\u002F\u002Fwww.biorxiv.org\u002Fcontent\u002F10.1101\u002F677328v1?rss=1)]\n\n**SolXplain：一种可解释的基于序列的蛋白质溶解度预测器。**  \n拉格文德拉·马尔。  \n*预印本，2019年5月。*  \n[[10.1101\u002F651067](https:\u002F\u002Fdoi.org\u002F10.1101\u002F651067)] [[bioRxiv](https:\u002F\u002Fwww.biorxiv.org\u002Fcontent\u002F10.1101\u002F651067v1)]\n\n**利用三维卷积神经网络高精度检测蛋白质功能位点。**  \n温彤、拉塞尔·B·奥特曼。  \n*生物信息学，2019年5月。*  \n[[10.1093\u002Fbioinformatics\u002Fbty813](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbty813)]\n\n**开发基于机器学习的回归预测模型以工程化蛋白质溶解度。**  \n韩曦、王晓楠、周康。  \n*生物信息学，2019年4月。*  \n[[10.1093\u002Fbioinformatics\u002Fbtz294](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbtz294)]\n\n**DeepCrystal：一个基于序列的蛋白质结晶预测的深度学习框架。**  \n阿卜杜拉赫曼·埃尔巴西尔、巴拉苏布拉马尼亚·穆瓦尔库穆达尔万、哈立德·昆吉、普拉桑纳·R·科拉特卡尔、拉格文德拉·马尔、哈利玛·本斯迈尔。  \n*生物信息学，2018年11月。*  \n[[10.1093\u002Fbioinformatics\u002Fbty953](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbty953)]\n\n**DeepSol：一个基于序列的蛋白质溶解度预测的深度学习框架。**  \n萨米尔·库拉纳、雷达·拉维、哈立德·昆吉、郭友庄、哈利玛·本斯迈尔、拉格文德拉·马尔。  \n*生物信息学，2018年3月。*  \n[[10.1093\u002Fbioinformatics\u002Fbty166](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbty166)]\n\n**利用序列衍生特征改进膜蛋白表达的统计模型。**  \n夏姆·M·萨拉迪、诺曼·贾韦德、阿克塞尔·穆勒、威廉·M·克莱蒙斯二世。  \n*生物化学杂志，2018年3月。*  \n[[10.1074\u002Fjbc.RA117.001052](https:\u002F\u002Fdoi.org\u002F10.1074\u002Fjbc.RA117.001052)]\n\n**从序列-活性数据中学习上位性相互作用以预测对映体选择性。**  \n朱利安·佐格、约瑟菲娜·古穆利亚、阿尔佩什库马尔·K·马尔德、米卡埃尔·博登。  \n*计算机辅助分子设计杂志，2017年12月。*  \n[[10.1007\u002Fs10822-017-0090-x](https:\u002F\u002Fdoi.org\u002F10.1007\u002Fs10822-017-0090-x)]\n\n**利用大规模诱变数据进行定量错义突变效应预测。**  \n凡妮莎·E·格雷、罗纳德·J·豪斯、延斯·吕贝克、杰伊·申杜尔、道格拉斯·M·福勒。  \n*细胞系统，2017年12月。*  \n[[10.1016\u002Fj.cels.2017.11.003](https:\u002F\u002Fdoi.org\u002F10.1016\u002Fj.cels.2017.11.003)]\n\n**DeepLoc：利用深度学习预测蛋白质亚细胞定位。**  \n何塞·胡安·阿尔马格罗·阿门特罗斯、卡斯珀·卡埃·松德比、索伦·卡埃·松德比、亨里克·尼尔森、奥勒·温特。  \n*生物信息学，2017年9月。*  \n[[10.1093\u002Fbioinformatics\u002Fbtx548](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbtx548)]\n\n**半监督高斯过程用于自动化酶搜索。**  \n约瑟夫·梅洛尔、伊欧安娜·格里戈拉斯、巴勃罗·卡波内尔和让-卢普·福隆。  \n*ACS合成生物学，2016年3月。*  \n[[10.1021\u002Facssynbio.5b00294](https:\u002F\u002Fdoi.org\u002F10.1021\u002Facssynbio.5b00294)]\n\n**蛋白质结构中功能位点的高精度预测。**  \n柳博米尔·布图罗维奇、迈克·王、格蕾丝·W·唐、拉塞尔·B·奥特曼、德拉古廷·佩特科维奇。  \n*PLOS One，2014年3月。*  \n[[10.1371\u002Fjournal.pone.0091240](https:\u002F\u002Fdoi.org\u002F10.1371\u002Fjournal.pone.0091240)]\n\n**负责蛋白质-蛋白质相互作用特异性和多样化的MADS转录因子中的序列基序。**  \n阿尔特·D·J·范·代克、朱塞帕·莫拉比托、马丁·费尔斯、罗兰德·C·H·J·范·哈姆、格尔科·C·安格嫩特、理查德·G·H·伊明克。  \n*PLOS计算生物学，2010年11月。*  \n[[10.1371\u002Fjournal.pcbi.1001017](https:\u002F\u002Fdoi.org\u002F10.1371\u002Fjournal.pcbi.1001017)]\n\n**基于序列层面决定因素预测和理解转录因子的相互作用：组合调控机制研究**  \nA.D.J. van Dijk、C.J.F. ter Braak、R.G. Immink、G.C. Angenent、R.C.H.J. van Ham  \n《生物信息学》，2008年1月  \n[[10.1093\u002Fbioinformatics\u002Fbtm539](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbtm539)]\n\n**深度卷积网络用于蛋白质折叠质量评估**  \n格奥尔基·德列维扬科、谢尔盖·格鲁金、约书亚·本吉奥、纪尧姆·拉穆勒  \n《生物信息学》，2018年12月  \n[[10.1093\u002Fbioinformatics\u002Fbty494](https:\u002F\u002Fdoi.org\u002F10.1093\u002Fbioinformatics\u002Fbty494)][[ArXiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F1801.06252)]","# Machine-learning-for-proteins 快速上手指南\n\n**项目说明**：\n`Machine-learning-for-proteins` 并非一个可直接安装的软件库或工具包，而是一个**开源的学术论文与资源索引列表**。它旨在收集、分类并持续更新关于机器学习在蛋白质工程、结构预测、序列设计及生物物理等领域的前沿研究论文。\n\n本指南将指导开发者如何获取该资源列表，并如何利用其中的链接高效开展研究工作。\n\n## 1. 环境准备\n\n由于本项目本质是一个文档仓库（Repository），无需特定的深度学习框架（如 PyTorch\u002FTensorFlow）或 GPU 环境即可浏览内容。您只需要具备基础的代码版本管理工具和阅读环境。\n\n*   **操作系统**：Windows \u002F macOS \u002F Linux 均可\n*   **前置依赖**：\n    *   `git`：用于克隆仓库\n    *   现代浏览器（Chrome, Edge, Firefox 等）：用于查看渲染后的 Markdown 文件或访问论文链接\n    *   （可选）Markdown 编辑器：如 VS Code, Typora，用于本地离线阅读\n\n## 2. 安装步骤（获取资源）\n\n通过 Git 将该项目克隆到本地，以便随时查阅最新的论文列表。\n\n### 步骤 1: 克隆仓库\n打开终端（Terminal 或 CMD），执行以下命令：\n\n```bash\ngit clone https:\u002F\u002Fgithub.com\u002Fyour-target-repo\u002FMachine-learning-for-proteins.git\n```\n*(注：请替换为实际的 GitHub 仓库地址，通常在项目主页右上角点击 \"Code\" 按钮复制)*\n\n若在国内网络环境下克隆速度较慢，可使用 Gitee 镜像（如果有）或配置 Git 代理：\n\n```bash\n# 配置临时 HTTP 代理 (示例)\ngit -c http.proxy=http:\u002F\u002F127.0.0.1:7890 clone https:\u002F\u002Fgithub.com\u002Fyour-target-repo\u002FMachine-learning-for-proteins.git\n```\n\n### 步骤 2: 进入目录\n```bash\ncd Machine-learning-for-proteins\n```\n\n### 步骤 3: 更新内容\n由于该列表是协作维护的，建议定期拉取最新内容：\n\n```bash\ngit pull origin main\n```\n\n## 3. 基本使用\n\n本项目的主要使用方式是**查阅分类索引**并**访问原始论文**。\n\n### 方式 A: 本地阅读\n在本地文件夹中打开 `README.md` 文件。您可以直接看到按类别整理的论文列表，包括：\n*   **Reviews** (综述)\n*   **Tools and datasets** (工具与数据集)\n*   **Generative models** (生成模型)\n*   **Predicting structure from sequence** (从序列预测结构)\n*   等其他专业分类。\n\n### 方式 B: 在线浏览与追踪\n直接访问该项目的 GitHub 页面，利用浏览器的搜索功能（`Ctrl+F` \u002F `Cmd+F`）查找关键词（如 \"Diffusion\", \"Stability\", \"Design\"）。\n\n**使用示例：查找关于“蛋白质稳定性预测”的最新论文**\n\n1.  在 `README.md` 中找到 **[Predicting stability](#predicting-stability)** 章节。\n2.  该章节下的论文按**时间倒序**排列（最新在前）。\n3.  点击论文标题旁的 DOI 链接或 arXiv 链接直达原文。\n\n例如，您可能找到如下条目（示例数据）：\n> **AI challenges for predicting the impact of mutations on protein stability.**\n> *Preprint, November 2021.*\n> [[arxiv](https:\u002F\u002Farxiv.org\u002Fabs\u002F2111.04208v1)]\n\n4.  点击链接阅读论文，并根据论文中的 \"Code Availability\" 部分去获取具体的实现代码（通常指向独立的 GitHub 仓库）。\n\n### 贡献与反馈\n如果您发现了新的重要论文或希望添加新的分类，可以通过以下方式参与：\n```bash\n# 创建新分支\ngit checkout -b add-new-paper\n\n# 编辑 README.md 添加论文信息 (遵循现有格式)\n# ... 编辑保存 ...\n\n# 提交更改\ngit add README.md\ngit commit -m \"Add new paper on [Topic]\"\n\n# 推送并发起 Pull Request\ngit push origin add-new-paper\n```\n\n---\n**提示**：本列表仅作为文献导航，具体的算法复现请参考各篇论文作者提供的独立代码仓库。","某生物制药公司的算法团队正致力于利用深度学习设计一种新型耐高温酶，以优化工业催化流程。\n\n### 没有 Machine-learning-for-proteins 时\n- **文献检索大海捞针**：研究人员需在 PubMed、arXiv 等多个平台手动搜索，极易遗漏最新的生成式模型或无监督预测论文。\n- **技术选型盲目低效**：面对“从序列预测结构”还是“基于扩散模型设计”等路线选择时，缺乏系统的分类对比，难以判断哪种模型最适合当前数据量。\n- **领域认知更新滞后**：蛋白质工程领域进展极快，静态综述出版即过时，团队难以实时掌握如“表位学习”或“协同进化模式”等前沿突破。\n- **跨学科协作困难**：生物学家与算法工程师因缺乏统一的知识索引，常对术语和适用工具理解不一致，沟通成本高昂。\n\n### 使用 Machine-learning-for-proteins 后\n- **一站式精准获取**：团队直接查阅按应用场景（如“预测稳定性”、“生成模型”）分类的最新论文列表，瞬间锁定 2023 年关于扩散模型在生物信息学中应用的关键研究。\n- **科学决策有据可依**：借助清晰的分类体系，快速对比不同模型类型在“定向进化”中的表现，迅速确定采用结合无监督变异预测的混合架构。\n- **实时同步前沿动态**：依托社区协作的反向 chronological 更新机制，确保团队始终基于本月最新预印本调整实验方案，不错过任何技术红利。\n- **统一语言提升效率**：项目组成员以该列表为共同知识基准，迅速对齐对“表示学习”等概念的理解，大幅缩短方案研讨周期。\n\nMachine-learning-for-proteins 将分散破碎的学术成果转化为结构化的导航图，让蛋白质设计团队从繁琐的文献调研中解放出来，专注于核心创新。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002Fyangkky_Machine-learning-for-proteins_ed728019.png","yangkky","Kevin Kaichuang Yang","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002Fyangkky_901bb072.jpg",null,"Cambridge, MA","KevinKaichuang","yangkky.github.io","https:\u002F\u002Fgithub.com\u002Fyangkky",1697,217,"2026-04-05T12:52:28","GPL-3.0","","未说明",{"notes":91,"python":89,"dependencies":92},"该仓库并非一个可执行的软件工具或代码库，而是一个关于蛋白质机器学习论文的综述列表和资源索引。因此，它没有特定的操作系统、GPU、内存、Python 版本或依赖库要求。用户只需通过浏览器访问链接或下载文献即可使用。",[],[18],"2026-03-27T02:49:30.150509","2026-04-08T17:17:36.435990",[97,102,107,111,116,121,126,131],{"id":98,"question_zh":99,"answer_zh":100,"source_url":101},24696,"我是蛋白质机器学习领域的新手，应该从哪些论文或资源开始学习？","由于该领域的优秀综述文章众多，很难只推荐一篇。建议参考以下资源入门：\n1. 阅读近期综述：《Opportunities and Challenges for Machine Learning-Assisted Enzyme Engineering》（DOI: 10.1021\u002Facscentsci.3c01275），这篇文章涵盖了多个主要子问题，特别是酶工程方向。\n2. 浏览最新研讨会论文标题以了解当前研究热点：例如 ICLR 2024 GEM Workshop 的接收论文列表 (https:\u002F\u002Fopenreview.net\u002Fgroup?id=ICLR.cc\u002F2024\u002FWorkshop\u002FGEM#tab-accept-oral)。","https:\u002F\u002Fgithub.com\u002Fyangkky\u002FMachine-learning-for-proteins\u002Fissues\u002F207",{"id":103,"question_zh":104,"answer_zh":105,"source_url":106},24697,"有哪些关于使用随机森林预测蛋白质相互作用的重要论文？","推荐阅读以下两篇关键论文：\n1. 基础论文：介绍如何使用随机森林基于序列预测蛋白质相互作用 (https:\u002F\u002Facademic.oup.com\u002Fbioinformatics\u002Farticle\u002F24\u002F1\u002F26\u002F205552)。\n2. 后续验证论文：提供了对具有最高特征重要性的序列位置进行实验验证的研究 (https:\u002F\u002Fjournals.plos.org\u002Fploscompbiol\u002Farticle?id=10.1371\u002Fjournal.pcbi.1001017)。","https:\u002F\u002Fgithub.com\u002Fyangkky\u002FMachine-learning-for-proteins\u002Fissues\u002F1",{"id":108,"question_zh":109,"answer_zh":110,"source_url":106},24698,"如何向该项目贡献新的论文引用？","维护者建议通过以下两种方式之一贡献新论文：\n1. 提交 Pull Request (PR)。\n2. 在 Issue 评论中提供格式化的文本版本，以便维护者直接复制粘贴。格式化示例如下：\n**论文标题**\n作者列表\n期刊\u002F来源，日期，链接",{"id":112,"question_zh":113,"answer_zh":114,"source_url":115},24699,"有哪些关于蛋白质结晶预测的深度学习框架？","推荐参考 DeepCrystal，这是一个基于序列的蛋白质结晶预测深度学习框架。\n论文信息：\n**DeepCrystal: a deep learning framework for sequence-based protein crystallization prediction**\n作者：Abdurrahman Elbasir, Balasubramanian Moovarkumudalvan, Khalid Kunji, Prasanna R Kolatkar, Raghvendra Mall, Halima Bensmail\n来源：Bioinformatics, bty953\nDOI: 10.1093\u002Fbioinformatics\u002Fbty953","https:\u002F\u002Fgithub.com\u002Fyangkky\u002FMachine-learning-for-proteins\u002Fissues\u002F4",{"id":117,"question_zh":118,"answer_zh":119,"source_url":120},24700,"有哪些利用变分自编码器（VAE）生成功能性蛋白质变体的研究？","可以参考这篇论文：《Generating functional protein variants with variational autoencoders》。\n作者：Alex Hawkins-Hooker, Florence Depardieu, Sebastien Baur, Guillaume Couairon, Arthur Chen, David Bikard\n发表期刊：PLOS Computational Biology (2021 年 2 月)\n链接：https:\u002F\u002Fjournals.plos.org\u002Fploscompbiol\u002Farticle?id=10.1371\u002Fjournal.pcbi.1008736\nDOI: 10.1371\u002Fjournal.pcbi.1008736","https:\u002F\u002Fgithub.com\u002Fyangkky\u002FMachine-learning-for-proteins\u002Fissues\u002F192",{"id":122,"question_zh":123,"answer_zh":124,"source_url":125},24701,"有没有关于仅使用序列模型进行大规模蛋白质设计和优化的研究？","推荐阅读论文：《Large-scale design and refinement of stable proteins using sequence-only models》。\n主要作者包括：Jedediah M. Singer, Scott Novotney, Devin Strickland 等。\n发布时间：2021 年 3 月\n链接：https:\u002F\u002Fwww.biorxiv.org\u002Fcontent\u002F10.1101\u002F2021.03.12.435185v1","https:\u002F\u002Fgithub.com\u002Fyangkky\u002FMachine-learning-for-proteins\u002Fissues\u002F191",{"id":127,"question_zh":128,"answer_zh":129,"source_url":130},24702,"有哪些关于蛋白质序列对抗对比预训练的研究？","可以参考论文：《Adversarial Contrastive Pre-training for Protein Sequences》。\n作者：Matthew B. A. McDermott, Brendan Yap, Harry Hsu, Di Jin, Peter Szolovits\n来源：arXiv:2102.00466 [cs], 2021 年 1 月\n链接：http:\u002F\u002Farxiv.org\u002Fabs\u002F2102.00466","https:\u002F\u002Fgithub.com\u002Fyangkky\u002FMachine-learning-for-proteins\u002Fissues\u002F190",{"id":132,"question_zh":133,"answer_zh":134,"source_url":135},24703,"如何通过数据增强提高蛋白质序列模型的泛化能力？","推荐阅读论文：《Improving Generalizability of Protein Sequence Models with Data Augmentations》。\n作者：Hongyu Shen, Layne C. Price, Taha Bahadori, Franziska Seeger\n发布时间：2021 年 2 月\n链接：https:\u002F\u002Fwww.biorxiv.org\u002Fcontent\u002F10.1101\u002F2021.02.18.431877v1","https:\u002F\u002Fgithub.com\u002Fyangkky\u002FMachine-learning-for-proteins\u002Fissues\u002F193",[]]