awesome-deep-learning-single-cell-papers
awesome-deep-learning-single-cell-papers 是一个专注于单细胞分析与深度学习交叉领域的开源论文合集。它系统地收集并分类了该方向的前沿学术成果,旨在帮助科研人员快速追踪最新的技术动态。
在单细胞测序数据爆炸式增长的背景下,如何利用深度学习高效处理高维、稀疏且复杂的生物数据成为一大挑战。这份资源库通过将海量文献按任务类型精细划分——涵盖从基础的细胞聚类、批次效应校正,到前沿的多模态整合、空间转录组分析、药物反应预测及基础模型构建等二十多个细分领域,有效解决了研究者“找文献难、分类乱”的痛点。此外,它还收录了相关书籍、课程资源以及基准测试工具,形成了完整的知识生态。
该资源特别适合生物信息学研究人员、计算生物学家以及从事医疗 AI 开发的工程师使用。无论是刚入门的学生希望系统了解领域全貌,还是资深专家需要调研特定方向的最新进展,都能从中获得极大便利。其独特的亮点在于不仅关注算法本身,还深入涵盖了可解释性、数据模拟及亚细胞分析等深层议题,并关联了专门的单细胞基础模型论文库,为推动生命科学领域的智能化研究提供了坚实的文献基石。
使用场景
某生物信息学博士正在开展一项关于肿瘤微环境中细胞通讯机制的研究,急需寻找最新的深度学习模型来整合单细胞转录组与空间转录组数据。
没有 awesome-deep-learning-single-cell-papers 时
- 文献检索如大海捞针:需要在 PubMed、arXiv 和 Google Scholar 上手动组合"single-cell"、"deep learning"、"spatial"等关键词,耗时数天仍难以覆盖最新预印本。
- 技术分类混乱难辨:找到的论文混杂了聚类、插补、批效应校正等不同任务,难以快速筛选出专门针对“细胞间通讯”或“多模态整合”的特定算法。
- 复现资源缺失:许多论文摘要未直接提供代码链接或基准测试对比,导致评估模型可用性和复现难度极高,容易选错工具浪费实验时间。
- 领域前沿脱节:难以系统性追踪从传统 CNN/RNN 到最新 Foundation Model(基础模型)的技术演进,可能还在使用已过时的方法处理数据。
使用 awesome-deep-learning-single-cell-papers 后
- 一站式精准获取:直接查阅"Cell-Cell Communication Events"和"Spatialtemporal Transcriptomic"分类章节,几分钟内即可锁定 2024 年最新的几篇核心论文及对应代码库。
- 任务导向清晰导航:利用仓库细致的任务分类(如 Multimodal Integration、Imputation),迅速排除无关干扰,专注于解决肿瘤微环境特有的数据稀疏与空间定位问题。
- 资源链路完整:每个条目均关联原始论文、代码实现甚至相关综述,快速确认模型是否经过 Benchmarking 验证,大幅降低试错成本。
- 紧跟技术浪潮:通过"Pretrained Model or LLM"等板块,及时了解到将大语言模型迁移至单细胞分析的最新范式,为研究引入更先进的特征提取策略。
awesome-deep-learning-single-cell-papers 将原本数周的文献调研工作压缩至数小时,让研究人员能从繁琐的信息搜集中解放出来,全身心投入到算法优化与生物学发现中。
运行环境要求
未说明
未说明

快速开始
awesome-deep-learning-single-cell-papers
本仓库追踪使用深度学习方法进行单细胞分析的最新论文,并按具体任务对其进行分类。
我们将尽力保持此列表的更新。如果您发现任何错误或遗漏的论文,请随时提交 issue 或 pull request。
引用
欢迎引用我们在单细胞分析中关于深度学习的综合综述论文:
@article{molho2024deep,
title={Deep learning in single-cell analysis},
author={Molho, Dylan and Ding, Jiayuan and Tang, Wenzhuo and Li, Zhaoheng and Wen, Hongzhi and Wang, Yixin and Venegas, Julian and Jin, Wei and Liu, Renming and Su, Runze and others},
journal={ACM Transactions on Intelligent Systems and Technology},
volume={15},
number={3},
pages={1--62},
year={2024},
publisher={ACM New York, NY}
}
关于单细胞基础模型,更多论文记录在[这里]。
- 书籍
- 单细胞技术
- 课程
- 综述
- 预训练模型、大语言模型或基础模型
- GAN或扩散模型
- 多模态学习
- 单细胞数据模拟
- 可解释性
- 时空转录组学
- RNA速度
- 分子表示学习
- 单细胞扰动或药物反应
- 细胞动力学
- 单细胞应用
- 单细胞或空间数据分析工具
- 单细胞图谱
- 单细胞可视化
- 基准测试
- 指标设计
- 亚细胞分析
- 降维与可视化
- 表示学习
- 批次效应校正
- 肿瘤微环境-TME
- 细胞间通讯事件
- 基因调控网络
- 插补
- 空间领域
- 参考嵌入或迁移学习
- 细胞分割
- 细胞类型去卷积
- 细胞类型注释
- 细胞聚类
- 疾病预测
- 多模态整合
- 多组学翻译
书籍
- [单细胞最佳实践], Fabian Theis 实验室
- [基于 Bioconductor 的单细胞分析基础], 基于 R 语言的 Bioconductor 软件
单细胞技术
单模态
多模态
空间转录组学
- [2022 年《自然方法》] 空间转录组学博物馆 [论文]
课程
- [CSCI 1850 基因组学中的深度学习], 布朗大学
- [基因组学中的机器学习:解析人类疾病回路], 麻省理工学院
- [单细胞 RNA 测序数据分析], 由 Orr Ashenberg、Dana Silverbush 和 Kirk Gosik 主讲的课程
- [单细胞 RNA 测序数据分析,www.singlecellcourse.org] - 逐步讲解的 scRNA-seq 分析课程。基于 R 语言,包含代码示例、解释和练习。从比对(STAR)和质量控制(FASTQC)开始,到 R 语言入门、SingleCellExperiment 类、
scater对象、数据探索(reads、UMI)、过滤、归一化(scran)、去除批次效应(RUV、ComBat、mnnCorrect、GLM、Harmony)、聚类和标记基因鉴定(SINCERA、SC3、tSNE、Seurat)、特征选择(M3Drop::M3DropConvertData、BrenneckeGetVariableGenes)、伪时间分析(TSCAN、Monocle、扩散图、SLICER、Ouija、destiny)、插补(scImpute、DrImpute、MAGIC)、差异表达(Kolmogorov-Smirnov、Wilcoxon、edgeR、Monocle、MAST)、数据整合(scmap、细胞到细胞映射、Metaneighbour、mnnCorrect、Seurat的典型相关分析)。搜索 scRNA-seq 数据(R 包scfind),以及 Hemberg 团队的公开数据集(https://hemberg-lab.github.io/scRNA.seq.datasets/)。[Seurat 章节](https://scrnaseq-course.cog.sanger.ac.uk/website/seurat-chapter.html)。["理想" scRNA-seq 流程](https://scrnaseq-course.cog.sanger.ac.uk/website/ideal-scrnaseq-pipeline-as-of-oct-2017.html)。[视频讲座](https://www.youtube.com/watch?list=PLEyKDyF1qdOYAhwU71qlrOXYsYHtyIu8n&v=56n77bpjiKo)。论文
Andrews, Tallulah S., Vladimir Yu Kiselev, Davis McCarthy 和 Martin Hemberg. "教程:单细胞 RNA 测序数据计算分析指南." https://doi.org/10.1038/s41596-020-00409-w 《Nature Protocols》,2020 年 12 月 7 日。
综述
- [2023 年《生物物理评论》] 空间转录组学中的深度学习:从下一代测序中学习 [论文]
预训练模型或大语言模型或基础模型
更多详情请参阅 [foundation-model-single-cell-papers]
- [2024 BioRxiv] scPRINT:在5000万个细胞上进行预训练,实现稳健的基因网络预测 [论文]
- [2024 ICLR] BioBridge:通过知识图谱连接生物医学基础模型 [论文]
- [2023 bioRxiv] CellPLM:超越单细胞的细胞语言模型预训练 [论文]
- [2023 bioRxiv] DNABERT-2:高效的基础模型及多物种基因组基准测试 [论文]
- [2023 bioRxiv] 大型语言模型对科学发现的影响:基于GPT-4的初步研究 [论文]
- [2023 bioRxiv] 用化学工具增强大型语言模型 [论文]
- [2023 bioRxiv] GET:跨人类细胞类型的转录基础模型 [论文]
- [2023 bioRxiv] Cell2Sentence:向大型语言模型教授生物学语言 [论文]
- [2023 bioRxiv] 评估大型语言模型在单细胞数据分析中的效用 [论文]
- [2023 arxiv] 迈向通用生物医学人工智能 [论文]
- [2023 bioRxiv] 利用蛋白质网络和单细胞数据上的深度学习对蛋白质表示进行上下文化处理 [论文]
- [2023 Nature] 大型语言模型编码临床知识 [论文]
- [2023 Nature Methods] 迈向生物图像分割的基础模型 [论文]
- [2023 bioRxiv] DrugGPT:基于GPT的设计策略,用于开发靶向特定蛋白质的潜在配体 [论文]
- [2023 arxiv] Hyena Hierarchy:迈向更大规模的卷积语言模型 [论文]
- [2023 bioRxiv] 基于人群水平的单细胞数据整合,实现跨样本的多尺度分析 [论文]
- [2023 bioRxiv] 单细胞转录组学的大规模基础模型 [论文]
- [2023 Bioinformatics] 基于Transformer的语言模型在生物信息学中的应用:综述 [论文]
- [2023 Nature] 迁移学习赋能网络生物学预测 [论文]
- [2023 arxiv] BiomedGPT:面向视觉、语言和多模态任务的统一且通用的生物医学生成式预训练Transformer [论文]
- [2023 arxiv] Clinical Camel:一款开源的专家级医学语言模型,采用对话式知识编码 [论文]
- [2023 arxiv] CancerGPT:利用大型预训练语言模型进行少样本药物组合协同效应预测 [论文]
- [2023 iSchience tGPT] 从大规模转录组数据中进行生成式预训练,以解析单细胞数据 [论文]
- [2023 bioRxiv] GeneGPT:通过领域工具增强大型语言模型,以提升生物医学信息的可访问性 [论文]
- [2023 Github] OpenBioMed [Github]
- [2023 blog] BioMedLM:一款针对生物医学文本的领域专用大型语言模型 [博客]
- [2023 bioRxiv] scGPT:利用生成式AI构建单细胞多组学基础模型的探索 [论文]
- [2023 bioRxiv] xTrimoGene:一种高效且可扩展的单细胞RNA测序数据表征学习器 [论文]
- [2023 Nature Biotechnology] 大型语言模型可生成跨不同家族的功能性蛋白质序列 [论文]
- [2022 arxiv] 一款单细胞基因表达语言模型 [论文]
- [2022 Briefings in Bioinformatics] BioGPT:用于生物医学文本生成与挖掘的生成式预训练Transformer [论文]
- [2022 Nature Machine Intelligence] scBERT作为大规模预训练的深度语言模型,用于单细胞RNA测序数据的细胞类型注释 [论文]
- [2022 bioRxiv] scFormer:一种基于Transformer的单细胞数据通用表征学习方法 [论文]
- [2022 Bioinformatics] scPretrain:用于细胞类型分类的多任务自监督学习 [论文]
- [2021 PNAS] 通过将无监督学习扩展到2.5亿条蛋白质序列,揭示生物结构与功能 [论文]
- [2021 Bioinformatics] DNABERT:面向基因组DNA语言的预训练双向编码器表示Transformer模型 [论文]
- [2021 Arxiv,576次引用] 面向生物医学自然语言处理的领域专用语言模型预训练 [论文]
- [2021 Arxiv,1111次引用] 不要停止预训练:将语言模型适配到特定领域和任务 [论文]
GAN 或扩散模型
- [2024 Brief Bioinform] stDiff:一种通过单细胞转录组数据推断空间转录组的扩散模型 [论文]
- [2024 biorxiv] scDiffEq:基于神经随机微分方程的单细胞动力学漂移-扩散建模 [论文]
- [2024 biorxiv] scDiffusion:利用扩散模型条件生成高质量单细胞数据 [论文]
- [2024 biorxiv] 使用扩散模型在体外生成基因表达谱 [论文]
- [2024 Cell] 用于时空细胞信号通路设计的可编程反应-扩散系统 [论文]
- [2023 ICCV] 基于 Transformer 的可扩展扩散模型 [论文]
- [2023 biorxiv] 从噪声到知识:基于概率扩散的基因调控网络神经推理 [论文]
- [2023 biorxiv Diffusion] 通过条件扩散生成模型构建通用单细胞分析框架 [论文]
- [2023 biorxiv GAN] 利用生成式建模预测细胞对扰动的形态学响应 [论文]
- [2023 Nature Diffusion Model] AI 工具正在设计全新的蛋白质,或将变革医学 [论文]
- [2023 biorxiv Diffusion Model] 双剑合璧:将深度扩散模型与变分自编码器整合用于单细胞转录组分析 [论文]
- [2023 biorxiv GAN] 利用生成对抗网络实现多组学单细胞数据的可扩展整合 [论文]
- [2023 biorxiv Diffusion Model] 利用扩散模型在重叠细胞实例分割中自发打破对称性 [论文]
多模态学习
- [2024 ICLR workshop NLP+Gene Expression] 转录组与文本的联合嵌入实现了通过自然语言交互式探索单细胞 RNA-seq 数据 [论文]
- [2024 Nature Biotechnology Image+Gene Expression] 通过整合空间转录组与组织学推断超分辨率组织结构 [论文]
- [2023 arxiv Image+Gene Expression] 融合卷积与图节点共嵌入的 Transformer:一种准确且可解释的视觉骨干网络,用于根据局部病理图像预测基因表达 [论文]
- [2023 arxiv multimodal] MuSe-GNN:从多模态生物图数据中学习统一的基因表示 [论文]
- [2023 biorxiv multimodal] Pathformer:一种受生物通路启发、整合癌症多模态数据的 Transformer 模型 [论文]
- [2023 biorxiv Image+Gene Expression] 基于双模态对比学习,从 H&E 组织学图像预测空间分辨的基因表达 [论文]
- [2023 biorxiv Image+Gene Expression] 基于空间转录组学,利用 H&E 图像预测单细胞基因表达 [论文]
单细胞数据模拟
- [2025 NM] scMultiSim:由基因调控网络和细胞间相互作用引导的单细胞多组学及空间数据模拟 [论文]
- [2023 NBT] scDesign3 生成用于多模态单细胞和空间组学的真实感体外数据 [论文]
- [2023 NC] scReadSim:一款单细胞 RNA-seq 和 ATAC-seq 测序数据模拟器 [论文]
- [2023 biorxiv] GRouNdGAN:基于因果生成对抗网络的 GRN 引导型单细胞 RNA-seq 数据模拟 [论文]
- [2022 JCB] scDesign2 可模拟保留基因相关性的单细胞基因表达计数数据 [论文]
- [2021 GB] scDesign2:一款透明的模拟器,可生成高保真度的单细胞基因表达计数数据,并捕捉基因相关性 [论文]
- [2019 Bioinformatics] 用于理性 scRNA-seq 实验设计的统计模拟器 scDesign [论文]
可解释性
- [2021 CVPR] 超越注意力可视化之外的 Transformer 可解释性 [论文][github]
- [2021 ICML] BERTology 遇上生物学:解读蛋白质语言模型中的注意力机制 [论文]
- [2019 ACL] Transformer 模型中注意力机制的多尺度可视化 [论文] [github]
空间-时间转录组学
- [2024 biorxiv] 基于最优传输度量的单细胞数据基因轨迹推断 [论文]
- [2023 biorxiv] 利用深度学习揭示发育时间和节奏 [论文]
- [2023 biorxiv] scNODE:用于时间序列单细胞转录组数据预测的生成模型 [论文]
- [2023 biorxiv] 基于最优传输度量的单细胞数据基因轨迹推断 [论文]
- [2023 arxiv CS领域综述] 时间序列与时空数据的大规模模型:综述与展望 [论文]
- [2023 ICML CS领域参考文献] 连续时空Transformer [论文]
- [2023 arxiv CS领域多模态参考文献] IMAGEBIND:一个嵌入空间,连接所有模态 [论文]
- [2023 arxiv CS领域多模态参考文献] UnIVAL:面向图像、视频、音频和语言任务的统一模型 [论文]
- [2023 arxiv CS领域多模态参考文献] Meta-Transformer:多模态学习的统一框架 [Meta-Transformer论文][viT视觉Transformer论文][ImageGPT论文:基于像素的生成式预训练]
- [2023 KDD CS领域参考文献] 时空扩散点过程 [论文]
- [2023 arxiv CS领域参考文献] 用于动态时空预测的长距离Transformer [论文]
- [2023 Nature Communications] 使用PRESCIENT对单细胞时间序列进行生成建模,可实现干预下的细胞轨迹预测 [论文]
- [2023 bioRxiv] 通过moscot在时间和空间中映射细胞 [论文]
- [2023 Nature Methods] 时空分辨转录组学揭示亚细胞RNA动力学景观 [论文]
- [2022 bioRxiv] Spateo:单细胞空间转录组学的多维时空建模 [论文]
- [2022 ICLR CS领域参考文献] UniFormer:用于高效时空表征学习的统一Transformer [论文]
- [2022 NeurIPS 从时空单细胞到时空视频] Flamingo:一种用于少样本学习的视觉语言模型 [论文]
- [2022 arxiv,图像-基因表达对比学习] CoCa:对比描述符是图文基础模型 [论文]
- [2020 ICLR,图像-基因表达预训练] VL-BERT:通用视觉-语言表征的预训练 [论文]
- [2019 AAAI,图像-基因表达预训练] Unicoder-VL:通过跨模态预训练构建的视觉与语言通用编码器 [论文]
RNA速度
- [2023 Nature Methods] 深度生成建模转录动力学,用于单细胞RNA速度分析 [论文]
分子表征学习
- [2023 ICLR] Uni-Mol:通用三维分子表征学习框架 [论文]
单细胞扰动或药物反应
- [2024 NeurIPS AIDrugX (Spotlight)] 细胞中的信号:用于治疗学的多模态与情境化机器学习基础 [论文] [海报]
- [2024 biorxiv] 基于深度学习的基因扰动效应预测尚未优于简单的线性方法 [论文]
- [2024 ICLR] 在序数型扰动下用于转录组数据的带监督生物可解释变分自编码器 [论文]
- [2024 Nature Methods] scPerturb:统一的单细胞扰动数据集 [论文]
- [2023 biorxiv] Unagi:用于解析复杂疾病中细胞动态及计算机辅助药物发现的深度生成模型 [论文]
- [2023 NeurIPS] 使用稀疏加性机制转移变分自编码器建模细胞扰动 [论文]
- [2023 Nature Methods] 利用神经最优传输学习单细胞扰动响应 [论文]
- [2023 Nature Methods] 神经最优传输可在单细胞水平上预测扰动响应 [论文]
- [2023 Mol Syst Biol] 预测高通量筛选中细胞对复杂扰动的响应 [论文]
- [2023 biorxiv] 学习扰动特异性细胞表征以预测跨细胞环境的转录响应 [论文]
- [2023 Nature] 通过网络推断和计算机模拟基因扰动解构细胞身份 [论文]
- [2023 biorxiv扩散模型] 二者的力量:整合深度扩散模型与变分自编码器用于单细胞转录组分析 [论文]
- [2023 ICLR] 利用变分因果推断与精细化关系信息预测细胞响应 [论文]
- [2022 arxiv] PerturbNet可预测未见化学及遗传扰动下的单细胞响应 [论文]
- [2022 arxiv] CausalBench:基于单细胞扰动数据的大型网络推断基准测试 [论文]
- [2022 NeurIPS] 在单细胞分辨率下预测细胞对新型药物扰动的响应 [论文]
- [2022 biorxiv] GEARS:预测新型多基因扰动的转录结果 [论文]
- [2021 biorxiv] 学习高通量筛选中复杂扰动的可解释细胞响应 [论文]
- [2019 Nature Methods] scGen可预测单细胞扰动响应 [论文]
细胞动力学
- [2023 Genome Biology] scTour:一种用于稳健推断和精确预测细胞动力学的深度学习架构 [论文]
单细胞应用
- [2023 medrxiv] 人类组织的单细胞RNA测序支持成功药物靶点的确定 [论文]
- [2023 Nature Methods] 机器学习在罕见病中的应用 [论文]
- [2023 Molecular System Biology] 单细胞生物学:未来会怎样? [论文]
- [2023 Genes] 组学时代下的单细胞分析:技术与癌症领域的应用 [论文]
- [2023 Nature Communications] ASGARD是一个单细胞引导的流程,用于辅助药物再定位 [论文]
- [2023 Nature Reviews Clinical Oncology] 通过使用多维组学数据推进CAR T细胞疗法 [论文]
单细胞或空间数据分析工具
- [2024 biorxiv] Scvi-hub:一个面向模型驱动的单细胞分析的实用资源库 [论文]
- [2024 Nature Methods] SpatialData:一个开放且通用的空间组学数据框架 [论文]
- [2023 Nucleic Acids Research] DeepBIO:一个自动化且可解释的深度学习平台,用于高通量生物序列预测、功能注释和可视化分析 [论文]
- [2023 Github] SpatialTis:一个超快速的空间分析工具包,适用于大规模空间单细胞数据。 [github]
- [2023 biorxiv] CellContrast:通过深度对比学习重构单细胞RNA测序数据中的空间关系 [论文]
单细胞图谱
- [2023年《自然》] 小鼠全脑细胞类型的高分辨率转录组与空间图谱 [论文]
- [2023年《自然》] 成人人类乳腺的空间分辨单细胞基因组图谱 [论文]
- [2023年《自然医学》] 健康与疾病状态下肺部的整合细胞图谱 [论文]
- [2022年《核酸研究》] Aquila:一个空间组学数据库及分析平台 [论文]
- [Cellxgene数据集:截至2022年共546个数据集]
- [2022年《自然方法》] 单细胞基因组学中图谱级别数据整合的基准测试 [论文]
- [2022年bioRxiv] 对图谱级单细胞数据的统一分析 [论文]
- [2022年《自然生物技术》] 空间与单细胞转录组数据的整合揭示小鼠器官发生过程 [论文]
- [2022年bioRxiv] 利用SageNet对解离后的单细胞数据进行有监督的空间推断 [论文]
- [2022年《自然通讯》] 通过将异质性数据集投影到共同的细胞嵌入空间实现在线单细胞数据整合 [论文]
单细胞可视化工具
- [Chan Zuckerberg:单细胞转录组学数据的交互式探索工具]
- [UCSC细胞浏览器]
- [Cytoscape]
- [UCSC Xena]
- [ASAP:自动化单细胞分析流程]
- [GenePattern]
- [Loopy Browser]
基准测试
- [2024 MoML@Mila] **** [CMT投稿] [预印本] [海报] [会议]
- [2023 biorxiv] 基于组织学的空间基因表达预测的转化潜力基准测试 [论文]
- [2023 bioRxiv] FFPE组织中成像空间转录组学平台的系统性基准测试 [论文]
- [2023 bioRxiv] 跨单细胞RNA和ATAC数据的多组学整合算法基准测试 [论文]
- [2023 bioRxiv] BEND:在生物学相关任务上对DNA语言模型的基准测试 [论文]
- [2023 Genome Biology] 用于未配对和配对单细胞RNA-seq及ATAC-seq数据联合整合的算法基准测试 [论文]
- [2023 Nature Communications] 针对空间转录组学细胞去卷积的全面基准测试及实用指南 [论文]
- [2023 bioRxiv] 单细胞基因组数据的通用预处理 [论文]
- [2023 Genome Biology] (单细胞方法)基准测试的元分析揭示了扩展性和互操作性的需求 [论文]
- [2023 Nature Communications] 针对空间转录组学细胞去卷积的全面基准测试及实用指南 [论文]
- [2023 bioRxiv] 用于填补单细胞RNA测序数据的自编码器设计基准测试 [论文]
- [2023 bioRxiv] 单细胞ATAC-seq数据的基因集评分算法基准测试 [论文]
- [2022 Nature Communications] 从单细胞RNA-Seq数据推断细胞间通讯的方法与资源比较 [论文]
- [2022 Nature Methods] 单细胞基因组学中图谱级别数据整合的基准测试 [论文]
- [2022 Nature Methods] 用于转录本分布预测和细胞类型去卷积的空间与单细胞转录组学整合方法基准测试 [论文]
- [2022 BioRxiv] 用于单细胞ATAC-seq数据的自动化细胞类型注释工具基准测试 [论文]
- [2022 Briefings in Bioinformatics] 从多受试者单细胞RNA-Seq数据中检测不同条件下差异状态的方法基准测试 [论文]
- [2022 Nucleic Acids Research] scIMC:一个用于基准测试、比较和可视化分析单细胞RNA-Seq数据填补方法的平台 [论文]
- [2021 Frontiers in Genetics] 评估单细胞基因调控网络推断算法的可重复性 [论文]
- [2021 Nature Communications] 单细胞RNA测序数据模拟方法的基准研究 [论文]
- [2021 Genome Biology] 基于UMI的单细胞RNA-Seq预处理流程基准测试 [论文]
- [2020 Nature Methods] 从单细胞转录组数据推断基因调控网络的算法基准测试 [论文]
- [2020 Genome Biology] 单细胞RNA测序数据批次效应校正方法的基准测试 [论文]
- [2020 Nature Biotechnology] 使用参考样本对单细胞RNA测序技术进行多中心基准测试 [论文]
- [2019 Nature Methods] 利用混合对照实验对单细胞RNA测序分析流程进行基准测试 [论文]
指标设计
- [2019 Narure Methods] 用于评估单细胞RNA-Seq批次校正效果的测试指标 [论文]
细胞亚结构分析
- [2024年《自然·通讯》] BIDCell:基于生物学信息的自监督学习方法,用于细胞亚结构空间转录组数据的分割 [论文]
- [2023年《自然·方法》] 时空解析转录组学揭示了细胞亚结构RNA动力学图谱 [论文]
- [2023年bioRxiv] Bering:利用迁移图嵌入进行空间转录组学的联合细胞分割与注释 [论文]
- [2023年《生物信息学》] FISHFactor:一种用于亚细胞分辨率空间转录组数据的概率因子模型 [论文]
- [2023年《科学》] 分子分辨率下的空间分辨单细胞翻译组学 [论文]
- [2023年《自然·方法》] 细胞亚结构组学:推动分辨率、复杂性和通量极限的新前沿 [论文]
- [2022年bioRxiv] Bento:用于空间转录组数据分析的细胞亚结构工具包 [论文]
- [2022年bioRxiv] 单细胞中的细胞亚结构空间解析基因邻域网络 [论文]
- [2022年bioRxiv] 统计分析支持普遍存在的RNA亚细胞定位及替代性3’ UTR调控 [论文]
- [2019年《细胞》] APEX-Seq揭示的细胞亚结构RNA定位图谱 [论文]
降维与可视化
- [2023年《基因组研究》] 深度双曲流形学习揭示单细胞基因组数据中的复杂层次结构 [论文]
- [2021年《自然·通讯》] 单细胞RNA测序谱在超球面和双曲空间上的深度生成模型嵌入 [论文]
- [2018年《自然·通讯》] 利用深度生成模型对单细胞转录组数据进行可解释的降维 [论文]
表征学习
- [2025年arXiv] SUICA:为空间转录组学学习超高维稀疏隐式神经表征 [论文]
- [2023年《自然·机器智能》] 可复用性报告:利用Transformer模型学习单细胞RNA测序数据中的转录语法 [论文]
- [2023年《基因组生物学》] 校正基于梯度的深度神经网络在基因组学中的解释 [论文]
- [2023年《自然·方法》] SIMBA:结合特征的单细胞嵌入 [论文]
- [2023年bioRxiv] 迈向通用细胞嵌入:利用SATURN整合跨物种单细胞RNA测序数据集 [论文]
- [2021年《系统生物学当前观点》] 单细胞生物学中的图表示学习 [论文]
- [2020年《自然·通讯》] 利用生成对抗网络实现单细胞RNA测序数据的真实感仿真生成与增强 [论文]
- [2019年《自然·方法》] 利用迁移学习进行单细胞转录组数据去噪 [论文]
- [2018年《自然·方法》] 面向单细胞转录组学的深度生成建模 [论文]
批次效应校正
- [2023年《生物信息学》] CLAIRE:基于对比学习的批次校正框架,可在批次混合与细胞异质性保持之间取得更好平衡 [论文]
- [2020年《基因组生物学》] 单细胞RNA测序数据批次效应校正方法的基准评估 [论文]
- [2020年《自然·生物技术》] 使用参考样本对单细胞RNA测序技术进行多中心基准测试的研究 [论文]
- [2019年《自然·方法》,Harmony] 利用Harmony快速、灵敏且准确地整合单细胞数据 [论文]
- [2018年《自然·生物技术》,CCA] 跨条件、技术和物种整合单细胞转录组数据 [论文]
- [2018年《自然·生物技术》,互近邻法] 通过匹配互近邻校正单细胞RNA测序数据中的批次效应 [论文]
- [2018年《自然·方法》] 用于评估单细胞RNA测序批次效应校正效果的测试指标 [论文]
- [2017年《自然·生物技术》] 利用天然遗传变异进行多重液滴单细胞RNA测序 [论文]
肿瘤微环境-TME
- [2023年bioRxiv] 健康与炎症组织中的空间共现识别(ISCHIA) [论文]
- [2023年bioRxiv] 从血液免疫单细胞转录组数据预测头颈部癌症患者的肿瘤免疫微环境及检查点治疗反应 [论文]
- [2022年《自然·生物医学工程》] 利用图深度学习,基于组织样本中的空间蛋白质谱表征肿瘤微环境 [论文]
- [2022年《自然·通讯》] SOTIP是一种利用空间组学数据进行微环境建模的多功能方法 [论文]
细胞间通讯事件
- [2024年《Nature Methods》] 基于细胞表型的组织细胞微环境无监督与有监督发现 [论文]
- [2024年《Nature Reviews Genetics》] 研究细胞—细胞相互作用与通讯方法的多样化 [论文]
- [2024年bioRxiv] 利用生物启发图学习对空间图谱中的细胞微环境进行大规模表征 [论文]
- [2024年Pac Symp Biocomput] PEPSI:基于空间蛋白质组学成像的极性测量提示免疫细胞参与 [论文]
- [2023年《Cell Systems》] 用于细胞间通讯的单细胞A/B测试 [论文]
- [2023年《Nature Biotechnology》] 在单细胞分辨率下推断细胞—细胞通讯 [论文]
- [2022年bioRxiv] scTensor从单细胞RNA测序数据中检测多对多的细胞—细胞相互作用 [论文]
- [2022年《Nature Biotechnology》] 利用细胞空间图建模组织中的细胞间通讯 [论文]
- [2022年bioRxiv] 通过空间转录组学的多视图图学习解码功能性细胞—细胞通讯事件 [论文]
- [2021年《Bioinformatics》] 在空间单细胞表达数据中识别信号基因 [论文]
- [2020年《Nature Methods》] NicheNet:通过将配体与靶基因关联来建模细胞间通讯 [论文]
- [2020年《Nature Communications》] 使用NATMI预测细胞间通讯网络 [论文]
- [2018年《Nature》] 人类早期母胎界面的单细胞重建 [论文]
基因调控网络
- [2023年arXiv] DynGFN:利用GFlowNets实现基因调控网络的贝叶斯推断 [论文]
- [2023年《Bioinformatics》] STGRNS:一种基于Transformer的可解释方法,用于从单细胞转录组数据推断基因调控网络 [论文]
- [2022年《Nature Machine Intelligence》] 基于图神经网络从单细胞ATAC-seq数据推断转录因子调控网络 [论文]
- [2022年《Nature Biotechnology》] 利用图嵌入整合多组学单细胞数据并进行调控推断 [论文]
- [2022年Biorxiv] scMEGA:基于增强子的单细胞多组学基因调控网络推断 [论文]
- [2022年《Bioinformatics》] 高性能大规模单细胞基因调控网络推断:Inferelator 3.0 [论文]
- [2022年《Briefings in Bioinformatic》] SIGNET:基于多层感知机Bagging的单细胞RNA-seq数据基因调控网络预测 [论文]
- [2020年《Nature Methods》] 单细胞转录组数据基因调控网络推断算法的基准测试 [论文]
- [2019年《Genome Biology》] 单细胞转录组学揭示基因调控网络的可塑性 [论文]
- [2017年《Cell Syst》] 利用多元信息度量从单细胞数据推断基因调控网络 [论文]
插补
- [2018年《Nature Communications》] 一种准确且鲁棒的单细胞RNA测序数据插补方法scImpute [论文]
- [2019年《Genome Biology》] DeepImpute:一种准确、快速且可扩展的深度神经网络方法,用于插补单细胞RNA测序数据 [论文]
- [2018年《Cell》] 利用数据扩散从单细胞数据中恢复基因互作 [论文]
- [2018年《Genome Biology》] VIPER:保留变异性的插补方法,用于在单细胞RNA测序研究中准确恢复基因表达 [论文]
- [2021年《PLOS Computational Biology》] G2S3:一种基于基因图的单细胞RNA测序数据插补方法 [论文]
- [2021年《Nature Communications》] scGNN是一种用于单细胞RNA测序分析的新颖图神经网络框架 [论文]
- [2021年《iScience》] 结合图卷积和自编码器神经网络对单细胞RNA测序数据进行插补 [论文]
- [2022年《PLOS ONE》] 针对稀疏scChIP-seq数据插补的单细胞特异性和可解释性机器学习模型 [论文]
空间域
- [2023年《自然·遗传学》] SPICEMIX实现细胞身份的整合单细胞空间建模 [论文]
- [2023年bioRxiv] CellCharter:一种可扩展的框架,用于绘制和比较跨多个样本及空间组学技术的细胞微环境 [预印本]
- [2022年《基因组研究》] 基于模型的约束深度学习聚类方法,用于解析空间分辨的单细胞数据 [论文]
- [2022年《自然·通讯·生物学》] 利用空间转录组学解析组织结构与功能 [综述论文]
- [2022年《基因组生物学》] 用于空间分辨转录组数据分析的统计与机器学习方法 [综述论文]
- [2022年《自然·通讯》] 利用自适应图注意力自动编码器从空间分辨转录组数据中解析空间区域 [论文]
- [2022年《自然·计算科学》] 基于图神经网络的空间转录组数据细胞聚类 [论文]
- [2022年《遗传学前沿》] 空间转录组数据的分析与可视化 [论文]
- [2021年《自然·方法》] SpaGCN:通过图卷积网络整合基因表达、空间位置和组织学信息,以识别空间区域及空间变异基因 [论文]
- [2021年《自然·生物技术》] 使用BayesSpace实现亚斑点分辨率的空间转录组学 [论文]
- [2021年bioRxiv] 无监督的空间嵌入式深度表征用于空间转录组学 [论文]
- [2021年《基因组生物学》] Giotto:用于整合分析和可视化空间表达数据的工具箱 [工具]
- [2021年bioRxiv] 利用深度学习从空间分辨转录组数据中定义并可视化人类组织的病理结构 [论文]
- [2020年bioRxiv] stLearn:整合空间位置、组织形态和基因表达,以在未解离组织中发现细胞类型、细胞间相互作用及空间轨迹 [论文]
- [2018年《自然·方法》] SpatialDE:空间变异基因的鉴定 [论文]
- [2018年《自然·生物技术》] 结合单细胞RNA测序和连续荧光原位杂交数据识别空间关联亚群 [论文]
- [2008年《统计力学杂志》] 大型网络中社区层次结构的快速展开 [论文]
参考嵌入或迁移学习
- [2019年《自然·方法》] 单细胞转录组学中的迁移学习去噪 [论文]
- [2018年《自然·方法》] 单细胞转录组学的深度生成建模 [论文]
- [2020年《生物信息学》] 利用迁移VAE对未配对数据进行条件性分布外生成 [论文]
- [2021年《自然·生物技术》] 通过迁移学习将单细胞数据映射到参考图谱 [论文]
- [2021年《分子系统生物学》] 利用深度生成模型对单细胞转录组数据进行概率性协调与注释 [论文]
- [2022年bioRxiv预印本] 基于生物学知识的深度学习,用于推断单细胞中的基因程序活性 [预印本]
细胞分割
- [2023 biorxiv] Bering:基于迁移图嵌入的空间转录组学联合细胞分割与注释 [论文]
- [2022 Cytometry A] MIRIAM:用于多维组织图像的机器学习和深度学习单细胞分割与定量分析流程 [论文][代码](MIRIAM)
- [2021 Nature Biotechnology] 基于成像的空间转录组学中的细胞分割 [论文]
- [2021 Biorxiv] Scellseg:一种具有预训练和对比度微调功能的风格感知细胞实例分割工具 [论文] [代码]
- [2021 Nature Biotechnology] 基于成像的空间转录组学中的细胞分割 [论文] [代码](Baysor)
- [2021 Nature Biotechnology] 利用大规模数据标注和深度学习实现人类水平性能的组织图像全细胞分割 [论文] [代码](Memser)
- [2021 Nature Methods] Cellpose:一种通用的细胞分割算法 [论文] [代码](Cellpose)
- [2021 Molecular Systems Biology]空间转录组学的联合细胞分割与细胞类型注释 [论文] [代码] (JSTA)
- [2020 Nature Communications]卷积神经网络以高精度分割酵母显微镜图像 [论文] [代码]
- [2020 Medical Image Analysis] DeepDistance:一种用于倒置显微镜图像中细胞检测的多任务深度回归模型 [论文] (DeepDistance)
- [2016 Computational Biology]深度学习自动化了活细胞成像实验中单个细胞的定量分析 [论文] [代码] (Deepcell)
细胞类型去卷积
- [2023 Genome Biology] Smoother:一种统一且模块化的框架,用于在空间组学数据中整合结构依赖性 [论文]
- [2023 BioRxiv] RETROFIT:空间转录组学中无参考的细胞类型混合物去卷积 [论文]
- [2023 BioRxiv] STdGCN:利用图卷积网络在空间转录组数据中进行精确的细胞类型去卷积 [论文]
- [2023 BioRxiv] Spotless:一个可重复的空间转录组学细胞类型去卷积基准测试流程 [论文]
- [2022 Nature Biotechnology] 使用CytoSPACE实现单细胞与空间转录组图谱的高分辨率对齐 [论文]
- [2022 Nature Communications] 无参考的多细胞像素分辨率空间解析转录组数据的细胞类型去卷积 [论文]
- [2022 Nature Biotechnology] DestVI识别空间转录组数据中的细胞类型连续体 [论文]
- [2022 Biorxiv] 采用无批次效应策略在空间转录组学中进行精确的细胞类型去卷积 [论文]
- [2022 Nature Biotechnology] 面向空间转录组学的空间信息引导的细胞类型去卷积 [论文]
- [2022 Nature Cancer] 通过BayesPrism进行细胞类型和基因表达去卷积,可在肿瘤学领域实现批量与单细胞RNA测序的贝叶斯整合分析 [论文]
- [2022 Nature Communications] 混合细胞去卷积技术的进步使得能够量化空间转录组数据中的细胞类型 [论文]
- [2022 Nature Biotechnology] Cell2location绘制空间转录组中的细粒度细胞类型图谱 [论文]
- [2021 Briefings in Bioinformatics] DSTG:通过基于图的人工智能对空间转录组数据进行去卷积 [论文]
- [2021 Genome Research] 利用单细胞参考对批量基因表达数据进行基于似然的去卷积 [论文]
- [2021 Genome Biology] SpatialDWLS:精确的空间转录组数据去卷积 [论文]
- [2021 Nucleic Acids Research] SPOTlight:基于种子的非负矩阵分解回归,用于将空间转录组斑点与单细胞转录组去卷积 [论文]
- [2021 Nature Biotechnology] 空间转录组中细胞类型混合物的稳健分解 [论文]
- [2019 Nature Communications] 从基因表达数据中准确估算细胞类型组成 [论文]
- [2019 Science] Slide-seq:一种可扩展的高空间分辨率全基因组表达测量技术 [论文]
细胞类型注释
- [2025 BioRxiv] 大型语言模型共识显著提升单细胞RNA测序数据的细胞类型注释准确度 [论文] [代码]
- [2023 biorxiv] 跨组织单细胞注释模型的扩展 [论文]
- [2023 Nature Methods] 基于分割引导对比学习的神经元网络多层图谱 [论文]
- [2023 Nature Methods] Cue:一种用于结构变异发现和基因分型的深度学习框架 [论文]
- [2023 Nature Communications] 用于一站式可解释细胞类型注释的Transformer模型 [论文]
- [2023 Nature Biotech] TACCO统一了单细胞和空间组学中的细胞身份注释转移与分解 [论文]
- [2022 Nature Method] 利用STELLAR对空间分辨单细胞数据进行注释 [论文] 注意:已注释参考细胞图 + 查询细胞图
- [2022 Brief Bioinform] scIAE:一种基于集成自编码器的单细胞RNA测序数据分类框架 [论文]
- [2022 Nature Communications] scGCN是一种用于单细胞组学知识迁移的图卷积网络算法 [论文]
- [2022 Science] 跨组织免疫细胞分析揭示人类组织特异性特征 [论文]
- [2022 Bioinformatics] CellMeSH:利用索引文献进行概率性细胞类型鉴定 [论文]
- [2022 Cancers] 用于基因表达建模的Transformer(T-GEM):一种基于基因表达的表型预测的可解释深度学习模型 [论文]
- [2021 Nucleic Acids Research] scDeepSort:一种基于加权图神经网络的深度学习预训练单细胞转录组细胞类型注释方法 [论文]
- [2021 BMC Bioinformatics] 使用图卷积网络进行单细胞分类 [论文]
- [2021 Genome Research] 半监督对抗神经网络用于单细胞分类 [论文]
- [2020 BMC Bioinformatics] EnClaSC:一种新颖的集成方法,用于准确且稳健的单细胞转录组细胞类型分类 [论文]
- [2020 Bioinformatics] ACTINN:单细胞RNA测序中细胞类型自动识别工具 [论文]
- [2020 Nature Communications] SciBet作为便携式快速单细胞类型鉴定工具 [论文]
- [2019 Nucleic Acids Research] SuperCT:一种用于增强单细胞转录组图谱特征化的监督学习框架 [论文]
- [2019 Nucleic Acids Research] CHETAH:一种选择性、层次化的单细胞RNA测序细胞类型鉴定方法 [论文]
- [2019 Bioinformatics] scMatch:一款利用参考数据集进行单细胞基因表达谱注释的工具 [论文]
- [2019 Cell Systems] SingleCellNet:一个跨平台、跨物种的单细胞RNA测序数据分类计算工具 [论文]
- [2019 Genome Biology] SingleCellNet:cPred:一种基于监督学习的单细胞RNA测序数据细胞类型分类精确方法 [论文]
细胞聚类
- [2023 Bioinformatics] scBGEDA:通过双去噪自编码器结合二部图集成聚类的深度单细胞聚类分析 [论文]
- [2023 bioRxiv] G3DC:一种基于基因—图引导的选择性深度聚类方法,用于单细胞RNA测序数据 [论文]
- [2022 BMC Bioinformatics] SC3s:将单细胞共识聚类高效扩展至数百万细胞 [论文]
- [2022 Bioinformatics] 基于图神经网络的嵌入用于scRNA-seq数据聚类 [论文]
- [2022 AAAI] 基于ZINB的图嵌入自编码器用于单细胞RNA测序数据解读 [论文]
- [2022 Briefings in Bioinformatics] 通过自编码器和图神经网络联合实现单细胞RNA测序数据的深度结构聚类 [论文]
- [2022 Bioinformatics] scGAC:一种用于聚类单细胞RNA测序数据的图注意力架构 [论文]
- [2022 Nature Computational Science] 利用图神经网络对空间转录组数据进行细胞聚类 [论文]
- [2021 Nature Communications] 基于模型的深度嵌入用于单细胞RNA测序数据的约束聚类分析 [论文]
- [2020 NAR Genomics and Bioinformatics] 针对单细胞RNA序列数据的自训练软K-means深度聚类 [论文]
- [2020 Nature Communications] 深度学习使单细胞RNA测序分析在去除批次效应的同时实现精准聚类 [论文][网站][github]
- [2019 Nature Machine Intelligence] 采用基于模型的深度学习方法对单细胞RNA测序数据进行聚类 [论文]
疾病预测
- [2024年《自然·生物技术》] 单细胞生物学能否实现精准医学的承诺? [论文]
- [2018年IJCAI] 基于关系网络与局部图卷积滤波的混合方法用于乳腺癌亚型分类 [论文]
- [2021年《NPJ数字医学》] DeePaN——一种整合临床基因组证据的深度患者图卷积网络,用于对受益于免疫治疗的肺癌进行分层 [论文]
- [2022年《Biocumputing》] CloudPred:从单细胞RNA测序数据中预测患者表型 [论文]
- [2022年CHIL '20:ACM健康、推理与学习会议论文集] 利用图注意力网络从单细胞数据中预测疾病状态 [论文]
多模态整合
- [2024年《自然·方法学》] 在单细胞分辨率下跨空间组学样本进行搜索与匹配 [论文]
- [2023年《自然·生物技术》] 利用弱关联特征实现跨模态的空间与单细胞数据整合 [论文]
- [2023年《自然·通讯》] scDREAMER:基于深度生成模型与对抗性分类器的配对方法,用于单细胞数据集的图谱级整合 [论文]
- [2023年bioRxiv] 自动化的单细胞组学端到端框架,具备数据驱动的批次推断功能 [论文]
- [2023年《自然·生物技术》] 多模态单细胞数据的整合 [论文]
- [2023年《自然·生物技术》] 利用弱关联特征实现跨模态的空间与单细胞数据整合 [论文]
- [2023年《Briefings in Bioinformatics》] 基于图卷积网络的单细胞多组学数据通用整合框架 [论文]
- [2022年PMLR] CVQVAE:一种基于表示学习的多组学单细胞数据整合方法 [论文]
- [2022年《自然·生物技术》] 利用图链接嵌入进行多组学单细胞数据整合及调控推断 [论文]
- [2022年《自然·通讯》] 使用多模态深度学习方法对单细胞多组学数据进行聚类 [综述]
- [2022年《Genome Biology》] 基于深度学习的多组学数据融合方法在癌症领域的基准研究 [综述]
- [2018年ICML] MAGAN:对生物流形进行对齐 [论文]
- [2019年《PLoS计算生物学》] 利用关联自组织映射从scATAC-seq和scRNA-seq数据构建基因调控网络 [论文]
- [2020年《Bioinformatics》] SCIM:针对未配对特征集的通用单细胞匹配方法 [论文]
- [2021年《Nature Communications》] 利用自编码器实现单细胞成像与测序数据之间的多领域转换 [论文]
- [2021年《PLoS计算生物学》] 通过图正则化张量补全法推算空间分辨转录组数据 [论文]
- [2021年《Genome Biology》] Cobolt:多模态单细胞测序数据的整合分析工具 [论文]
- [2021年《Cell Reports Methods》] 用于单细胞多组学数据综合分析的专家混合深度生成模型 [论文]
- [2021年《Briefings in Bioinformatics》] 单细胞转录组与开放染色质可及性数据的深度联合学习分析模型 [论文]
- [2021年《Bioinformatics》] 用于单细胞多组学数据联合分析的深度跨组学循环注意力模型 [论文]
- [2022年《自然·生物技术》] scJoint利用迁移学习整合图谱尺度的单细胞RNA-seq和ATAC-seq数据 [论文]
- [2022年《Bioinformatics》] SMILE:基于互信息学习的单细胞组学数据整合方法 [论文]
- [2022年SIGKDD] 用于多模态单细胞数据整合的图神经网络 [论文]
- [2022年《Genome Biology》] scDART:同时整合未配对的scRNA-seq和scATAC-seq数据并学习跨模态关系 [论文]
- [2019年bioRxiv] 单细胞中RNA表达与表面蛋白丰度的联合模型 [论文]
- [2021年bioRxiv] DeepMAPS:利用异构图Transformer进行单细胞生物网络推断 [论文]
- [2022年bioRxiv] 配对单细胞多组学数据之间的自适应机器翻译 [论文]
- [2022年bioRxiv] Multigrate:单细胞多组学数据整合工具 [论文]
- [2019年NeurIPS多组学多语言预训练] 跨语言语言模型预训练 [论文]
多组学跨模态转换
- [2024年《自然·通讯》] scButterfly:一种基于双对齐变分自编码器的通用单细胞跨模态转换方法 [论文]
- [2023年arXiv scHyena] scHyena:用于脑部全长单细胞RNA测序分析的基础模型 [论文]
- [2023年bioRxiv scTranslator] 一种用于将单细胞转录组数据翻译为蛋白质组数据的预训练大型语言模型 [论文]
- [2023年《先进科学》] 利用深度学习高效生成配对的单细胞多组学图谱 [论文]
- [2022年《细胞生物学杂志》] 基于半监督学习的多模态单细胞转换与对齐 [论文]
- [2022年《自然·机器智能》sciPENN] 一种多用途深度学习方法,用于CITE-seq和单细胞RNA测序数据的整合,并实现细胞表面蛋白的预测与填补 [论文]
- [2022年RECOMB] 使用Polarbear进行半监督单细胞跨模态转换 [论文]
- [2020年《美国国家科学院院刊》] BABEL实现单细胞分辨率下多组学图谱之间的跨模态转换 [论文]
相似工具推荐
ML-For-Beginners
ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程,旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周,包含 26 节精炼课程和 52 道配套测验,内容涵盖从基础概念到实际应用的完整流程,有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。 无论是希望转型的开发者、需要补充算法背景的研究人员,还是对人工智能充满好奇的普通爱好者,都能从中受益。课程不仅提供了清晰的理论讲解,还强调动手实践,让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持,通过自动化机制提供了包括简体中文在内的 50 多种语言版本,极大地降低了全球不同背景用户的学习门槛。此外,项目采用开源协作模式,社区活跃且内容持续更新,确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路,ML-For-Beginners 将是理想的起点。
funNLP
funNLP 是一个专为中文自然语言处理(NLP)打造的超级资源库,被誉为"NLP 民工的乐园”。它并非单一的软件工具,而是一个汇集了海量开源项目、数据集、预训练模型和实用代码的综合性平台。 面对中文 NLP 领域资源分散、入门门槛高以及特定场景数据匮乏的痛点,funNLP 提供了“一站式”解决方案。这里不仅涵盖了分词、命名实体识别、情感分析、文本摘要等基础任务的标准工具,还独特地收录了丰富的垂直领域资源,如法律、医疗、金融行业的专用词库与数据集,甚至包含古诗词生成、歌词创作等趣味应用。其核心亮点在于极高的全面性与实用性,从基础的字典词典到前沿的 BERT、GPT-2 模型代码,再到高质量的标注数据和竞赛方案,应有尽有。 无论是刚刚踏入 NLP 领域的学生、需要快速验证想法的算法工程师,还是从事人工智能研究的学者,都能在这里找到急需的“武器弹药”。对于开发者而言,它能大幅减少寻找数据和复现模型的时间;对于研究者,它提供了丰富的基准测试资源和前沿技术参考。funNLP 以开放共享的精神,极大地降低了中文自然语言处理的开发与研究成本,是中文 AI 社区不可或缺的宝藏仓库。
cs-video-courses
cs-video-courses 是一个精心整理的计算机科学视频课程清单,旨在为自学者提供系统化的学习路径。它汇集了全球知名高校(如加州大学伯克利分校、新南威尔士大学等)的完整课程录像,涵盖从编程基础、数据结构与算法,到操作系统、分布式系统、数据库等核心领域,并深入延伸至人工智能、机器学习、量子计算及区块链等前沿方向。 面对网络上零散且质量参差不齐的教学资源,cs-video-courses 解决了学习者难以找到成体系、高难度大学级别课程的痛点。该项目严格筛选内容,仅收录真正的大学层级课程,排除了碎片化的简短教程或商业广告,确保用户能接触到严谨的学术内容。 这份清单特别适合希望夯实计算机基础的开发者、需要补充特定领域知识的研究人员,以及渴望像在校生一样系统学习计算机科学的自学者。其独特的技术亮点在于分类极其详尽,不仅包含传统的软件工程与网络安全,还细分了生成式 AI、大语言模型、计算生物学等新兴学科,并直接链接至官方视频播放列表,让用户能一站式获取高质量的教育资源,免费享受世界顶尖大学的课堂体验。
ragflow
RAGFlow 是一款领先的开源检索增强生成(RAG)引擎,旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体(Agent)能力相结合,不仅支持从各类文档中高效提取知识,还能让模型基于这些知识进行逻辑推理和任务执行。 在大模型应用中,幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构(如表格、图表及混合排版),显著提升了信息检索的准确度,从而有效减少模型“胡编乱造”的现象,确保回答既有据可依又具备时效性。其内置的智能体机制更进一步,使系统不仅能回答问题,还能自主规划步骤解决复杂问题。 这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统,还是致力于探索大模型在垂直领域落地的创新者,都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口,既降低了非算法背景用户的上手门槛,也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目,它正成为连接通用大模型与行业专有知识之间的重要桥梁。
PaddleOCR
PaddleOCR 是一款基于百度飞桨框架开发的高性能开源光学字符识别工具包。它的核心能力是将图片、PDF 等文档中的文字提取出来,转换成计算机可读取的结构化数据,让机器真正“看懂”图文内容。 面对海量纸质或电子文档,PaddleOCR 解决了人工录入效率低、数字化成本高的问题。尤其在人工智能领域,它扮演着连接图像与大型语言模型(LLM)的桥梁角色,能将视觉信息直接转化为文本输入,助力智能问答、文档分析等应用场景落地。 PaddleOCR 适合开发者、算法研究人员以及有文档自动化需求的普通用户。其技术优势十分明显:不仅支持全球 100 多种语言的识别,还能在 Windows、Linux、macOS 等多个系统上运行,并灵活适配 CPU、GPU、NPU 等各类硬件。作为一个轻量级且社区活跃的开源项目,PaddleOCR 既能满足快速集成的需求,也能支撑前沿的视觉语言研究,是处理文字识别任务的理想选择。
awesome-machine-learning
awesome-machine-learning 是一份精心整理的机器学习资源清单,汇集了全球优秀的机器学习框架、库和软件工具。面对机器学习领域技术迭代快、资源分散且难以甄选的痛点,这份清单按编程语言(如 Python、C++、Go 等)和应用场景(如计算机视觉、自然语言处理、深度学习等)进行了系统化分类,帮助使用者快速定位高质量项目。 它特别适合开发者、数据科学家及研究人员使用。无论是初学者寻找入门库,还是资深工程师对比不同语言的技术选型,都能从中获得极具价值的参考。此外,清单还延伸提供了免费书籍、在线课程、行业会议、技术博客及线下聚会等丰富资源,构建了从学习到实践的全链路支持体系。 其独特亮点在于严格的维护标准:明确标记已停止维护或长期未更新的项目,确保推荐内容的时效性与可靠性。作为机器学习领域的“导航图”,awesome-machine-learning 以开源协作的方式持续更新,旨在降低技术探索门槛,让每一位从业者都能高效地站在巨人的肩膀上创新。