awesome-ai-for-science

1.4k 146 非常简单 1 次阅读今天MIT其他

AI 解读由 AI 自动生成，仅供参考

awesome-ai-for-science 是一个专为加速科学发现而打造的精选资源库，汇集了全球范围内优质的 AI 工具、代码库、学术论文、数据集及框架。它致力于解决科研人员在跨学科研究中面临的“资源分散”与“技术门槛”难题，将原本零散分布在物理、化学、生物、材料科学乃至天文学等领域的 AI 应用成果进行了系统化梳理。

无论是希望利用人工智能优化实验流程的科研人员，还是想要开发垂直领域应用的开发者，都能在这里找到得力助手。该资源库不仅涵盖了从文献管理、数据可视化到自动化科研工作流的全套工具链，还特别突出了"AI for Science"的前沿趋势，如科学基础模型、论文转代码复现以及自主研究智能体等独特技术方向。通过提供按学科分类的详细指南和经过验证的开源项目，awesome-ai-for-science 有效降低了科学家使用 AI 技术的门槛，促进了计算机科学与传统自然科学的深度融合，是推动现代科研范式变革的重要基础设施。

使用场景

某材料科学实验室的研究团队正致力于利用机器学习加速新型电池电解质的筛选，需要在海量文献中快速定位关键数据并复现前沿算法。

没有 awesome-ai-for-science 时

资源检索如大海捞针：研究人员需在 Google Scholar、arXiv 和各类垂直数据库间反复切换，耗时数周才能拼凑出完整的工具链清单，极易遗漏关键的开源库。
跨领域技术壁垒高：面对物理学或化学专用的 AI 框架（如科学机器学习库），缺乏针对性的入门指引和教育资源，导致非计算机背景的研究者难以上手。
复现成本高昂：找不到论文对应的代码实现或标准化数据集，团队不得不从零编写数据处理脚本，严重拖慢了从理论验证到实验测试的进度。
工作流割裂：文献管理、图表生成、知识提取等环节使用分散的工具，缺乏统一的“研究工作台”概念，协作效率低下且容易出错。

使用 awesome-ai-for-science 后

一站式精准导航：团队直接通过分类目录（如"⚗️ Chemistry & Materials"）快速锁定了适用的分子生成模型和专用数据集，将调研时间从数周压缩至几天。
降低跨界门槛：借助列表中整理的“教育资源”和“基础模型”，团队成员迅速掌握了领域特定的 AI 编程范式，实现了从传统模拟到 AI 驱动发现的平滑过渡。
加速算法落地：利用"Paper-to-Code"板块找到的高可复现代码库，团队直接复用了对应的预处理流程，将新电解质分子的筛选周期缩短了 60%。
构建自动化闭环：参考“研究智能体”和“工作流插件”推荐，搭建了从文献自动解析到实验数据可视化的自动化流水线，显著提升了团队协作的连贯性。

awesome-ai-for-science 不仅是一份资源清单，更是科研团队打破学科壁垒、将 AI 技术转化为实际科学发现加速器的核心枢纽。

运行环境要求

GPU

未说明

内存

未说明

依赖

notes该仓库是一个资源列表（Awesome List），汇集了用于科学发现的 AI 工具、库、论文和数据集，本身不是一个可直接运行的单一软件工具。因此没有统一的运行环境需求。具体的环境要求（如操作系统、GPU、Python 版本等）需参考列表中各个独立项目（如 MinerU, Paper2Poster, Nougat 等）的各自文档。

python未说明

快速开始

✨ 科学领域的超棒AI（AI4Science）✨

一份精心整理的清单，汇集了能够加速跨学科科学发现的优秀AI工具、库、论文、数据集和框架。

AI正彻底改变科学研究——从药物研发、材料设计到气候建模和天体物理学。本仓库收集了最优质的资源，帮助研究人员在其工作中充分利用AI。

📚 目录

🧪 研究用AI工具
📄 论文→海报/幻灯片/图文摘要
📊 图表理解与生成
🔄 论文转代码与可重复性
📋 科学文档处理与解析
🧰 研究工作台与插件
🕸 知识抽取与学术知识图谱
🤖 研究代理与自动化工作流
🏷 数据标注与整理
⚗ 科学机器学习
📖 论文与综述
🔬 领域特定应用
🤖 科学领域基础模型
📈 数据集与基准测试
💻 计算框架
🎓 教育资源
🏛 研究社区
📚 相关的Awesome列表

🧪 研究用AI工具

文献与知识管理

Semantic Scholar - 基于AI的学术搜索引擎（Allen AI）
arXiv - 开放获取的电子预印本和后印本库
OpenAlex - 学术论文和作者的开放目录
CORE - 开放获取研究论文聚合平台

数据分析与可视化

PandasAI - 使用自然语言进行对话式数据分析
DeepAnalyze - 首个用于自主数据科学的代理型大模型，提供从数据到分析师级报告的端到端流程
AutoViz - 自动化数据可视化，只需极少代码
Chat2Plot - 通过标准化图表规范实现安全的文本到可视化转换

数据标注与注释

Label Studio - 多类型数据标注与注释工具
Snorkel - 程序化数据标注与弱监督方法

研究工作台与插件

Claude Scientific Skills - 为Claude AI提供的全面集合，包含超过125个即用型科学技能模块，覆盖生物信息学、化学信息学、临床研究、机器学习和材料科学等领域

📄 论文→海报/幻灯片/图文摘要

海报生成

Paper2Poster - 采用解析器-规划器-绘图器架构的多智能体系统，可将paper.pdf转换为可编辑的poster.pptx，性能优于GPT-4o，且所需token数量减少87%
mPLUG-PaperOwl - 多模态大模型，用于科学图表和示意图的理解与生成

幻灯片与演示文稿生成

Auto-Slides - 多智能体学术论文到高质量演示文稿系统，支持交互式优化
PPTAgent - 不仅能将文本转化为幻灯片，还具备PPTEval多维度评估功能（EMNLP 2025）
paper2slides - 利用大模型将arXiv论文转化为Beamer幻灯片
PaperToSlides - 基于AI的工具，可自动将学术论文（PDF）转换为演示文稿幻灯片
pdf2slides - 仅需三行代码即可将PDF文件转换为可编辑的幻灯片
SlideDeck AI - 结合生成式AI，根据文档或主题共同创建PowerPoint演示文稿
AI多智能体演示文稿生成器 - Azure Semantic Kernel提供的多智能体PPT生成参考

视频与媒体生成

Paper2Video - 首个针对科学论文自动生成视频的基准测试（NeurIPS 2025）
paper2video - 将arXiv上的研究论文转化为引人入胜的演示文稿及适合YouTube发布的视频

网站与交互内容生成

Paper2All - 基于AI的工作流，将论文转化为交互式网站、海报和多媒体演示文稿，秉持“让您的论文鲜活起来”的理念。

图表与可视化生成

注：有关全面的图表理解与代码生成工具，请参阅📊 图表理解与生成章节

📊 图表理解与生成

图表转代码与可复现性

ChartCoder (ACL 2025) - 多模态大语言模型用于图表转代码，7B参数规模的模型性能超越更大规模的开源多模态大语言模型。
ChartAssistant / ChartAst (ACL 2024) - 通用图表理解和推理模型。
Chart-to-Text 数据集 - 大规模图表摘要数据集，用于训练图表描述能力。

科学可视化工具

Chat2Plot - 通过标准化图表规范实现安全的文本到可视化转换。
AutoViz - 自动化数据可视化，只需极少代码。
PlotlyAI - 基于AI的数据可视化与仪表盘创建工具。

🔄 论文转代码与可复现性

自动化代码生成

AutoP2C - LLM代理框架，可根据学术论文生成可运行的代码仓库。
ResearchCodeAgent - 多智能体系统，用于自动编码研究方法。
ToolMaker - 将包含代码的论文转化为可调用的代理工具。

实验自动化

BioProBench - 综合基准测试，用于自动评估LLM在生物实验方案及程序理解方面的能力。
Alhazen - 从科学文献中提取实验元数据和操作流程信息。

📋 科学文档处理与解析

高性能文档处理

MinerU (2024/2025) - SOTA多模态文档解析模型，拥有12亿参数，性能超越GPT-4o，可将PDF转换为适合LLM使用的Markdown/JSON格式。
PDF-Extract-Kit (2024) - 全面的PDF内容提取工具包，具备布局检测、公式识别和OCR功能。
Docling (IBM, AAAI 2025) - 支持多种格式（PDF/DOCX/PPTX/HTML/图片）到结构化数据（Markdown/JSON）的转换，并能重建布局、恢复表格和公式。
Nougat (Meta AI) - 针对学术文档的神经网络光学理解技术，可将科学PDF转换为支持数学公式的Markdown格式。
PaddleOCR 3.0 (2024/2025) - 先进的OCR技术，结合PP-StructureV3文档解析，准确率提升13%，支持80多种语言。
Unstructured - 生产级ETL工具，用于将复杂文档转换为结构化格式，并提供开源API。
Marker - 高精度PDF→Markdown/JSON/HTML转换工具，尤其擅长处理表格、公式和代码块，并配有基准测试脚本。
S2ORC doc2json (AllenAI) - 大规模PDF/LaTeX/JATS解析工具，可将数百万篇论文转换为标准化JSON格式。
GROBID - 用于从学术文档中提取结构化元数据的机器学习软件。
Science-Parse / SPv2 (AllenAI) - 可将科学论文解析为结构化字段（标题/作者/章节/参考文献）。

生产级流水线与数据准备

IBM 数据准备工具包：PDF→Parquet - 大规模科学文档摄取流水线，配备优化配置。
Mozilla 文档转Markdown - 基于Docling的解析工具，提供UI/CLI演示，便于快速原型开发。

图表与表格提取

PDFFigures2 - 从学术PDF中提取图表、表格、图注及章节标题。
TableBank - 大规模表格检测与识别数据集，附带预训练模型。

科学文献RAG与分析

PaperQA2 - 高精度RAG系统，适用于科学PDF，支持引用、代理式RAG及矛盾检测。
OpenScholar - 基于检索增强的语言模型，能够综合4500万篇论文的科学文献，其引用准确性达到人类专家水平，在ScholarQABench基准测试中比GPT-4o高出5%（Nature 2026，UW & Ai2联合发布）。
paper-reviewer - 可根据arXiv论文生成综合性评论，并将其转化为博客文章。

🧰 研究工作台与插件

交互式研究环境

Jupyter AI (JupyterLab扩展) - 官方Jupyter扩展，提供%%ai魔法命令和侧边栏聊天助手，可连接多个模型提供商及本地推理引擎。
Notebook Intelligence (NBI) - JupyterLab中的AI编码助手，具备代理模式，支持任意LLM提供商（2025年及以后）。
Google Colab AI功能 - 集成AI辅助功能，适用于数据科学和研究笔记本。

文献管理插件

PapersGPT for Zotero - 在Zotero中实现多PDF对话、检索与引用功能，支持商业或本地模型（如Ollama），并兼容MCP协议。
Zotero-GPT (MuiseDestiny) - 经典开源插件，可在Zotero内进行文献问答与摘要生成。
Better BibTeX for Zotero - 增强的引文键管理与LaTeX集成功能。

科学写作与协作

Notion AI - 基于AI的研究笔记记录与知识管理工具。
Obsidian Smart Connections - 基于AI的笔记链接与研究图谱导航功能。
Research Rabbit - 基于AI的文献发现与科研网络映射工具。

🕸 知识抽取与学术知识图谱

知识图谱构建

iText2KG - 基于大模型的增量式知识图谱构建，包含实体抽取与Neo4j可视化
GraphGen - 由知识图谱指导的合成数据生成，用于大模型微调，在科学问答（GPQA-Diamond）和数学推理（AIME）任务上表现优异
KoPA - 结构感知前缀适配方法，用于将大模型与知识图谱集成（ACM MM 2024）
Scholarly KGQA - 基于大模型的学术知识图谱问答系统（ArXiv论文）

知识图谱相关资源

Awesome-LLM-KG - 关于统一大模型与知识图谱的论文综合整理

🤖 研究代理与自主工作流

自主研究系统（2024–2025年突破）

AI科学家v1（2024） - 首个完全自主的研究系统：假设→实验→写作→评审的全流程模拟
AI科学家v2（2025） - 引入智能体树搜索机制，减少对模板的依赖，首次产出研讨会级别接受的论文
DeepScientist - 首个在前沿AI任务中逐步超越人类最先进水平的系统（分别提升183.7%、1.9%、7.9%），历经一个月的自主探索，累计使用超过2万GPU小时
Kosmos - 扩展版自主AI科学家，支持200个并行代理运行，执行4.2万行代码，每次运行分析1500篇论文，准确率达79.4%，并取得7项科学发现（Edison Scientific）
AlphaResearch - 自主算法发现系统，结合进化搜索与同行评审奖励模型，在圆盘堆积问题上达到最佳性能
AI-Researcher - 自主化流程，涵盖文献综述→假设提出→算法实现→发表级写作，并通过Scientist-Bench进行评估
Agent Laboratory - 多智能体工作流，支持完整的科研周期，配合AgentRxiv实现累积性发现
InternAgent - 封闭式多智能体系统，覆盖12项科学任务的假设提出到验证全过程，在MLE-Bench榜单中排名第一（36.44%）
freephdlabor - 首个完全可定制的开源多智能体框架，从创意构思到LaTeX论文，全程自动化管理动态工作流
ToolUniverse - 通过整合600余种科学工具，将任意大模型转化为研究系统，推动AI科学家的普及化（哈佛MIMS）
LabClaw - 生物医学AI代理技能操作层，涵盖生物学、药理学、医学、数据科学和文献检索等7个领域，共211份生产就绪的SKILL.md文件，支持模块化的实验室推理与实验方案组合，适用于斯坦福LabOS兼容的代理
Robin - FutureHouse的端到端科学发现多智能体系统，协调文献检索（Crow/Falcon）和数据分析（Finch）代理，首次利用AI生成药物发现，识别出ripasudil作为新型干性AMD治疗药物（2025年）
Aviary - 面向复杂科学任务的语言代理训练平台，包括DNA操作、文献检索和蛋白质工程等
Curie - 利用AI代理开展自动化且严谨的科学实验
POPPER - 基于智能体的序列式证伪法，实现自动化假设检验
autoresearch - Andrej Karpathy的自主大模型研究框架：AI代理在真实训练环境中夜间运行实验，自动编辑代码→5分钟训练→评估，循环往复，单GPU每晚可完成约100次实验
UniScientist - 覆盖50余门学科的通用科学研究智能，将大模型定位为跨学科创新引擎，由人类专家负责验证；300亿参数模型在5项研究基准测试中表现优于Claude Opus和GPT

评估与基准测试

ScienceAgentBench（ICLR 2025） - 汇集44篇同行评审论文中的102个可执行任务，覆盖4大学科领域，并采用容器化方式评估
BuildArena - 首个面向物理规则的交互式基准测试，专为LLM代理设计，可在物理模拟器中建造火箭、汽车和桥梁，并配备3D空间几何库
SciTrust（2024） - 科学类大模型的可信度评估框架（真实性、幻觉、阿谀奉承）
SciCode - 由科学家精心策划的研究编码基准，包含16个子领域的338个子问题（物理、数学、材料、生物、化学），评估大模型在真实科学编程任务中的表现，并提供黄金标准解决方案（NeurIPS 2024）
SciBench - 多领域高校级别科学问题解决能力评估

学术评审与评价

AgentReview - 模拟学术同行评审生态系统的LLM代理
LLM-Peer-Review - 基于网页的大模型辅助稿件评审与注释应用

领域专用研究代理

Aletheia - 谷歌DeepMind推出的基于Gemini Deep Think的自主数学研究代理，无需人工干预即可自主解决700个埃尔德什猜想中的4个开放问题，并生成完整的研究论文（2026年2月）
AlphaGeometry - DeepMind开发的奥林匹克级别几何定理证明器，结合了神经语言模型与符号推理引擎。AlphaGeometry2以金牌选手水平解决了84%的IMO几何题（42/50）（Nature 2024）
Goedel-Prover-V2 - Lean 4中最强大的开源自动定理证明器。8B模型在MiniF2F基准上达到84.6%的准确率，与DeepSeek-Prover-V2-671B相当；32B模型通过自校正机制进一步提升至90.4%，采用支架式数据合成和验证器引导的证明精炼技术（普林斯顿大学，2025年）
BioDiscoveryAgent - 用于生物发现与科研自动化的AI代理
MOOSE - 基于大型语言模型的开放式科学假设自动发现系统（ACL 2024，ICML最佳海报奖）
ChemCrow - 集成工具的化学研究LLM代理
Coscientist - 自主化学实验规划与执行系统

🏷 数据标注与整理

弱监督与自动标注

Snorkel - 面向科学数据集的程序化数据标注与弱监督方法
PandasAI - 使用自然语言进行对话式数据分析与可视化

⚗ 科学机器学习

神经微分方程

torchdiffeq - PyTorch实现的神经ODE
torchdyn - PyTorch中的神经微分方程
diffrax - JAX中用于数值求解微分方程的库
DifferentialEquations.jl - Julia中的微分方程工具包
DiffEqFlux.jl - Julia中的神经微分方程

物理信息神经网络

DeepXDE - 用于求解偏微分方程的深度学习库
Lang-PINN - 基于LLM的多智能体系统，能够根据自然语言任务描述构建可训练的PINN模型，使均方误差降低3–5个数量级，执行成功率提升50%以上（ICLR 2026口头报告）
PINNs - 物理信息神经网络
NVIDIA PhysicsNeMo - 大规模物理驱动机器学习模型的开源框架（原Modulus，2025年更名）
PINA - 用于高级建模的PyTorch版物理信息神经网络
SciANN - 基于Keras的科学神经网络
NeuralPDE.jl - Julia中的物理信息神经网络

神经算子与模型发现

DeepONet - 非线性算子学习
PySINDy - 非线性动力系统的稀疏识别
PySR - 高性能符号回归工具，用于从数据中发现可解释的科学方程，采用Python/Julia后端的多种群进化搜索，在物理学和天文学领域广泛应用（剑桥大学，NeurIPS 2023）
LLM-SR - 利用LLM进行科学方程发现与符号回归，结合代码生成与进化搜索（ICLR 2025口头报告）
Fourier Neural Operator - 在傅里叶空间中学习算子

📖 论文与综述

基础性论文

机器学习在科学计量分析中的应用（2021年9月）- 综合性综述
人工智能在科学领域的进展与挑战（2023年3月）- 当前领域现状
面向科学的基础模型（2022年5月）- 大型模型在科研中的应用
神经常微分方程（2018年6月）- 神经ODE领域的突破性工作
物理信息神经网络（2017年11月）- 基于物理约束的深度学习
人工智能时代的科学发现 - Nature关于AI在科学中作用的综述

📊 综合性综述与评论（2024—2025年）

人工智能在科学研究中的应用

《人工智能辅助科学发现综述》（2025年2月）——从文献检索到同行评审，全面概述大型语言模型在科学研究生命周期中的作用
《AI4Research：面向科学研究的人工智能综述》（2025年7月）——系统性地梳理人工智能在科研领域的分类体系
《量子、原子尺度及连续介质系统中的科学人工智能》（2023年7月）——由63位作者共同撰写的跨科学尺度的综合性技术综述
《从自动化到自主性：大型语言模型在科学发现中的应用综述》（2025年5月）——提出工具、分析师和科学家三个层次的分类框架
《从“AI for Science”到“Agentic Science”：自主科学发现综述》（2025年8月）——涵盖生命科学、化学、材料科学和物理学等领域的自主科学发现综合评述
《用于科学发现的代理型人工智能：进展、挑战与未来方向》（2025年3月）——全面回顾人工智能代理在科学领域的应用
《迈向科学智能：基于大型语言模型的科学代理综述》（2025年3月）——科学人工智能代理系统

科学领域大型语言模型

《科学领域大型语言模型及其应用综合综述》（2024年6月）——覆盖多个学科的260余种科学专用大型语言模型
《科学领域大型语言模型综述：从数据基础到代理前沿》（2025年8月）——以数据为中心视角审视科学领域大型语言模型
《科学领域大型语言模型：生物与化学领域综述》（2024年1月）——聚焦特定领域的科学专用大型语言模型

科学机器学习

《基于物理信息神经网络的科学机器学习：现状与展望》（2022年1月）——全面回顾物理信息神经网络
《物理信息神经网络及其扩展》（2024年8月）——最新进展及变体介绍
《基于模拟的推断前沿》（PNAS，2020年）——Cranmer等人关于SBI在科学计算中应用的基础性综述
《从理论到实践：科学计算中神经算子的实用入门》（2025年3月）——聚焦DeepONet、FNO和PCANet等实现方法的指南
《神经算子的架构、变体与性能：比较综述》（2025年）——系统分析DeepONets、积分核算子以及基于Transformer的神经算子
《环境科学的基础模型综述》（2025年4月）——环境领域的应用
《生物信息学中的基础模型》（2025年）——生物学领域的基础模型
《材料发现的基础模型》（2025年）——关于材料人工智能的展望

不确定性量化

《科学机器学习中的不确定性量化：方法、指标与比较》（2023年，J. Comput. Phys.）——Psaros等人提出的PINNs和神经算子中UQ的综合框架
《深度学习不确定性量化方法综述》（2023年）——从不确定性来源角度系统性梳理UQ方法

自动化与无人实验室

《面向化学与材料科学的无人实验室》（2024年，Chem. Rev.）——长达100页的综合性综述，涵盖SDL技术、应用及基础设施
《自主“无人”实验室：技术与政策影响综述》（2025年，Royal Soc. Open Sci.）——结合技术和安全考量的技术综述

政策与战略视角

《面向科学的人工智能》（2022年，CSIRO）——里程碑式报告，分析过去60年间98%科学领域中人工智能的应用情况
《2025年人工智能与科学》（2025年，复旦大学与Nature联合发布）——全面报告人工智能对7个科学领域、28个研究方向以及90余项挑战的变革性影响
《科学领域人工智能证据综述》（2024年，欧洲科学咨询委员会）——聚焦政策的人工智能对科研影响的证据性评估

🚀 AI科学家与自主研究（2024—2025年突破）

《AI科学家：迈向完全自动化的开放式科学发现》（2024年8月）——首个完全自主的研究系统
《AI科学家-v2：基于代理树搜索的车间级自动化科学发现》（2025年4月）——通过代理树搜索进一步提升自主研究能力
《AI研究员：自主科学创新》（2025年5月）——构建从文献检索到论文发表的自主研究流程，并引入Scientist-Bench评估框架
《InternAgent：当代理成为科学家——构建从假设到验证的闭环系统》（2025年5月）——多智能体系统在MLE-Bench榜单中排名第一，实现了闭环研究自动化
《基于层级式AI科学家系统的自主科学发现》（2025年7月）——自进化多智能体研究系统
《ChemCrow：将大型语言模型与化学工具相结合》（2023年4月）——用于化学研究的LLM代理
《利用大型语言模型进行自主化学研究》（2023年，Nature）——自动化化学实验
《Coscientist：自主规划并执行科学实验》（2023年，Nature）——机器人实验室自动化

最近进展与领域应用

AlphaFold：蛋白质结构预测
用于材料发现的AI
化学中的大型语言模型（2024年2月）
Cell2Sentence：教大型语言模型生物学语言（ICML 2024）——用于单细胞转录组学的LLMs
扩展大型语言模型以进行下一代单细胞分析（2025年4月）——270亿参数的生物语言模型
Boltz-1：民主化生物分子相互作用建模（bioRxiv 2024）——首个达到AlphaFold3级别精度的完全开源模型
MOOSE：用于自动化开放域科学假设发现的大型语言模型（ACL 2024）——首次证明LLMs能够生成新颖且有效的科学假设，荣获ICML最佳海报奖
Earth-Agent：用智能体解锁地球观测的全貌（2025年9月）——具备104种专业工具和多模态分析能力的地球观测LLM智能体框架
MedAgents：作为零样本医学推理协作者的大型语言模型（ACL 2024）——利用角色扮演LLM智能体的多学科协作医学推理框架
MedAgentGym：面向生物医学数据科学中以代码为中心推理的可扩展智能体训练环境（2025年6月）——专为生物医学AI智能体设计的以代码为中心的推理训练环境
Paper2Web：让您的论文鲜活起来！（2025年10月）——由AI驱动的学术论文交互式网站转化，并配有全面评估框架
DeepAnalyze：用于自主数据科学的智能体型大型语言模型（2025年10月）——首个采用课程式训练的自主数据科学智能体LLM
使用ToolUniverse民主化AI科学家（2025年9月）——一个通用生态系统，可基于任何LLM构建AI科学家，包含600余种科学工具
TxAgent：跨工具宇宙的治疗推理AI智能体（2025年3月）——在药物推理任务中达到92.1%准确率，比GPT-4o高出25.8%
Aviary：针对挑战性科学任务的语言智能体训练框架（2024年12月）——用于科学发现的语言智能体训练框架
Galactica：面向科学的大型语言模型（2022年11月）

📈 评估与基准测试

ScienceAgentBench（ICLR 2025） —— 包含来自4个学科44篇同行评审论文的102项可执行任务，并采用容器化评估方式
Scientist-Bench —— 用于比较LLM智能体生成的研究成果与高质量科学工作的综合基准
SciTrust：评估大型语言模型在科学领域的可信度（2024年）——科学LLM可信度评估框架
SciBench：评估大学水平的科学问题解决能力（2023年）——科学推理基准测试
ChartCoder评估 —— 图表到代码生成基准

🔬 领域特定应用

🧬 生物学与医学

蛋白质与药物发现

AlphaFold - 蛋白质结构预测
ColabFold (2025年更新) - 可访问的AlphaFold/ESMFold实现，支持AF3 JSON导出及数据库更新
OpenFold3 - 完全开源（Apache 2.0），复现AlphaFold3的生物分子结构预测模型，面向学术与商业用途免费开放（哥伦比亚大学AlQuraishi实验室及OpenFold联盟，2025年）
Protenix - 可训练的PyTorch版AlphaFold3复现模型
Chai-1 - 多模态基础模型，用于生物分子结构预测（蛋白质、小分子、DNA、RNA、糖链），在各类基准测试中达到最先进水平，并可选MSA/模板支持（Chai Discovery，2024年）
Boltz - 首个完全开源、达到AlphaFold3级别精度且结合亲和力预测速度提升1000倍的模型（MIT）
BoltzGen - 基于生成模型的从头设计蛋白质结合剂，在66%的新靶点测试中实现了纳摩尔级结合能力（MIT，2025年）
xfold - 普及AlphaFold3：基于PyTorch的重实现，加速蛋白质结构预测研究
MegaFold - 跨平台系统优化，使AlphaFold3训练提速1.73倍、内存占用降低1.23倍
Graphormer - 通用深度学习骨干网络，适用于分子建模
DiffDock - 基于扩散的分子对接技术，实现最先进的盲对接性能，将配体构象预测视为SE(3)空间上的生成式扩散过程，并推出DiffDock-L版本以提升泛化能力（MIT CSAIL，ICLR 2023）
targetdiff - 面向目标的3D等变扩散模型，用于分子生成（ICLR2023）
ReQFlow - 校正四元数流算法，高效生成蛋白质主链，速度比RFDiffusion快37倍，设计性达0.972（ICML 2025）
BioEmu - 微软开发的生成模型，可在单张GPU上以比分子动力学模拟快10万倍的速度采样蛋白质平衡构象，预测结构域运动、局部展开及隐匿结合位点（Science，2025年）
ProteinMPNN - 基于深度学习的蛋白质序列设计（逆折叠）方法，直接由主链结构生成序列，序列恢复率可达52.4%，而Rosetta仅为32.9%，是现代蛋白质设计流程中的核心工具（Baker实验室，Science，2022年）
RFdiffusion3 - 最新版本的RFdiffusion，用于蛋白质结构设计，速度提升10倍且精度达到原子级别（2025年12月）
IgGM - 生成式基础模型，用于功能性抗体及纳米抗体的设计，支持从头生成、亲和力成熟、逆向设计、结构预测及人源化改造（腾讯AI4S，ICLR 2025）
DrugAssist - 基于大语言模型的分子优化工具
mint - 学习蛋白质-蛋白质相互作用的语言
Mol-Instructions - 面向化学/生物学领域大语言模型的大规模生物分子指令数据集（ICLR2024）
Uni-Mol - 通用3D分子预训练框架，包含2.09亿种构象；扩展至11亿参数的Uni-Mol2版本则基于8亿种构象，用于分子性质预测、分子对接及量子化学计算（ICLR 2023，NeurIPS 2024）
ChemBERTa - 化学语言模型
DeepChem - 面向化学领域的机器学习工具
DeepMol - 面向药物研发工作流的统一ML/DL框架，集成RDKit、DeepChem和scikit-learn，并提供SHAP解释性
RDKit - 化学信息学工具包
ESM3 - 980亿参数的前沿生成模型，可同时推理蛋白质序列、结构与功能，基于27.8亿条蛋白质数据进行训练；该模型还生成了一种新型荧光蛋白（esmGFP），其序列与已知GFP仅58%一致（EvolutionaryScale，2024年）
ESMFold - 基于ESM模型的蛋白质结构预测

基因组学与生物信息学

[RhoFold+] (https://github.com/ml4bio/RhoFold) - 基于2370万条序列预训练的RNA语言模型实现端到端的RNA三维结构预测，在RNA-Puzzles和CASP15比赛中性能超越现有方法及人类专家团队（Nature Methods 2024）
[Evo 2] (https://github.com/ArcInstitute/evo2) - Arc研究所基于来自所有生命域的9万亿个核苷酸训练的400亿参数基因组基础模型，支持100万碱基对上下文，用于通用DNA/RNA/蛋白质预测与设计（Nature 2026）
[LucaOne] (https://github.com/LucaOne/LucaOne) - 具有统一核酸与蛋白质语言的广义生物基础模型，整合DNA/RNA/蛋白质序列（Nature Machine Intelligence 2025）
[Geneformer] (https://github.com/lcrawlab/Geneformer) - 单细胞Transformer基础模型，通过掩码基因预测任务在1.04亿个人类转录组上预训练，可在少量标注数据下实现迁移学习，用于细胞类型分类、基因网络分析及体外扰动研究（Nature 2023，V2 2024）
[scFoundation] (https://github.com/biomap-research/scFoundation) - 1亿参数的基础模型，在覆盖约2万个基因的5000多万个人类单细胞转录组上预训练，在基因表达增强、药物反应及扰动预测方面达到SOTA水平（Nature Methods 2024）
[scGPT] (https://github.com/bowang-lab/scGPT) - 基于Transformer的单细胞分析工具
[Cell2Sentence] (https://github.com/vandijklab/cell2sentence) - 通过单细胞转录组学向大型语言模型教授生物学语言（ICML 2024）
[ChatSpatial] (https://github.com/cafferychen777/ChatSpatial) - MCP服务器，可通过自然语言进行空间转录组学分析，集成包括SpaGCN、Cell2location、LIANA+、CellRank在内的60余种方法，适用于Visium、Xenium、MERFISH等平台
[Enformer] (https://github.com/google-deepmind/deepmind-research/tree/master/enformer) - 基因表达预测
[DNABERT] (https://github.com/jerryji1993/DNABERT) - DNA序列分析
[scBERT] (https://github.com/TencentAILabHealthcare/scBERT) - 面向基因表达的单细胞BERT模型
[GenePT] (https://github.com/yiqunchen/GenePT) - 面向基因组学的生成式预训练模型
[DNA Claude Analysis] (https://github.com/shmlkv/dna-claude-analysis) - 使用Claude Code和Python构建的交互式个人基因组分析工具包。可解析消费者DNA服务提供的原始基因分型数据，并按健康风险、药物基因组学、祖先溯源、营养等17个类别分析SNP位点，配备终端风格的HTML仪表盘。

医疗AI与临床应用

[MedSAM] (https://github.com/bowang-lab/MedSAM) - 通用医学图像分割基础模型，在涵盖10种成像模态和30多种癌症类型的157万张图像-掩码对上训练；MedSAM2进一步扩展至3D及视频分割领域（Nature Communications 2024）
[MedAgents] (https://github.com/gersteinlab/MedAgents) - 基于角色扮演LLM代理的零样本医学推理多学科协作框架（ACL 2024）
[MedAgentGym] (https://github.com/wshi83/MedAgentGym) - 面向生物医学数据科学中以代码为中心的推理的可扩展代理式训练环境

⚛ 化学与材料科学

面向化学的LLM

[LLM4Chemistry] (https://github.com/OpenDFM/LLM4Chemistry) - 关于化学领域LLM的精选论文列表，涵盖微调、推理、多模态模型、智能体及基准测试等内容（COLING 2025）

材料发现

[GNoME] (https://github.com/google-deepmind/materials_discovery) - DeepMind开发的图神经网络用于材料探索，发现了220万个新晶体结构（其中38万个最为稳定），相当于800年传统研究的成果，同时开源了包含52万余种材料的数据集（Nature 2023）
[FAIRChem (OMat24)] (https://github.com/FAIR-Chem/fairchem) - Meta构建的综合性材料/化学机器学习生态系统，包含超过1.18亿次DFT计算；EquiformerV2模型在Matbench Discovery榜单中名列前茅
[MACE] (https://github.com/ACEsuit/mace) - 机器学习原子间势能模型
[CHGNet] (https://github.com/CederGroupHub/chgnet) - 具有电荷与磁矩感知能力的通用预训练神经网络势能模型，基于150多万个Materials Project无机结构训练而成，可用于电荷敏感分子动力学模拟及相图预测（伯克利，Nature Machine Intelligence 2023封面文章）
[MatterSim] (https://github.com/microsoft/mattersim) - 跨元素、温度和压力的深度学习原子级模型
[Crystal Graph CNNs] (https://github.com/txie-93/cgcnn) - 晶体性质预测
[MatBench] (https://github.com/materialsproject/matbench) - 材料信息学基准测试
[Best of Atomistic Machine Learning] (https://github.com/JuDFTteam/best-of-atomistic-machine-learning) - 材料科学领域原子级机器学习项目的精选列表

化学合成

[AiZynthFinder] (https://github.com/MolecularAI/aizynthfinder) - 阿斯利康工业级逆向合成规划工具，采用MCTS算法递归分解分子为可采购的前体，具备多步路线评分功能，并支持自定义单步模型（v4.0，2024）
[Molecular Transformers] (https://github.com/pschwllr/MolecularTransformer) - 用于化学反应预测与合成规划的人工智能工具

🌌 物理与天文学

面向物理的机器学习

[FermiNet] (https://github.com/google-deepmind/ferminet) - DeepMind开发的从头算量子化学神经网络，通过变分蒙特卡洛方法结合反对称波函数直接求解多电子薛定谔方程，并已扩展至激发态研究（Phys. Rev. Research 2020，Science 2024）
[JAX-MD] (https://github.com/jax-md/jax-md) - JAX中的分子动力学
[Neural ODEs] (https://github.com/rtqichen/torchdiffeq) - 基于神经网络的微分方程
[Physics-Informed Neural Networks] (https://github.com/maziarraissi/PINNs) - 受物理约束的机器学习模型
[EquiformerV2] (https://github.com/atomicarchitects/equiformer_v2) - 改进的等变Transformer，适用于3D原子图（ICLR2024）
[Equiformer] (https://github.com/atomicarchitects/equiformer) - 等变图注意力Transformer（ICLR2023）

天文学与天体物理学

[AstroPy] (https://github.com/astropy/astropy) - Python天文学工具
[Gaia Archive] (https://gea.esac.esa.int/archive/) - 用于机器学习的恒星数据
[DeepSphere] (https://github.com/deepsphere/deepsphere-pytorch) - 用于天文学的球面CNN

🌍 地球与气候科学

气候建模

GenCast - Google DeepMind基于扩散模型的集合天气预报模型，分辨率为0.25°，在长达15天的预测中，97.2%的任务上表现优于ECMWF ENS，提供开源代码和权重（Nature 2024）
Aurora - Microsoft的地球系统基础模型，支持多分辨率的天气、空气污染和海洋波浪预报，基于超过100万小时的多样化大气数据进行训练（Nature 2025）
ClimaX - Microsoft首个用于天气和气候的基础模型，采用视觉Transformer架构，基于异构数据集训练（ICML 2023）
NeuralGCM - Google Research的混合机器学习/物理大气模型，结合学习到的动力学与物理约束，在2至15天的预报以及40年的气候模拟中均优于传统模型，由ECMWF共同开发（Nature 2024）
NVIDIA Earth-2 - 全球首个完全开放、加速型的天气AI软件栈，包含中长期预报和临近预报模型，采用生成式AI技术（2026年1月）
Pangu-Weather - 华为的3D高分辨率全球天气预报模型，分辨率为0.25°，是首个在所有变量和不同预报时效上全面超越传统数值天气预报的人工智能方法，并已集成到ECMWF的业务预报中（Nature 2023）
Prithvi WxC - IBM-NASA开源的23亿参数天气与气候基础模型，基于160个MERRA-2变量进行训练，可在桌面端运行，并有针对气候降尺度和重力波参数化的微调版本
ClimateBench - 面向机器学习模型的气候数据基准
WeatherBench - 天气预测基准
WeatherGFT - 物理与人工智能相结合的细粒度天气预报建模（NeurIPS'24）
Awesome Large Weather Models - 人工智能地球科学领域大型天气模型的精选列表
TerraTorch - 用于微调地理空间基础模型的Python工具包
Earth-Agent - 面向地球观测的大语言模型代理框架，包含5个功能套件中的104种专用工具
AI for Earth - Microsoft的环境AI项目

🌾 农业与生态学

农业AI

PlantNet - 利用AI和公民科学进行植物识别
AgML - 农业机器学习平台

生态建模

BioSimulators - 生物仿真工具
EcoNet - 生态建模与保护AI

🤖 科学领域的基础模型

通用科学模型

Galactica - 面向科学领域的大型语言模型
Llemma - 开放式数学语言模型（7B/34B），基于Proof-Pile-2训练，在MATH基准测试中与同等规模的Minerva相比表现更优，无需微调即可实现工具使用和Lean形式化定理证明（EleutherAI, ICLR 2024）
MinervaAI - 数学推理
PaLM-2 - 科学推理能力

领域特定模型

ESM - 蛋白质语言模型
BioNeMo Framework - NVIDIA的开源平台，用于大规模构建和调整生物AI模型，整合了ESM-2、Geneformer、MolMIM和DNA嵌入模型，并提供从单GPU到多节点训练的配方（2025）
ChemGPT - 面向化学的语言模型
BioGPT - 生物医学文本生成

📈 数据集与基准测试

多学科

Hugging Face Datasets - 综合性的机器学习研究数据集和科学数据集合
Google Dataset Search - 查找科学数据集

生物与医学

Protein Data Bank - 蛋白质结构
ChEMBL - 化学生物活性数据
Human Protein Atlas - 蛋白质表达数据
Chinese Medical Dataset - 面向AI研究的中国医学数据集综合收藏

化学与材料

Materials Project - 计算材料数据库
QM9 - 小分子性质
Open Catalyst Project - 催化剂发现

物理

LIGO Open Science Center - 引力波数据
Particle Data Group - 粒子物理数据
OpenQuantumMaterials - 量子材料数据

💻 计算框架

机器学习

PyTorch - 深度学习框架
JAX - 高性能机器学习研究
TensorFlow - 端到端机器学习平台

科学计算

NumPy - 数值计算
SciPy - 科学计算
Scikit-learn - 机器学习库

科学机器学习框架

SciML - 科学机器学习生态系统
DifferentialEquations.jl - 多语言高性能微分方程求解与科学机器学习工具包（3,000+ 颗星）
ModelingToolkit.jl - 用于自动并行化科学机器学习的非因果建模框架（1,500+ 颗星）
SciMLBenchmarks.jl - 科学机器学习基准测试及微分方程求解器
NeuralPDE.jl - 用于求解偏微分方程的物理信息神经网络（PINNs）（1,100+ 颗星）
DiffEqFlux.jl - 具有 O(1) 反向传播和 GPU 支持的神经常微分方程（900+ 颗星）
Optimization.jl - 用于局部、全局、基于梯度及无导数优化的统一接口（800+ 颗星）
PaddleScience - 面向 AI 驱动科学计算应用的 SDK 和库
Flux.jl - Julia 中的机器学习

专用框架

MDAnalysis - 分子动力学分析
MDtrajNet - 神经网络基础模型，可直接生成 MD 轨迹而无需计算力场，采用等变 Transformer 架构，将模拟速度提升至原来的 100 倍（2025 年）
ASE - 用于材料建模的原子模拟环境
PyMC - 概率编程
OpenMM - 高性能分子模拟工具包

🎓 教育资源

课程与教程

面向所有人的 AI（Coursera） - 基础 AI 概念
CS229 机器学习 - 斯坦福大学机器学习课程
MIT 6.034 人工智能 - 人工智能基础

开放获取教育资源

SciML 书籍 - 并行计算与科学机器学习：MIT 18.337J/6.338J 课程资料（1,900+ 颗星）
深入深度学习 - 包含代码实现的交互式深度学习书籍
统计学习要素 - 经典 ML 教材，免费提供
神经网络与深度学习 - 迈克尔·尼尔森编写的免费在线书籍

📋 论文集与仓库

优秀科学语言模型 - 精选科学领域 LLM 论文（260+ 模型）
优秀 LLM 科学发现 - 用于科学发现的 LLM 论文
AI4Research 论文 - 用于科学研究的 LLM 论文
物理信息神经网络论文 - PINN 研究汇编
使用 ML 的科学计算论文 - 科学 ML 论文库
基于模拟的推断论文与工具 - 社区维护的 SBI 研究门户，包含论文和软件
优秀 AI 科学家论文 - 自主 AI 科学家研究
科学领域的优秀智能体 - 覆盖多个科学领域的 LLM 智能体

YouTube 频道

两分钟论文 - AI 研究摘要
3Blue1Brown - 数学概念
AI Coffee Break - AI 论文评论
Steve Brunton - 数据驱动方法
Nathan Kutz - 应用数学
物理信息机器学习 - SciML 教学视频

🏛 研究社区

会议

NeurIPS - 机器学习会议
ICML - 国际机器学习大会
AI for Science Workshop - 专题研讨会

组织

AI 合作伙伴关系 - AI 研究合作组织
艾伦人工智能研究所 - AI 研究机构
OpenAI - AI 研究与部署

在线社区

r/MachineLearning - 机器学习讨论
AI 对齐论坛 - AI 安全研究
Distill - ML 的可视化解释

📚 相关优秀列表

本项目建立在多个优秀资源的基础上，并对其进行了补充：

🎯 专用集合

awesome-ai4s - 200+ 篇 AI for Science 论文，附中文解读
优秀 AI 科学家论文 - 自主 AI 科学家研究
优秀科学机器学习 - 物理信息 ML 和 SciML
科学领域的优秀智能体 - 覆盖多个科学领域的 LLM 智能体
优秀 LLM 智能体科学发现 - 生物医学领域的 AI 智能体
优秀气象与气候基础模型 - 关于气象与气候数据理解的基础模型综合调研

📊 论文与研究汇编

科学 LLM 论文 - 260+ 科学语言模型
LLM4SR 资料库 - 用于科学研究的 LLM 调研资料
PINNs 论文集 - 物理信息神经网络研究
SciML 论文 - 科学计算与机器学习论文

🌟 这些资源集的关键洞察

当前焦点：从工具级辅助转向自主科学智能体
新兴趋势：多模态科学模型、自我改进的研究系统
研究空白：评估框架、伦理治理、人机协作
未来方向：完全自主的发现循环、机器人实验室集成

🤝 贡献方式

我们欢迎各位贡献！详情请参阅我们的贡献指南。

如何贡献

克隆本仓库
将您的资源添加到相应章节
确保格式与现有条目一致
提交带有清晰说明的拉取请求

贡献规范

请确保资源处于活跃维护状态
提供简明扼要的描述
添加前请先检查是否重复
使用规范的 Markdown 格式

📄 许可证

本项目采用 MIT 许可证授权——详情请参阅 LICENSE 文件。

🙏 致谢

特别感谢所有推动 AI for Science 边界的科研人员和开发者。这份列表深受社区启发，也体现了 AI 在科学发现中的变革性潜力。

如果您觉得本资源有帮助，请为本仓库点赞 ⭐！

最后更新：2026年1月——新增了2025至2026年间在自主研究、方程发现及科学基础模型领域的突破性进展

Awesome AI for Science 快速上手指南

awesome-ai-for-science 并非单一的独立软件，而是一个精选的开源资源列表，汇集了加速科学发现的 AI 工具、库、论文和数据集。本指南将指导你如何获取该列表，并快速部署其中几个核心的通用工具（如文档解析 MinerU 和数据分析 PandasAI）以开始你的科研工作。

环境准备

在开始之前，请确保你的开发环境满足以下基本要求：

操作系统: Linux (推荐 Ubuntu 20.04+), macOS, 或 Windows (建议配合 WSL2 使用)。
Python 版本: Python 3.9 - 3.11 (部分最新工具可能需要 3.12，建议优先使用 3.10)。
包管理器: pip (建议升级至最新版) 或 conda。
硬件要求:
- 基础文本处理：普通 CPU 即可。
- 深度学习模型推理/训练（如 MinerU, ChartCoder）：建议配备 NVIDIA GPU (显存 ≥ 8GB)，并安装对应的 CUDA 驱动。
前置依赖:
- Git
- (可选) Docker：用于运行部分容器化部署的工具。

国内开发者提示：建议在安装 Python 依赖时配置清华源或阿里源以加速下载。
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple

安装步骤

由于该仓库包含众多工具，以下提供两种安装方式：获取资源列表本身，以及安装两个最具代表性的高频工具。

1. 获取资源列表

克隆仓库以浏览完整的工具清单和本地文档：

git clone https://github.com/ai-boost/awesome-ai-for-science.git
cd awesome-ai-for-science

2. 安装核心工具示例

示例 A: 安装 MinerU (高性能科学文档解析)

MinerU 是将 PDF 论文转换为 LLM 友好格式（Markdown/JSON）的 SOTA 工具。

# 创建虚拟环境
python -m venv mineru_env
source mineru_env/bin/activate  # Windows 用户请使用: mineru_env\Scripts\activate

# 安装 MinerU (推荐使用国内镜像加速 torch 下载)
pip install magic-pdf[full] -i https://pypi.tuna.tsinghua.edu.cn/simple

# 下载模型权重 (首次运行会自动下载，也可手动预下载)
# 具体模型下载指令参考其官方文档，通常涉及 huggingface 镜像配置
export HF_ENDPOINT=https://hf-mirror.com

示例 B: 安装 PandasAI (自然语言数据分析)

用于通过对话方式分析科学实验数据。

# 在当前环境或新环境中安装
pip install pandasai -i https://pypi.tuna.tsinghua.edu.cn/simple

# 若需使用本地大模型，还需安装对应依赖，例如 ollama 或 langchain
pip install langchain-community

基本使用

以下是两个核心工具的最简使用示例，帮助你快速验证环境。

场景一：使用 MinerU 解析科学论文 PDF

将复杂的科学论文 PDF 转换为结构化的 Markdown，保留公式和表格。

from magic_pdf.data.data_reader_writer import FileBasedDataWriter
from magic_pdf.model.doc_analyze_by_custom_model import doc_analyze

# 设置输入输出路径
pdf_file_path = "paper.pdf"
output_dir = "./output"

# 初始化写入器
image_writer = FileBasedDataWriter(output_dir)

# 执行解析 (假设已自动下载模型)
# 注意：实际使用时需根据具体版本调整 API 调用方式
doc_analyze(
    pdf_file_path,
    image_writer=image_writer,
    start_page_id=0,
    end_page_id=None,
    debug_mode=False
)

print(f"解析完成，结果保存在 {output_dir}")

场景二：使用 PandasAI 分析实验数据

通过自然语言提问来分析 CSV 格式的实验数据。

import pandas as pd
from pandasai import Agent
from pandasai.llm import LocalLLM # 或使用 OpenAI, Ollama 等

# 加载实验数据
df = pd.read_csv("experiment_results.csv")

# 配置 LLM (此处以伪代码示例，需替换为实际可用的 LLM 端点)
llm = LocalLLM(api_base="http://localhost:11434/v1", model="llama3")

# 初始化 Agent
agent = Agent(df, config={"llm": llm})

# 自然语言提问
response = agent.chat("绘制温度与反应速率的关系图，并计算相关系数")
print(response)

探索更多工具

访问克隆后的仓库目录，查看 README.md 文件中的分类列表（如 AI Tools for Research, Paper-to-Code, Domain-Specific Applications），根据具体的科研领域（生物、化学、物理等）选择对应的 GitHub 仓库进行单独安装和使用。

相似工具推荐

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。

★ 85k|★★☆☆☆|今天

图像数据工具视频

ragflow

RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。

★ 77.1k|★★★☆☆|昨天

Agent图像开发框架

PaddleOCR

PaddleOCR 是一款基于百度飞桨框架开发的高性能开源光学字符识别工具包。它的核心能力是将图片、PDF 等文档中的文字提取出来，转换成计算机可读取的结构化数据，让机器真正“看懂”图文内容。面对海量纸质或电子文档，PaddleOCR 解决了人工录入效率低、数字化成本高的问题。尤其在人工智能领域，它扮演着连接图像与大型语言模型（LLM）的桥梁角色，能将视觉信息直接转化为文本输入，助力智能问答、文档分析等应用场景落地。 PaddleOCR 适合开发者、算法研究人员以及有文档自动化需求的普通用户。其技术优势十分明显：不仅支持全球 100 多种语言的识别，还能在 Windows、Linux、macOS 等多个系统上运行，并灵活适配 CPU、GPU、NPU 等各类硬件。作为一个轻量级且社区活跃的开源项目，PaddleOCR 既能满足快速集成的需求，也能支撑前沿的视觉语言研究，是处理文字识别任务的理想选择。

★ 74.9k|★★★☆☆|今天

语言模型图像开发框架

awesome-machine-learning

awesome-machine-learning 是一份精心整理的机器学习资源清单，汇集了全球优秀的机器学习框架、库和软件工具。面对机器学习领域技术迭代快、资源分散且难以甄选的痛点，这份清单按编程语言（如 Python、C++、Go 等）和应用场景（如计算机视觉、自然语言处理、深度学习等）进行了系统化分类，帮助使用者快速定位高质量项目。它特别适合开发者、数据科学家及研究人员使用。无论是初学者寻找入门库，还是资深工程师对比不同语言的技术选型，都能从中获得极具价值的参考。此外，清单还延伸提供了免费书籍、在线课程、行业会议、技术博客及线下聚会等丰富资源，构建了从学习到实践的全链路支持体系。其独特亮点在于严格的维护标准：明确标记已停止维护或长期未更新的项目，确保推荐内容的时效性与可靠性。作为机器学习领域的“导航图”，awesome-machine-learning 以开源协作的方式持续更新，旨在降低技术探索门槛，让每一位从业者都能高效地站在巨人的肩膀上创新。

★ 72.1k|★☆☆☆☆|2天前

开发框架其他

scikit-learn

scikit-learn 是一个基于 Python 构建的开源机器学习库，依托于 SciPy、NumPy 等科学计算生态，旨在让机器学习变得简单高效。它提供了一套统一且简洁的接口，涵盖了从数据预处理、特征工程到模型训练、评估及选择的全流程工具，内置了包括线性回归、支持向量机、随机森林、聚类等在内的丰富经典算法。对于希望快速验证想法或构建原型的数据科学家、研究人员以及 Python 开发者而言，scikit-learn 是不可或缺的基础设施。它有效解决了机器学习入门门槛高、算法实现复杂以及不同模型间调用方式不统一的痛点，让用户无需重复造轮子，只需几行代码即可调用成熟的算法解决分类、回归、聚类等实际问题。其核心技术亮点在于高度一致的 API 设计风格，所有估算器（Estimator）均遵循相同的调用逻辑，极大地降低了学习成本并提升了代码的可读性与可维护性。此外，它还提供了强大的模型选择与评估工具，如交叉验证和网格搜索，帮助用户系统地优化模型性能。作为一个由全球志愿者共同维护的成熟项目，scikit-learn 以其稳定性、详尽的文档和活跃的社区支持，成为连接理论学习与工业级应用的最

★ 65.6k|★☆☆☆☆|今天

开发框架其他数据工具

keras

Keras 是一个专为人类设计的深度学习框架，旨在让构建和训练神经网络变得简单直观。它解决了开发者在不同深度学习后端之间切换困难、模型开发效率低以及难以兼顾调试便捷性与运行性能的痛点。无论是刚入门的学生、专注算法的研究人员，还是需要快速落地产品的工程师，都能通过 Keras 轻松上手。它支持计算机视觉、自然语言处理、音频分析及时间序列预测等多种任务。 Keras 3 的核心亮点在于其独特的“多后端”架构。用户只需编写一套代码，即可灵活选择 TensorFlow、JAX、PyTorch 或 OpenVINO 作为底层运行引擎。这一特性不仅保留了 Keras 一贯的高层易用性，还允许开发者根据需求自由选择：利用 JAX 或 PyTorch 的即时执行模式进行高效调试，或切换至速度最快的后端以获得最高 350% 的性能提升。此外，Keras 具备强大的扩展能力，能无缝从本地笔记本电脑扩展至大规模 GPU 或 TPU 集群，是连接原型开发与生产部署的理想桥梁。

★ 63.9k|★★☆☆☆|昨天

开发框架数据工具其他