awesome-AI-books
awesome-AI-books 是一个汇集了人工智能领域优质书籍与学习资料的开源合集,涵盖从基础数学、机器学习、深度学习到量子AI、强化学习、LLM 和 NLP 等多个方向。所有资源均为可免费下载的 PDF 文档,方便学习者系统性地构建知识体系。由于 GitHub 对大文件存储有限制,所有书籍均托管于 Yandex.Disk,确保访问稳定。项目还整理了常用数学符号参考、前沿研究机构(如 arXiv、DeepMind、OpenAI)的论文入口,以及 OpenAI Gym、StarCraft II、Minecraft 等实战训练平台,帮助学习者边学边练。它特别适合刚入门或希望系统提升的开发者、研究人员和学生,尤其适合那些希望避开碎片化内容、通过经典教材打牢基础的人群。项目不用于商业用途,强调纯粹的学习与共享精神,社区也欢迎贡献新书推荐,持续丰富内容。
使用场景
一名刚入职的AI工程师小李,被分配参与公司一个推荐系统优化项目,需要快速掌握强化学习与特征选择的理论基础,但公司未提供学习资源,且他时间紧张、英文阅读能力有限。
没有 awesome-AI-books 时
- 花了三天在Google和百度上搜索,结果全是广告、付费课程或过时的博客,难以甄别权威资料。
- 找到一本英文原版《Reinforcement Learning: An Introduction》,但PDF版本缺失关键章节,且没有中文注释,阅读效率极低。
- 想找特征选择的实战案例,却找不到结构清晰、带代码示例的开源教材,只能硬啃论文,进度缓慢。
- 想用OpenAI Gym做实验,但不知道如何搭配教材学习,环境搭建后不知从哪开始训练。
- 在GitHub上翻了十几个仓库,链接大多失效,Yandex.Disk等非GitHub存储资源根本不知道去哪里找。
使用 awesome-AI-books 后
- 一键进入“Reinforcement Learning”和“Feature Selection”章节,直接下载到中文译本《强化学习:原理与Python实现》和《特征选择实战指南》,内容完整、带注释。
- 通过“Training ground”链接,快速接入OpenAI Gym,并配合书中“CartPole”案例动手实践,三天内跑通第一个强化学习模型。
- 发现“Libs With Online Books”中整合了《Hands-On Machine Learning》的免费在线版,支持中英对照阅读,理解速度提升一倍。
- 利用“Mathematic Symbols”页面快速查清了公式中的∑、∈、∇等符号含义,不再因数学符号卡壳而中断学习。
- 通过Yandex.Disk链接一次性下载全部推荐资源,无需反复搜索,节省了超过20小时的无效检索时间。
awesome-AI-books 让一名零基础工程师在一周内从理论盲区跃升为能独立搭建实验原型的实战者,真正实现了“学得快、用得上”。
运行环境要求
未说明
未说明

快速开始
令人惊叹的AI书籍
一些很棒的与人工智能相关的书籍和PDF文件,可供下载和学习。
前言
本仓库仅用于学习,请勿用于商业用途。
欢迎向本仓库贡献优质书籍,或告诉我你需要哪本好书,我会尽量将其添加到本仓库中。如果你有任何想法,也可以在这里创建问题或拉取请求。
由于GitHub对大文件存储的限制,所有书籍PDF都存储在Yandex.Disk上。
一些常用的数学符号可参考此页面。
内容
论文与研究的整理
训练平台
- OpenAI Gym:一个用于开发和比较强化学习算法的工具包。(可玩Atari、Box2d、MuJoCo等游戏)
- malmo:Project Malmö是一个基于Minecraft构建的人工智能实验与研究平台。
- DeepMind Pysc2:星际争霸II学习环境。
- Procgen:Procgen基准测试:程序生成的游戏类Gym环境。
- TorchCraftAI:一个用于星际争霸®:虫群战争®机器学习研究的机器人平台。
- Valve Dota2:Dota2游戏访问API。(中文文档)
- Mario AI Framework:一个用于应用AI方法的马里奥AI框架。
- Google Dopamine:Dopamine是一个用于快速原型化强化学习算法的研究框架。
- TextWorld:微软——一个用于训练和测试强化学习(RL)智能体的文本游戏学习环境沙盒。
- Mini Grid:适用于OpenAI Gym的极简网格世界环境。
- MAgent:一个多智能体强化学习平台。
- XWorld:一个用于强化学习的C++/Python模拟器包。
- Neural MMO:一个大规模多智能体游戏环境。
- MinAtar:MinAtar是为AI智能体设计的测试平台,实现了多个Atari 2600游戏的迷你版。
- craft-env:CraftEnv是一个2D工艺环境。
- gym-sokoban:Sokoban是日语中“仓库保管员”的意思,也是一款传统电子游戏。
- Pommerman Playground托管了Pommerman,这是为AI研究打造的炸弹人克隆版。
- gym-miniworld MiniWorld是一个极简的3D室内环境模拟器,适用于强化学习与机器人研究。
- vizdoomgym OpenAI Gym封装了ViZDoom(一个基于Doom的强化学习原始视觉信息研究平台)环境。
- ddz-ai 以孤立语假设和宽度优先搜索为基础,构建了一种多通道堆叠注意力Transformer结构的斗地主AI。
书籍
入门理论与起步
- 人工智能——现代方法(第3版) —— 斯图尔特·罗素 & 彼得·诺维格
- 商业版 掌握人工智能算法 —— 里沙尔·赫布兰斯
- 商业版 掌握AI算法,第二版 —— 里沙尔·赫布兰斯
- 商业版 永恒算法 —— 加里·萨顿
数学
- 概率论导论(第8版) - 谢尔登·M·罗斯
- 凸优化 - 斯蒂芬·博伊德
- 信息论基础(第2版) - 托马斯·科弗 & 杰伊·A·托马斯
- 离散数学及其应用(第7版) - 肯尼斯·H·罗森
- 线性代数导论(第5版) - 吉尔伯特·斯特朗
- 线性代数及其应用(第5版) - 大卫·C·莱伊
- 概率论的逻辑:科学的推理方法 - 埃德温·汤普森·杰恩斯
- 概率与统计(第4版) - 莫里斯·H·德格鲁特
- 统计推断(第2版) - 罗杰·卡塞拉
- 人工智能背后的数学 - 蒂亚戈·蒙特罗
- 信息论基础(原书《信息论基础》第2版) - 托马斯·科弗 & 杰伊·A·托马斯
- 凸优化(原书《凸优化》) - 斯蒂芬·博伊德
- 数理统计学教程 - 陈希儒
- 数学之美(第2版) - 吴军
- 概率论基础教程(原书《概率论导论》第9版) - 谢尔登·M·罗斯
- 线性代数及其应用(原书《线性代数及其应用》第3版) - 大卫·C·莱伊
- 统计推断(原书《统计推断》第2版) - 罗杰·卡塞拉
- 离散数学及其应用(原书《离散数学及其应用》第7版) - 肯尼斯·H·罗森
数据挖掘
机器学习
- 信息论、推理与学习算法 - 大卫·J·C·麦凯
- 机器学习 - 汤姆·M·米切尔
- 模式识别与机器学习 - 克里斯托弗·毕肖普
- 统计学习的要素 - 特雷弗·哈斯蒂
- 面向OpenCV的机器学习 - 迈克尔·贝耶勒(源代码在此)
- 机器学习 - 周志华
- 机器学习(原书《机器学习》) - 汤姆·M·米切尔
- 统计学习方法 - 李航
深度学习
- 在线快速学习
- 深入理解深度学习 - (使用MXNet)一本包含代码、数学和讨论的互动式深度学习书籍。
- d2l-pytorch - (深入理解深度学习)pytorch版本。
- 动手学深度学习 - (深入理解深度学习)中文版。
- 深度学习 - 伊恩·古德费洛 & 约书亚·本吉奥 & 亚伦·库维尔
- 深度学习方法与应用 - 李登 & 董宇
- 为人工智能学习深度架构 - 约书亚·本吉奥
- 机器学习:算法视角(第2版) - 斯蒂芬·马斯兰
- 神经网络设计(第2版) - 马丁·哈根
- 神经网络与学习机器(第3版) - 西蒙·海金
- 面向应用科学与工程的神经网络 - 桑迪娅·萨马拉辛格
- 深度学习(原书《深度学习》) - 伊恩·古德费洛 & 约书亚·本吉奥 & 亚伦·库维尔
- 神经网络与机器学习(原书《神经网络与学习机器》) - 西蒙·海金
- 神经网络设计(原书《神经网络设计》) - 马丁·哈根
- 商业 可解释的人工智能 - 阿贾伊·坦皮
- 商业 对话式人工智能 - 安德鲁·R·弗里德
哲学
- 商业 人类兼容:人工智能与控制问题 - 斯图尔特·拉塞尔
- 商业 生命3.0:人工智能时代的人类生存 - 马克斯·泰格马克
- 商业 超级智能:路径、危险与策略 - 尼克·博斯特罗姆
量子与AI
量子基础
量子AI
量子相关框架
- ProjectQ - ProjectQ是量子计算的开源项目。
带在线书籍的库
GC(生成式内容)
- Stable Diffusion - [论文] 一种潜在的文本到图像扩散模型
- Stable Diffusion V2 - 使用潜在扩散模型进行高分辨率图像合成
- GFPGAN - [论文] GFPGAN旨在开发适用于现实世界人脸修复的实用算法。
- ESRGAN - [论文] ECCV18研讨会——增强版SRGAN。感知超分辨率PIRM挑战赛冠军。训练代码在BasicSR中。
- CodeFormer - [论文] ——[NeurIPS 2022] 基于码本查找变换的鲁棒盲人脸修复方法
- UniPC - [论文] UniPC:用于扩散模型快速采样的统一预测-校正框架
强化学习
- A3C - 谷歌DeepMind异步优势演员-评论家算法
- Q-Learning SARSA DQN DDQN - Q-Learning是一种基于价值的强化学习算法
- DDPG - 深度确定性策略梯度,
- 大规模好奇心 - 大规模好奇心驱动学习研究
- PPO - OpenAI近端策略优化算法
- RND - OpenAI随机网络蒸馏,一种用于深度强化学习方法的探索奖励。
- VIME - OpenAI变分信息最大化探索
- DQV - 深度质量值(DQV)学习
- ERL - 强化学习中的进化引导策略梯度
- MF多智能体RL - 均场多智能体强化学习。(本文包括MF-Q和MF-AC)
- MAAC - 多智能体强化学习的演员-注意力-评论家
特征选择
- scikit-feature - 一组特征选择算法,可在Github上获取
机器学习
- Scikit learn (Python) - Python中的机器学习。
- Linfa (Rust) - “scikit learn”的精神,一个Rust机器学习库。
- Xgboost (Python, R, JVM, Julia, CLI) - Xgboost库的文档。
- LightGBM (Python, R, CLI) - 微软LightGBM库的功能文档。
- CatBoost (Python, R, CLI) - Yandex Catboost库的关键算法PDF论文。
- StackNet (Java, CLI) - 一些模型堆叠算法在此库中实现。
- RGF - 使用“正则化贪婪森林”学习非线性函数(多核实现FastRGF)
- FM, FastFM, FFM, XDeepFM - 因子分解机及一些扩展算法
深度学习
- GNN论文 - 图神经网络(GNN)必读论文
- EfficientNet - 重新思考卷积神经网络的模型缩放
- DenseNet - 密集连接卷积网络
LLM
- WFGY - 开源框架及TXT/PDF包,用于使用16种故障模式图对大型语言模型进行调试和压力测试。包含一本PDF书(WFGY 1.0)、实用的RAG诊所(WFGY 2.0)以及一个长期TXT游乐场(WFGY 3.0),用于研究LLM行为。
NLP
CV
- Fast R-CNN - 快速区域卷积网络方法(Fast R-CNN)用于目标检测
- Mask R-CNN - Mask R-CNN,在现有的边界框识别分支之外,增加了一个并行预测物体掩码的分支,从而扩展了Faster R-CNN。
- GQN - DeepMind生成查询网络,神经场景表示与渲染
元学习
- MAML - 用于深度网络快速适应的模型无关元学习
迁移学习
- GCN - 通过语义嵌入和知识图谱进行零样本识别
自动ML
- 模型搜索 (Python) - Google模型搜索(MS)是一个实现了自动ML算法的大规模模型架构搜索框架。
- TPOT (Python) - TPOT是一个用于自动ML的库。
- Auto-sklearn (Python) - auto-sklearn是一个自动化机器学习工具包,可替代scikit-learn估计器
- Auto-Keras (Python) - Auto-Keras是一个开源的自动化机器学习(AutoML)软件库。由DATA Lab开发
- TransmogrifAI (JVM) - TransmogrifAI(发音为trăns-mŏgˈrə-fī)是一个用Scala编写的AutoML库,运行在Spark之上
- Auto-WEKAA - 提供针对WEKA的模型和超参数自动选择。
- MLBox (Python) - MLBox是一个功能强大的自动化机器学习Python库
流水线训练
- ZenML (Python) - ZenML专为正在将ML工作流推向生产环境的ML从业者打造
降维
数据处理
分布式训练
- Horovod - Horovod 是一个适用于 TensorFlow、Keras、PyTorch 和 MXNet 的分布式训练框架。Horovod 的目标是让分布式深度学习既快速又易于使用。
- Acme - 一种用于(分布式)强化学习的研究框架。
- bagua - Bagua 是一个灵活且高效的分布式训练算法开发框架。
支持本项目

贡献者
代码贡献者
本项目得以存在,离不开每一位贡献者的支持。[贡献]。
资金贡献者
成为资金贡献者,帮助我们持续发展社区。[贡献]
个人
组织
以您的组织名义支持本项目。您的标志将在此处展示,并附上您网站的链接。[贡献]
常见问题
相似工具推荐
stable-diffusion-webui
stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。
everything-claude-code
everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上
ComfyUI
ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。
NextChat
NextChat 是一款轻量且极速的 AI 助手,旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性,以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发,NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。 这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言,它也提供了便捷的自托管方案,支持一键部署到 Vercel 或 Zeabur 等平台。 NextChat 的核心亮点在于其广泛的模型兼容性,原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型,让用户在一个界面即可自由切换不同 AI 能力。此外,它还率先支持 MCP(Model Context Protocol)协议,增强了上下文处理能力。针对企业用户,NextChat 提供专业版解决方案,具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能,满足公司对数据隐私和个性化管理的高标准要求。
ML-For-Beginners
ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程,旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周,包含 26 节精炼课程和 52 道配套测验,内容涵盖从基础概念到实际应用的完整流程,有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。 无论是希望转型的开发者、需要补充算法背景的研究人员,还是对人工智能充满好奇的普通爱好者,都能从中受益。课程不仅提供了清晰的理论讲解,还强调动手实践,让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持,通过自动化机制提供了包括简体中文在内的 50 多种语言版本,极大地降低了全球不同背景用户的学习门槛。此外,项目采用开源协作模式,社区活跃且内容持续更新,确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路,ML-For-Beginners 将是理想的起点。
ragflow
RAGFlow 是一款领先的开源检索增强生成(RAG)引擎,旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体(Agent)能力相结合,不仅支持从各类文档中高效提取知识,还能让模型基于这些知识进行逻辑推理和任务执行。 在大模型应用中,幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构(如表格、图表及混合排版),显著提升了信息检索的准确度,从而有效减少模型“胡编乱造”的现象,确保回答既有据可依又具备时效性。其内置的智能体机制更进一步,使系统不仅能回答问题,还能自主规划步骤解决复杂问题。 这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统,还是致力于探索大模型在垂直领域落地的创新者,都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口,既降低了非算法背景用户的上手门槛,也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目,它正成为连接通用大模型与行业专有知识之间的重要桥梁。