Compendium-of-free-ML-reading-resources

508 121 非常简单 1 次阅读昨天开发框架

AI 解读由 AI 自动生成，仅供参考

Compendium-of-free-ML-reading-resources 是一个精心整理的机器学习免费学习资源库，旨在为学习者提供一站式的高质量阅读材料。它解决了大家在寻找权威、系统且免费的机器学习书籍和论文时面临的资源分散、质量参差不齐的痛点。

该资源库涵盖了从数据清洗、可视化、数学基础、统计学，到线性回归、传统机器学习、深度学习、强化学习，再到自然语言处理、因果推断等前沿领域的 193 本免费书籍。每本书都标注了格式（PDF 或在线 HTML 版），并提供了直接访问链接，所有资源均经作者或出版方合法免费发布。

无论是刚入门的学生、希望系统提升的开发者，还是从事相关研究的研究人员，都能在这里找到适合自己的学习资料。其独特之处在于分类清晰、覆盖全面，并特别收录了许多经典教材的最新免费版本以及 arXiv 上的重要论文，极大降低了高质量学习的门槛。如果你正在规划机器学习的学习路径，或需要查阅某个专题的权威资料，Compendium-of-free-ML-reading-resources 将是你值得信赖的起点。

使用场景

一位刚转行进入算法团队的初级数据科学家，正试图从零构建一个金融风控预测模型，却因理论基础薄弱而陷入学习瓶颈。

没有 Compendium-of-free-ML-reading-resources 时

资源筛选成本极高：在海量网络教程中盲目搜索“线性代数”或“特征工程”，难以辨别资料质量，常花费数天阅读过时或不严谨的内容。
知识体系支离破碎：东拼西凑的学习路径导致数学推导（如矩阵微积分）与代码实现（如 Python 数据清洗）脱节，无法理解模型背后的核心逻辑。
经济门槛阻碍深入：遇到《Python for Data Analysis》等经典著作时，常因付费墙或高昂书费而止步，只能依赖零散的二手笔记。
专项领域无从下手：面对“因果推断”或“可解释性”等进阶需求时，找不到系统性的免费权威指南，导致模型上线后无法通过业务评审。

使用 Compendium-of-free-ML-reading-resources 后

一站式获取权威教材：直接定位到 Wes McKinney 的《Python for Data Analysis》和 Marc Peter Deisenroth 的《Mathematics for Machine Learning》等 193 本免费正版书籍，瞬间建立高标准知识库。
构建结构化学习路径：依托清晰的目录分类（从 EDA 到深度学习），按图索骥补齐数学短板，将理论公式与代码实践无缝对接。
零成本突破专业壁垒：免费下载包括统计学、优化理论及 NLP 大模型在内的全套 PDF 或在线书籍，无需预算即可掌握行业顶尖知识。
精准解决业务痛点：针对风控场景特有的“异常检测”和“因果推断”需求，快速查阅专项章节，迅速产出符合合规要求的高可解释性模型。

Compendium-of-free-ML-reading-resources 将原本需要数月摸索的自学过程压缩为几周的系统化攻坚，让开发者以零成本获得媲美顶尖实验室的知识储备。

运行环境要求

GPU

未说明

内存

未说明

依赖

notes该工具并非可执行的软件或代码库，而是一个免费机器学习阅读资源（书籍、论文）的清单合集。资源格式主要为 PDF 文件和在线 HTML 书籍，涵盖数据清洗、数学基础、统计学、深度学习等多个领域。用户无需安装任何运行环境、GPU 或 Python 依赖库，只需使用网页浏览器或 PDF 阅读器即可访问所列资源。

python未说明

Compendium-of-free-ML-reading-resources hero image

快速开始

免费机器学习阅读资源汇总

说明：

:orange_book: PDF 文件
:earth_africa: HTML 书籍

EDA、可视化与数据清洗 (8)
机器学习数学基础 (13)
统计学与概率论 (16)
优化方法 (7)
线性回归 (6)
机器学习 (48)
R 相关 (18)
特征工程 (2)
可解释性/模型解释 (6)
深度学习/神经网络 (17)
强化学习 (8)
推荐系统 (2)
异常检测 (1)
计算机视觉 (3)
自然语言处理 (NLP) 与大型语言模型 (LLM) (13)
因果推断 (13)
一致性预测 (5)
时间序列：预测 (6)

书籍总数：193

_{注：此处列出的所有书籍均由其作者或出版商免费提供，所有 arXiv 论文本身也是免费的。}

EDA、可视化与数据清洗

:earth_africa: "Python 数据分析（第3版）" 作者：Wes McKinney
:earth_africa: "缺失值的灵活插补" 作者：Stef van Buuren
:earth_africa: "数据可视化基础" 作者：Claus O. Wilke
:earth_africa: "R 图形 Cookbook" 作者：Winston Chang
:earth_africa: "使用 R 的现代数据可视化" 作者：Robert Kabacoff
:orange_book: "数据清洗与机器学习：系统性文献综述" 作者：Pierre-Olivier Côté, Amin Nikanjam, Nafisa Ahmed, Dmytro Humeniuk, 和 Foutse Khomh
:orange_book: "Think Stats：用 Python 进行探索性数据分析" 作者：Allen B. Downey
:orange_book: "SQL 专业笔记"

机器学习数学基础

:orange_book: "机器学习数学" 作者：Marc Peter Deisenroth, A. Aldo Faisal, 和 Cheng Soon Ong
:orange_book: "深度学习所需的矩阵微积分" 作者：Terence Parr 和 Jeremy Howard
:orange_book: "矩阵分析" 作者：Joel A. Tropp
:orange_book: "线性代数做对了" 作者：Sergei Treil
:orange_book: "线性代数正确做法" 作者：Sheldon Axler
:orange_book: "线性代数：理论与应用" 作者：Kenneth Kuttler
:orange_book: "矩阵手册" 作者：Kaare Brandt Petersen 和 Michael Syskind Pedersen
:orange_book: "应用线性代数导论：向量、矩阵与最小二乘法" 作者：Stephen Boyd 和 Lieven Vandenberghe
:orange_book: "面向数据科学的线性代数" 作者：Wanmo Kang 和 Kyunghyun Cho
:orange_book: "面向计算机视觉、机器人和机器学习的线性代数" 作者：Jean Gallier 和 Jocelyn Quaintance
:orange_book: "矩阵微积分（用于机器学习及其他领域）" 作者：Paige Bright、Alan Edelman、Steven G. Johnson
:orange_book: "面向计算机科学和机器学习的代数、拓扑、微分计算与优化理论" 作者：Jean Gallier 和 Jocelyn Quaintance
:orange_book: "数据科学线性代数基础" 作者：Wanmo Kang 和 Kyunghyun Cho
:earth_africa: "带有 R 示例的数据科学线性代数" 作者：Shaina Race Bennett

统计学与概率论

:orange_book: 《概率与统计——不确定性之科学》作者：迈克尔·J·埃文斯、杰弗里·S·罗森塔尔
:orange_book: 《高维概率》作者：乔尔·A·特罗普
:orange_book: 《概率导论》作者：约瑟夫·K·布利茨施泰因、杰西卡·黄
:orange_book: 《中心极限定理史：从经典到现代概率论》作者：汉斯·费舍尔
:orange_book: 《思考贝叶斯：简单易懂的贝叶斯统计》作者：艾伦·B·道尼
:orange_book: 《贝叶斯统计导论》作者：布伦登·J·布鲁尔
:orange_book: 《使用Jamovi学习统计学》作者：丹妮尔·J·纳瓦罗、大卫·R·福克斯克罗夫特
:orange_book: 《贝叶斯数据分析》作者：安德鲁·盖尔曼、约翰·卡尔林、哈尔·斯特恩、大卫·邓森、阿基·韦赫塔里、唐纳德·鲁宾
:orange_book: 《常见概率分布简编》作者：迈克尔·P·麦克劳克林
:orange_book: 《数据科学中的概率与统计》作者：卡洛斯·费尔南德斯-格兰达
:orange_book: 《统计建模：14个主题巡礼》作者：莱因哈德·富勒
:orange_book: 《稳健统计》作者：大卫·J·奥利夫
:orange_book: 《CS109 计算机科学家的概率论》作者：克里斯·皮奇
:orange_book: 《点滴之间：以视觉为重点介绍概率与决策》作者：乔纳森·魏斯伯格
:orange_book: 《格里斯廷和斯奈尔的概率导论》作者：彼得·G·多伊尔
:orange_book: 《高维概率：带数据科学应用的入门》作者：罗曼·维尔希宁

优化

:orange_book: 《凸优化》作者：斯蒂芬·博伊德、利文·范登贝赫
:orange_book: 《流形上优化导论》作者：尼古拉斯·布马尔
:orange_book: 《机器学习优化讲义》作者：埃拉德·哈赞
:orange_book: 《教授优化导论的现代方法》作者：沃伦·B·鲍威尔
:orange_book: 《贝叶斯优化》作者：罗曼·加内特
:orange_book: 《优化理论基础及其在机器学习中的应用》作者：让·加利耶、乔塞琳·奎恩滕斯
:orange_book: 《优化算法》作者：迈克尔·J·科亨德费尔、蒂姆·A·惠勒

线性回归

:orange_book: 《线性回归的真相》作者：科斯玛·罗希拉·沙利兹
:orange_book: 《岭回归讲义》作者：韦塞尔·N·范·维林根
:orange_book: 《线性模型及其扩展》作者：丁鹏
:orange_book: 《回归及其他故事》作者：安德鲁·盖尔曼、珍妮弗·希尔、阿基·韦赫塔里
:orange_book: 《高维线性回归讲义》作者：阿尔贝托·夸伊尼
:earth_africa: 《利用线性模型分析数据》作者：斯蒂芬妮·M·范登伯格

机器学习

:orange_book: "统计学习导论：Python应用" 詹姆斯、维滕、哈斯蒂、蒂布希拉尼和泰勒著
:orange_book: "统计学习要素" 哈斯蒂、蒂布希拉尼和弗里德曼著
:orange_book: "计算机时代的统计推断：算法、证据与数据科学" 布拉德利·埃夫隆和特雷弗·哈斯蒂著
:orange_book: "模式识别与机器学习" 克里斯托弗·M·毕晓普著
:orange_book: "概率机器学习导论" 凯文·帕特里克·墨菲著
:orange_book: "概率机器学习：高级主题" 凯文·帕特里克·墨菲著
:orange_book: "理解机器学习：从理论到算法" 沙伊·沙列夫-施瓦茨和沙伊·本-大卫著
:orange_book: "机器学习基础" 梅赫里亚尔·莫赫里、阿夫辛·罗斯塔米扎德和阿米特·塔尔瓦卡尔著
:orange_book: "用于机器学习的高斯过程" 卡尔·爱德华·拉斯穆森和克里斯托弗·K·I·威廉姆斯著
:orange_book: "信息论、推理与学习算法" 大卫·J·C·麦凯著
:orange_book: "机器学习算法的数学分析" 张彤著
:orange_book: "机器学习综合指南" 索鲁什·纳西里亚尼、加雷特·托马斯、威廉·王、亚历克斯·杨、珍妮弗·利斯特加滕和阿南特·萨海著
:orange_book: "机器学习课程" 哈尔·达乌梅三世著
:orange_book: "机器学习——工程师与科学家的第一门课程" 安德烈亚斯·林德霍尔姆、尼克拉斯·瓦尔斯特伦、弗雷德里克·林德斯滕和托马斯·B·舍恩著
:orange_book: "自动化机器学习：方法、系统、挑战" 弗兰克·胡特尔、拉尔斯·科特霍夫和华金·范肖伦著
:orange_book: "Python中的统计学与机器学习" 爱德华·杜谢内、汤米·洛夫斯泰特和费基·尤内斯著
:orange_book: "贝叶斯推理与机器学习" 大卫·巴伯著
:orange_book: "提升：基础与算法" 罗伯特·E·沙皮罗和约阿夫·弗伦德著
:orange_book: "决策算法" 迈克尔·J·科亨德费尔、蒂姆·A·惠勒和凯尔·H·雷著
:orange_book: "算法营销导论" 伊利亚·卡佐夫著
:orange_book: "应用数据科学" 伊恩·朗莫尔和丹尼尔·克拉斯纳著
:orange_book: "CS229讲义" 安德鲁·吴和马腾宇著
:orange_book: "随机矩阵方法在机器学习中的应用" 罗曼·库耶和廖振宇著
:orange_book: "机器学习橙皮书" 卡尔·麦克布莱德·埃利斯著
:orange_book: "基于第一原理的学习理论" 弗朗西斯·巴赫著
:orange_book: "从初等视角看高级数据分析" 科斯马·罗希拉·沙利齐著
:orange_book: "机器学习" 汤姆·米切尔著
:orange_book: "使用R进行机器学习和深度学习的超参数调优：实用指南" 编者：伊娃·巴尔茨、托马斯·巴尔茨-拜尔斯坦、马丁·泽费勒和奥拉夫·默斯曼
:orange_book: "数据科学基础" 阿夫里姆·布鲁姆、约翰·霍普克罗夫特和拉文德拉·坎南著
:orange_book: "机器学习系统：工程人工智能系统的原理与实践" 维杰·贾纳帕·雷迪著
:orange_book: "简明机器学习" 乔纳森·理查德·舍丘克著
:orange_book: "数据科学与机器学习：数学与统计方法" 迪尔克·P·克罗塞、兹德拉夫科·I·博特夫、托马斯·泰姆雷和拉季斯拉夫·瓦伊斯曼著
:orange_book: "概率人工智能" 安德烈亚斯·克劳斯和乔纳斯·休博特著
:orange_book: "工程师用机器学习简明介绍" 奥斯瓦尔多·西梅奥内著
:orange_book: "机器学习：基础知识" 亚历山大·荣格著
:orange_book: "面向物理学家的高偏差、低方差机器学习入门" 潘卡杰·梅塔、马林·布科夫、王清浩、亚历山大·G·R·戴、克林特·理查德森、查尔斯·K·费舍尔和戴维·J·施瓦布著
:orange_book: "机器学习中的模型评估、模型选择与算法选择" 塞巴斯蒂安·拉斯奇著
:orange_book: "超参数优化：算法与应用综述" 佟宇和洪珠著
:orange_book: "如何避免机器学习陷阱：学术研究人员指南" 迈克尔·A·洛恩斯著
:orange_book: "在线学习：全面综述" 史蒂文·C·H·霍伊、多延·萨胡、陆静和赵佩琳著
:orange_book: "机器学习导论" 劳伦特·尤内斯著
:earth_africa: "面向科学的监督式机器学习" 克里斯托夫·莫尔纳尔和蒂莫·弗赖斯莱本著
:earth_africa: "Python数据科学手册" 杰克·范德普拉斯著
:earth_africa: "数据分析指南" 迈克·阮著
:earth_africa: "面向表格数据的应用机器学习" 马克斯·库恩和凯尔·约翰逊著
:earth_africa: "Python中的应用机器学习：附带代码的实践指南" 迈克尔·J·皮尔茨著
:earth_africa: "学习数据科学" 萨姆·劳、乔伊·冈萨雷斯和黛布·诺兰著
:earth_africa: "真实数据科学：负责任的数据分析与决策实践" 毕玉和丽贝卡·L·巴特尔著

R 相关

:earth_africa: 奥斯卡·巴鲁法著《R 大书》(Big Book of R)
:earth_africa: 加雷特·格罗勒蒙德著《R 编程实战》(Hands-On Programming with R)
:earth_africa: 布拉德利·博姆克和布兰登·格林韦尔著《R 机器学习实战》(Hands-On Machine Learning with R)
:earth_africa: 莎娜·雷斯·贝内特著《R 数据科学中的线性代数》(Linear Algebra for Data Science with examples in R)
:orange_book: 马雷克·加戈莱夫斯基著《深度 R 编程》(Deep R Programming)
:earth_africa: 科林·吉莱斯皮和罗宾·洛弗莱斯著《高效 R 编程》(Efficient R programming)
:earth_africa: 哈德利·威克汉姆、米妮·切廷卡亚-伦德尔和加雷特·格罗勒蒙德著《R 数据科学》(R for Data Science)
:earth_africa: 哈德利·威克汉姆著《高级 R》(Advanced R)
:earth_africa: 尼尔·巴特拉主编《流行病学家 R 手册》(The Epidemiologist R Handbook)
:earth_africa: 康斯坦丁诺斯·I·布吉乌卡斯著《R 在医学中的实用统计》(Practical Statistics in Medicine with R)
:earth_africa: 朱莉娅·西尔格和戴维·罗宾逊著《R 整洁文本挖掘》(Text Mining with R: A Tidy Approach)
:earth_africa: 保拉·莫拉加著《数据科学空间统计：理论与实践（R 版）》(Spatial Statistics for Data Science: Theory and Practice with R)
:earth_africa: 温斯顿·张著《R 绘图手册》(R Graphics Cookbook)
:earth_africa: 伊吉特·艾德德著《社会科学家与政策分析师工具箱：应用机器学习与 R 的预测分析》(Toolbox for Social Scientists and Policy Analysts: Applied Predictive Analytics with Machine Learning and R)
:earth_africa: 杰玛·费尔南德斯-阿维莱斯·卡尔德龙和何塞-玛丽亚·蒙特罗著《R 数据科学基础》(Fundamentos de ciencia de datos con R)
:earth_africa: 罗伯特·卡巴科夫著《现代 R 数据可视化》(Modern Data Visualization with R)
:earth_africa: 克里斯托夫·汉克、马丁·阿诺德、亚历山大·格尔伯和马丁·施梅尔策著《R 计量经济学导论》(Introduction to Econometrics with R)
:orange_book: 帕特里克·伯恩斯著《R 地狱》(The R Inferno)

特征工程

:earth_africa: 马克斯·库恩和凯尔·约翰逊著《特征工程与选择：预测模型的实用方法》(Feature Engineering and Selection: A Practical Approach for Predictive Models)
:earth_africa: 埃米尔·赫维特费尔特著《特征工程 A-Z》(Feature Engineering A-Z)

可解释性/可理解性

:orange_book: 库什·R·瓦尔什尼著《可信机器学习》(Trustworthy Machine Learning)
:orange_book: 巴林特·穆恰尼、迈克尔·基尔霍夫、埃丽莎·阮、亚历山大·鲁宾斯坦和吴成俊著《可信机器学习：理论、应用与直觉》(Trustworthy Machine Learning: Theory, Applications, Intuitions)
:orange_book: 谢伟哲等著《可解释人工智能全面指南：从经典模型到大型语言模型》(A Comprehensive Guide to Explainable AI: From Classical Models to LLMs)
:orange_book: 韦策尔、哈、伊滕、克洛波泰克和刘著《物理学中的可解释机器学习：综述》(Interpretable Machine Learning in Physics: A Review)
:earth_africa: 克里斯托夫·莫尔纳尔著《可解释机器学习：让黑盒模型可解释的指南》(Interpretable Machine Learning: A Guide for Making Black Box Models Explainable)
:earth_africa: 普热米斯瓦夫·别采克和托马什·布尔齐科夫斯基著《解释性模型分析》(Explanatory Model Analysis)

深度学习 / 神经网络

:orange_book: 朱利叶斯·伯纳、菲利普·格罗斯、吉塔·库蒂尼奥克和菲利普·彼得森著《现代深度学习数学》(The Modern Mathematics of Deep Learning)
:orange_book: 巴特·M.N. 斯梅茨著《神经网络数学》(Mathematics of Neural Networks)
:orange_book: 丹尼尔·A·罗伯茨、肖·亚达和鲍里斯·哈宁著《深度学习理论原理》(The Principles of Deep Learning Theory)
:orange_book: 伯恩哈德·梅利格著《基于神经网络的机器学习》(Machine learning with neural networks)
:orange_book: 阿斯顿·张、扎卡里·C·利普顿、穆·李和亚历山大·J·斯莫拉著《深入深度学习》(Dive into Deep Learning)
:orange_book: 姚马和唐继良著《图上的深度学习》(Deep Learning on Graphs)
:orange_book: 尼尔斯·图雷、菲利普·霍尔、马克西米利安·穆勒、帕特里克·施奈尔、费利克斯·特罗斯和基翁·乌姆著《基于物理的深度学习》(Physics-based Deep Learning)
:orange_book: 西蒙·J.D. 普林斯著《理解深度学习》(Understanding Deep Learning)
:orange_book: 弗朗索瓦·弗勒雷著《深度学习小书》(The Little Book of Deep Learning)
:orange_book: 阿努尔夫·延岑、本诺·库库克和菲利普·冯·武斯特恩贝格著《深度学习数学入门：方法、实现与理论》(Mathematical Introduction to Deep Learning: Methods, Implementations, and Theory)
:orange_book: 菲利普·彼得森和雅各布·泽赫著《深度学习数学理论》(Mathematical theory of deep learning)
:orange_book: 桑杰夫·阿罗拉等人著《深度学习理论》(Theory of Deep Learning)
:orange_book: 胡安·特尔文、黛安娜·M·科尔多瓦-埃斯帕萨、阿方索·拉米雷斯-佩德拉萨、埃德加·A·查韦斯-乌尔比奥拉和胡里奥·A·罗梅罗-冈萨雷斯著《深度学习中的损失函数与评估指标》(Loss Functions and Metrics in Deep Learning)
:orange_book: 奇塔·兰詹著《理解深度学习》(Understanding Deep Learning)
:earth_africa: 克里斯托弗·M·毕晓普和休·毕晓普著《深度学习：基础与概念》(Deep Learning: Foundations and Concepts)
:earth_africa: 杰里米·霍华德和西尔万·古格著《使用 fastai 和 PyTorch 的编码者深度学习：无需博士学位的 AI 应用》(Deep Learning for Coders with fastai and PyTorch: AI Applications Without a PhD)
:earth_africa: 弗朗索瓦·肖莱和马修·沃森著《Python 深度学习（第三版）》(Deep Learning with Python, Third Edition)

强化学习

:orange_book: 《强化学习：导论》作者：理查德·S·萨顿、安德鲁·G·巴托
:orange_book: 《多智能体强化学习》作者：斯特法诺·V·阿尔布雷希特、菲利波斯·克里斯蒂亚诺斯、卢卡斯·舍费尔
:orange_book: 《分布强化学习》作者：马克·G·贝勒马尔、威尔·达布尼、马克·罗兰
:orange_book: 《强化学习的数学基础》作者：赵世宇
:orange_book: 《强化学习：基础》作者：希耶·曼诺尔、伊沙伊·曼苏尔、阿维夫·塔马尔
:orange_book: 《强化学习概述》作者：凯文·墨菲
:orange_book: 《深度强化学习导论》作者：文森特·弗朗索瓦-拉韦、彼得·亨德森、里亚沙特·伊斯兰、马克·G·贝勒马尔、乔埃尔·皮诺
:orange_book: 《强化学习的数学》作者：莱夫·多林

异常检测

:earth_africa: 《太奇怪了！使用R进行异常检测》作者：罗布·J·海因德曼

计算机视觉

:orange_book: 《计算机视觉：模型、学习与推理》作者：西蒙·J·D·普林斯
:orange_book: 《计算机视觉：算法与应用》（第1版）作者：理查德·塞利斯基
:earth_africa: 《计算机视觉基础》作者：安东尼奥·托拉尔巴、菲利普·伊索拉、威廉·弗里曼

自然语言处理（NLP）和大型语言模型（LLM）

:orange_book: 《语音与语言处理：自然语言处理、计算语言学与语音识别导论》作者：丹·朱拉夫斯基、詹姆斯·H·马丁
:orange_book: 《大型语言模型》作者：迈克尔·R·道格拉斯
:orange_book: 《面向自然语言处理的图神经网络：综述》作者：吴凌飞、陈宇、沈凯、郭晓杰、高汉宁、李书诚、裴健、龙博
:orange_book: 《语言建模的形式化方面》作者：瑞安·科特雷尔、阿内伊·斯韦特、克拉拉·迈斯特、刘天宇、杜莉
:orange_book: 《自然语言处理的基础模型》作者：格哈德·帕斯、斯文·吉塞尔巴赫
:orange_book: 《什么是嵌入》作者：维姬·博伊基斯
:orange_book: 《大型语言模型综述》作者：韦恩·辛·赵等
:orange_book: 《大型语言模型：综述》作者：谢尔文·米纳伊等
:orange_book: 《大型语言模型综合概述》作者：胡姆扎·纳维德等
:orange_book: 《关于大型语言模型的综述及其能力与局限性的见解》作者：安德烈亚·马塔拉佐、里卡多·托尔洛内
:orange_book: 《大型语言模型的基础》作者：肖彤、朱景波
:earth_africa: 《用R进行文本挖掘：整洁的方法》作者：朱莉娅·西尔格、大卫·罗宾逊
:earth_africa: 《用Python进行自然语言处理——使用自然语言工具包分析文本》作者：史蒂文·伯德、伊万·克莱因、爱德华·洛珀

因果推断

:orange_book: 《因果机器学习：综述与开放问题》作者：让·卡杜尔、埃昂格斯·林奇、刘琪、马特·J·库斯纳、里卡多·席尔瓦
:orange_book: 《因果推断与机器学习的最新进展》作者：珍妮·E·布兰德、周翔、谢宇
:orange_book: 《因果推断入门课程》作者：丁鹏
:orange_book: 《因果因子投资》作者：马科斯·M·洛佩斯·德·普拉多
:orange_book: 《时间序列因果发现方法的调查与评估》作者：查尔斯·K·阿萨德、艾米莉·德维日韦、埃里克·戈西耶
:orange_book: 《由ML和AI驱动的应用因果推断》作者：维克托·切尔诺祖科夫、克里斯蒂安·汉森、内森·卡卢斯、马丁·施平德勒、瓦西里斯·西尔加尼斯
:orange_book: 《因果推断：统计学习方法》作者：斯特凡·韦格尔
:orange_book: 《概率与因果：条件效应与平均总效应》作者：罗尔夫·施泰耶
:orange_book: 《如果……会怎样》作者：米格尔·A·埃尔南、詹姆斯·M·罗宾斯
:orange_book: 《因果人工智能》作者：埃利亚斯·巴雷因博伊姆
:earth_africa: 《应用因果推断》作者：乌代·卡马特、肯尼思·格雷厄姆、米切尔·奈勒
:earth_africa: 《勇敢者与真诚者的因果推断》作者：马修斯·法库雷·阿尔维斯
:earth_africa: 《如何使用marginaleffects解读R和Python中的统计模型》作者：文森特·阿雷尔-邦多克、诺亚·格赖弗、安德鲁·海斯

保形预测

:orange_book: 格伦·谢弗和弗拉基米尔·沃夫克所著的《保形预测教程》（arxiv.org/pdf/0706.3188.pdf）
:orange_book: 马泰奥·丰塔纳、詹卢卡·泽尼和西蒙内·万蒂尼所著的《保形预测：理论统一回顾与新挑战》（arxiv.org/pdf/2005.07972.pdf）
:orange_book: 安纳斯塔西奥斯·N·安杰洛普洛斯和史蒂芬·贝茨所著的《保形预测与无分布不确定性量化入门》（arxiv.org/pdf/2107.07511.pdf）
:orange_book: 安纳斯塔西奥斯·N·安杰洛普洛斯、丽娜·福伊格尔·巴伯和史蒂芬·贝茨所著的《保形预测的理论基础》（arxiv.org/pdf/2411.11824）
:orange_book: 拉斐尔·伊兹比基所著的《机器学习超越点预测：不确定性量化》（rafaelizbicki.com/UQ4ML.pdf）

时间序列：预测

:earth_africa: 罗布·J·欣德曼和乔治·阿塔纳索普洛斯所著的《预测：原理与实践》（otexts.com/fpp3/）
:earth_africa: 罗布·J·欣德曼、乔治·阿塔纳索普洛斯、阿祖尔·加尔萨、克里斯蒂安·查卢、马克斯·梅尔根塔勒和金·G·奥利瓦雷斯合著的《预测：原理与实践——Python式方法》（otexts.com/fpppy/）
:orange_book: 弗提奥斯·佩特罗普洛斯等人所著的《预测：理论与实践》（arxiv.org/pdf/2012.03854.pdf）
:earth_africa: 《预测：理论与实践》（在线版）（forecasting-encyclopedia.com），编者：弗提奥斯·佩特罗普洛斯、颜飞·康和冯莉
:orange_book: 汉西卡·赫瓦马拉吉亚、克劳斯·阿克曼和克里斯托夫·贝格迈尔所著的《数据科学家的预测评估：常见误区与最佳实践》（arxiv.org/pdf/2203.10716.pdf）
:orange_book: 亚历山大·奥伊所著的《时间序列分析》（batch.libretexts.org/print/Letter/Finished/stats-826/Full.pdf）
:orange_book: 约翰·H·科克伦所著的《宏观经济学与金融的时间序列》（static1.squarespace.com/static/5e6033a4ea02d801f37e15bb/t/5ed92dcb7665261af1aa23f2/1591291342389/time_series_book.pdf）
:earth_africa: 斯特凡·科拉萨、巴赫曼·罗斯塔米-塔巴尔和恩诺·齐姆森合著的《面向高管与专业人士的需求预测》（dfep.netlify.app）

Compendium-of-free-ML-reading-resources 快速上手指南

本资源库并非软件工具，而是一个精心整理的免费机器学习阅读资源清单。它汇集了 193 本由作者或出版商免费开放的电子书（PDF 格式）和在线书籍（HTML 格式），涵盖从数据清洗、数学基础到深度学习、大语言模型等全方位主题。

开发者无需安装任何环境，只需通过浏览器访问链接或直接下载 PDF 即可开始学习。

环境准备

系统要求：无特定限制，支持 Windows、macOS、Linux 等所有主流操作系统。
前置依赖：
- 现代网页浏览器（推荐 Chrome, Edge, Firefox）用于阅读在线书籍。
- PDF 阅读器（如 Adobe Acrobat, SumatraPDF 或浏览器内置阅读器）用于阅读离线文档。
- （可选）稳定的网络连接，部分资源托管于 GitHub、arXiv 或个人主页，国内访问速度可能波动。

获取与使用步骤

由于本项目是资源索引，不存在传统的“安装”过程。以下是高效使用本资源库的步骤：

1. 访问资源列表

直接访问该项目的 GitHub 仓库页面或 README 文件，查看完整的目录结构（ToC）。

2. 按需选择资源

根据你当前的学习阶段或需求，在以下分类中查找对应书籍：

入门基础：查看 EDA, visualization, and data cleaning 或 Mathematics for ML。
核心算法：重点阅读 Machine Learning (包含经典的 ESL 和 ISLP) 或 Deep learning / neural networks。
进阶专题：参考 Reinforcement learning, NLP and LLM, Causal inference 等章节。

提示：

🟠 :orange_book: 代表 PDF 文件，点击链接可直接下载或在线阅读。

🌍 :earth_africa: 代表 HTML 在线书籍，适合交互式阅读。

3. 下载与保存（示例）

以机器学习领域的“圣经”之一 The Elements of Statistical Learning 为例：

在 Machine learning 章节找到该书条目。

点击下载链接：

https://hastie.su.domains/ElemStatLearn/printings/ESLII_print12_toc.pdf.download.html

将文件保存至本地知识库目录，例如：

# Linux/macOS 示例：使用 wget 下载
wget -O ESL_2nd_Edition.pdf "https://hastie.su.domains/ElemStatLearn/printings/ESLII_print12_toc.pdf.download.html"

# Windows PowerShell 示例
Invoke-WebRequest -Uri "https://hastie.su.domains/ElemStatLearn/printings/ESLII_print12_toc.pdf.download.html" -OutFile "ESL_2nd_Edition.pdf"

4. 国内访问加速建议

部分国外托管资源（如 Google Drive, Dropbox, 或部分大学服务器）在国内访问可能较慢或受限。建议采取以下方案：

使用镜像站：若链接指向 arXiv 论文，可尝试将域名替换为国内镜像（如 arxiv.org 替换为 arxiv.cn 或使用中科大镜像）。
代理工具：配置系统级或浏览器代理以加速加载。
社区搬运：在知乎、CSDN 或国内技术论坛搜索书名，常有热心开发者上传的百度网盘或阿里云盘备份。

基本使用场景

场景：快速查阅线性代数基础

打开资源列表，定位到 Mathematics for ML 章节。
选择适合初学者的 Linear Algebra Done Right 或侧重应用的 Introduction to Applied Linear Algebra。
点击对应的 🟠 PDF 链接。
利用 PDF 阅读器的搜索功能（Ctrl+F / Cmd+F），直接检索关键词（如 "Eigenvalue", "SVD"）进行针对性学习。

场景：构建个人 ML 学习路径

浏览 ToC 目录，按照从 Statistics -> Optimization -> Machine Learning -> Deep Learning 的顺序。
依次下载每个类别下的顶置推荐书籍（通常为该领域最经典且免费的版本）。
建立本地文件夹结构进行分类管理，开始系统化自学。

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

★ 349.3k|★★★☆☆|3天前

Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|4天前

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 147.9k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 108.1k|★★☆☆☆|昨天

开发框架图像Agent

markitdown

MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器

★ 93.4k|★★☆☆☆|3天前

插件开发框架

LLMs-from-scratch

LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目，旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型（LLM）。它不仅是同名技术著作的官方代码库，更提供了一套完整的实践方案，涵盖模型开发、预训练及微调的全过程。该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型，却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码，用户能够透彻掌握 Transformer 架构、注意力机制等关键原理，从而真正理解大模型是如何“思考”的。此外，项目还包含了加载大型预训练权重进行微调的代码，帮助用户将理论知识延伸至实际应用。 LLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API，而是渴望探究模型构建细节的技术人员而言，这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计：将复杂的系统工程拆解为清晰的步骤，配合详细的图表与示例，让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础，还是为未来研发更大规模的模型做准备

★ 90.1k|★★★☆☆|3天前

语言模型图像Agent

使用场景

没有 Compendium-of-free-ML-reading-resources 时

使用 Compendium-of-free-ML-reading-resources 后

运行环境要求

快速开始

免费机器学习阅读资源汇总

目录

EDA、可视化与数据清洗

机器学习数学基础

统计学与概率论

优化

线性回归

机器学习

R 相关

特征工程

可解释性/可理解性

深度学习 / 神经网络

强化学习

推荐系统

异常检测

计算机视觉

自然语言处理（NLP）和大型语言模型（LLM）

因果推断

保形预测

时间序列：预测

Compendium-of-free-ML-reading-resources 快速上手指南

环境准备

获取与使用步骤

1. 访问资源列表

2. 按需选择资源

3. 下载与保存（示例）

4. 国内访问加速建议

基本使用场景

相似工具推荐

openclaw

stable-diffusion-webui

everything-claude-code

ComfyUI

markitdown

LLMs-from-scratch