Compendium-of-free-ML-reading-resources
Compendium-of-free-ML-reading-resources 是一个精心整理的机器学习免费学习资源库,旨在为学习者提供一站式的高质量阅读材料。它解决了大家在寻找权威、系统且免费的机器学习书籍和论文时面临的资源分散、质量参差不齐的痛点。
该资源库涵盖了从数据清洗、可视化、数学基础、统计学,到线性回归、传统机器学习、深度学习、强化学习,再到自然语言处理、因果推断等前沿领域的 193 本免费书籍。每本书都标注了格式(PDF 或在线 HTML 版),并提供了直接访问链接,所有资源均经作者或出版方合法免费发布。
无论是刚入门的学生、希望系统提升的开发者,还是从事相关研究的研究人员,都能在这里找到适合自己的学习资料。其独特之处在于分类清晰、覆盖全面,并特别收录了许多经典教材的最新免费版本以及 arXiv 上的重要论文,极大降低了高质量学习的门槛。如果你正在规划机器学习的学习路径,或需要查阅某个专题的权威资料,Compendium-of-free-ML-reading-resources 将是你值得信赖的起点。
使用场景
一位刚转行进入算法团队的初级数据科学家,正试图从零构建一个金融风控预测模型,却因理论基础薄弱而陷入学习瓶颈。
没有 Compendium-of-free-ML-reading-resources 时
- 资源筛选成本极高:在海量网络教程中盲目搜索“线性代数”或“特征工程”,难以辨别资料质量,常花费数天阅读过时或不严谨的内容。
- 知识体系支离破碎:东拼西凑的学习路径导致数学推导(如矩阵微积分)与代码实现(如 Python 数据清洗)脱节,无法理解模型背后的核心逻辑。
- 经济门槛阻碍深入:遇到《Python for Data Analysis》等经典著作时,常因付费墙或高昂书费而止步,只能依赖零散的二手笔记。
- 专项领域无从下手:面对“因果推断”或“可解释性”等进阶需求时,找不到系统性的免费权威指南,导致模型上线后无法通过业务评审。
使用 Compendium-of-free-ML-reading-resources 后
- 一站式获取权威教材:直接定位到 Wes McKinney 的《Python for Data Analysis》和 Marc Peter Deisenroth 的《Mathematics for Machine Learning》等 193 本免费正版书籍,瞬间建立高标准知识库。
- 构建结构化学习路径:依托清晰的目录分类(从 EDA 到深度学习),按图索骥补齐数学短板,将理论公式与代码实践无缝对接。
- 零成本突破专业壁垒:免费下载包括统计学、优化理论及 NLP 大模型在内的全套 PDF 或在线书籍,无需预算即可掌握行业顶尖知识。
- 精准解决业务痛点:针对风控场景特有的“异常检测”和“因果推断”需求,快速查阅专项章节,迅速产出符合合规要求的高可解释性模型。
Compendium-of-free-ML-reading-resources 将原本需要数月摸索的自学过程压缩为几周的系统化攻坚,让开发者以零成本获得媲美顶尖实验室的知识储备。
运行环境要求
未说明
未说明

快速开始
免费机器学习阅读资源汇总
说明:
- :orange_book: PDF 文件
- :earth_africa: HTML 书籍
目录
- EDA、可视化与数据清洗 (8)
- 机器学习数学基础 (13)
- 统计学与概率论 (16)
- 优化方法 (7)
- 线性回归 (6)
- 机器学习 (48)
- R 相关 (18)
- 特征工程 (2)
- 可解释性/模型解释 (6)
- 深度学习/神经网络 (17)
- 强化学习 (8)
- 推荐系统 (2)
- 异常检测 (1)
- 计算机视觉 (3)
- 自然语言处理 (NLP) 与大型语言模型 (LLM) (13)
- 因果推断 (13)
- 一致性预测 (5)
- 时间序列:预测 (6)
书籍总数:193
注:此处列出的所有书籍均由其作者或出版商免费提供,所有 arXiv 论文本身也是免费的。
EDA、可视化与数据清洗
- :earth_africa: "Python 数据分析(第3版)" 作者:Wes McKinney
- :earth_africa: "缺失值的灵活插补" 作者:Stef van Buuren
- :earth_africa: "数据可视化基础" 作者:Claus O. Wilke
- :earth_africa: "R 图形 Cookbook" 作者:Winston Chang
- :earth_africa: "使用 R 的现代数据可视化" 作者:Robert Kabacoff
- :orange_book: "数据清洗与机器学习:系统性文献综述" 作者:Pierre-Olivier Côté, Amin Nikanjam, Nafisa Ahmed, Dmytro Humeniuk, 和 Foutse Khomh
- :orange_book: "Think Stats:用 Python 进行探索性数据分析" 作者:Allen B. Downey
- :orange_book: "SQL 专业笔记"
机器学习数学基础
- :orange_book: "机器学习数学" 作者:Marc Peter Deisenroth, A. Aldo Faisal, 和 Cheng Soon Ong
- :orange_book: "深度学习所需的矩阵微积分" 作者:Terence Parr 和 Jeremy Howard
- :orange_book: "矩阵分析" 作者:Joel A. Tropp
- :orange_book: "线性代数做对了" 作者:Sergei Treil
- :orange_book: "线性代数正确做法" 作者:Sheldon Axler
- :orange_book: "线性代数:理论与应用" 作者:Kenneth Kuttler
- :orange_book: "矩阵手册" 作者:Kaare Brandt Petersen 和 Michael Syskind Pedersen
- :orange_book: "应用线性代数导论:向量、矩阵与最小二乘法" 作者:Stephen Boyd 和 Lieven Vandenberghe
- :orange_book: "面向数据科学的线性代数" 作者:Wanmo Kang 和 Kyunghyun Cho
- :orange_book: "面向计算机视觉、机器人和机器学习的线性代数" 作者:Jean Gallier 和 Jocelyn Quaintance
- :orange_book: "矩阵微积分(用于机器学习及其他领域)" 作者:Paige Bright、Alan Edelman、Steven G. Johnson
- :orange_book: "面向计算机科学和机器学习的代数、拓扑、微分计算与优化理论" 作者:Jean Gallier 和 Jocelyn Quaintance
- :orange_book: "数据科学线性代数基础" 作者:Wanmo Kang 和 Kyunghyun Cho
- :earth_africa: "带有 R 示例的数据科学线性代数" 作者:Shaina Race Bennett
统计学与概率论
- :orange_book: 《概率与统计——不确定性之科学》 作者:迈克尔·J·埃文斯、杰弗里·S·罗森塔尔
- :orange_book: 《高维概率》 作者:乔尔·A·特罗普
- :orange_book: 《概率导论》 作者:约瑟夫·K·布利茨施泰因、杰西卡·黄
- :orange_book: 《中心极限定理史:从经典到现代概率论》 作者:汉斯·费舍尔
- :orange_book: 《思考贝叶斯:简单易懂的贝叶斯统计》 作者:艾伦·B·道尼
- :orange_book: 《贝叶斯统计导论》 作者:布伦登·J·布鲁尔
- :orange_book: 《使用Jamovi学习统计学》 作者:丹妮尔·J·纳瓦罗、大卫·R·福克斯克罗夫特
- :orange_book: 《贝叶斯数据分析》 作者:安德鲁·盖尔曼、约翰·卡尔林、哈尔·斯特恩、大卫·邓森、阿基·韦赫塔里、唐纳德·鲁宾
- :orange_book: 《常见概率分布简编》 作者:迈克尔·P·麦克劳克林
- :orange_book: 《数据科学中的概率与统计》 作者:卡洛斯·费尔南德斯-格兰达
- :orange_book: 《统计建模:14个主题巡礼》 作者:莱因哈德·富勒
- :orange_book: 《稳健统计》 作者:大卫·J·奥利夫
- :orange_book: 《CS109 计算机科学家的概率论》 作者:克里斯·皮奇
- :orange_book: 《点滴之间:以视觉为重点介绍概率与决策》 作者:乔纳森·魏斯伯格
- :orange_book: 《格里斯廷和斯奈尔的概率导论》 作者:彼得·G·多伊尔
- :orange_book: 《高维概率:带数据科学应用的入门》 作者:罗曼·维尔希宁
优化
- :orange_book: 《凸优化》 作者:斯蒂芬·博伊德、利文·范登贝赫
- :orange_book: 《流形上优化导论》 作者:尼古拉斯·布马尔
- :orange_book: 《机器学习优化讲义》 作者:埃拉德·哈赞
- :orange_book: 《教授优化导论的现代方法》 作者:沃伦·B·鲍威尔
- :orange_book: 《贝叶斯优化》 作者:罗曼·加内特
- :orange_book: 《优化理论基础及其在机器学习中的应用》 作者:让·加利耶、乔塞琳·奎恩滕斯
- :orange_book: 《优化算法》 作者:迈克尔·J·科亨德费尔、蒂姆·A·惠勒
线性回归
- :orange_book: 《线性回归的真相》 作者:科斯玛·罗希拉·沙利兹
- :orange_book: 《岭回归讲义》 作者:韦塞尔·N·范·维林根
- :orange_book: 《线性模型及其扩展》 作者:丁鹏
- :orange_book: 《回归及其他故事》 作者:安德鲁·盖尔曼、珍妮弗·希尔、阿基·韦赫塔里
- :orange_book: 《高维线性回归讲义》 作者:阿尔贝托·夸伊尼
- :earth_africa: 《利用线性模型分析数据》 作者:斯蒂芬妮·M·范登伯格
机器学习
- :orange_book: "统计学习导论:Python应用" 詹姆斯、维滕、哈斯蒂、蒂布希拉尼和泰勒著
- :orange_book: "统计学习要素" 哈斯蒂、蒂布希拉尼和弗里德曼著
- :orange_book: "计算机时代的统计推断:算法、证据与数据科学" 布拉德利·埃夫隆和特雷弗·哈斯蒂著
- :orange_book: "模式识别与机器学习" 克里斯托弗·M·毕晓普著
- :orange_book: "概率机器学习导论" 凯文·帕特里克·墨菲著
- :orange_book: "概率机器学习:高级主题" 凯文·帕特里克·墨菲著
- :orange_book: "理解机器学习:从理论到算法" 沙伊·沙列夫-施瓦茨和沙伊·本-大卫著
- :orange_book: "机器学习基础" 梅赫里亚尔·莫赫里、阿夫辛·罗斯塔米扎德和阿米特·塔尔瓦卡尔著
- :orange_book: "用于机器学习的高斯过程" 卡尔·爱德华·拉斯穆森和克里斯托弗·K·I·威廉姆斯著
- :orange_book: "信息论、推理与学习算法" 大卫·J·C·麦凯著
- :orange_book: "机器学习算法的数学分析" 张彤著
- :orange_book: "机器学习综合指南" 索鲁什·纳西里亚尼、加雷特·托马斯、威廉·王、亚历克斯·杨、珍妮弗·利斯特加滕和阿南特·萨海著
- :orange_book: "机器学习课程" 哈尔·达乌梅三世著
- :orange_book: "机器学习——工程师与科学家的第一门课程" 安德烈亚斯·林德霍尔姆、尼克拉斯·瓦尔斯特伦、弗雷德里克·林德斯滕和托马斯·B·舍恩著
- :orange_book: "自动化机器学习:方法、系统、挑战" 弗兰克·胡特尔、拉尔斯·科特霍夫和华金·范肖伦著
- :orange_book: "Python中的统计学与机器学习" 爱德华·杜谢内、汤米·洛夫斯泰特和费基·尤内斯著
- :orange_book: "贝叶斯推理与机器学习" 大卫·巴伯著
- :orange_book: "提升:基础与算法" 罗伯特·E·沙皮罗和约阿夫·弗伦德著
- :orange_book: "决策算法" 迈克尔·J·科亨德费尔、蒂姆·A·惠勒和凯尔·H·雷著
- :orange_book: "算法营销导论" 伊利亚·卡佐夫著
- :orange_book: "应用数据科学" 伊恩·朗莫尔和丹尼尔·克拉斯纳著
- :orange_book: "CS229讲义" 安德鲁·吴和马腾宇著
- :orange_book: "随机矩阵方法在机器学习中的应用" 罗曼·库耶和廖振宇著
- :orange_book: "机器学习橙皮书" 卡尔·麦克布莱德·埃利斯著
- :orange_book: "基于第一原理的学习理论" 弗朗西斯·巴赫著
- :orange_book: "从初等视角看高级数据分析" 科斯马·罗希拉·沙利齐著
- :orange_book: "机器学习" 汤姆·米切尔著
- :orange_book: "使用R进行机器学习和深度学习的超参数调优:实用指南" 编者:伊娃·巴尔茨、托马斯·巴尔茨-拜尔斯坦、马丁·泽费勒和奥拉夫·默斯曼
- :orange_book: "数据科学基础" 阿夫里姆·布鲁姆、约翰·霍普克罗夫特和拉文德拉·坎南著
- :orange_book: "机器学习系统:工程人工智能系统的原理与实践" 维杰·贾纳帕·雷迪著
- :orange_book: "简明机器学习" 乔纳森·理查德·舍丘克著
- :orange_book: "数据科学与机器学习:数学与统计方法" 迪尔克·P·克罗塞、兹德拉夫科·I·博特夫、托马斯·泰姆雷和拉季斯拉夫·瓦伊斯曼著
- :orange_book: "概率人工智能" 安德烈亚斯·克劳斯和乔纳斯·休博特著
- :orange_book: "工程师用机器学习简明介绍" 奥斯瓦尔多·西梅奥内著
- :orange_book: "机器学习:基础知识" 亚历山大·荣格著
- :orange_book: "面向物理学家的高偏差、低方差机器学习入门" 潘卡杰·梅塔、马林·布科夫、王清浩、亚历山大·G·R·戴、克林特·理查德森、查尔斯·K·费舍尔和戴维·J·施瓦布著
- :orange_book: "机器学习中的模型评估、模型选择与算法选择" 塞巴斯蒂安·拉斯奇著
- :orange_book: "超参数优化:算法与应用综述" 佟宇和洪珠著
- :orange_book: "如何避免机器学习陷阱:学术研究人员指南" 迈克尔·A·洛恩斯著
- :orange_book: "在线学习:全面综述" 史蒂文·C·H·霍伊、多延·萨胡、陆静和赵佩琳著
- :orange_book: "机器学习导论" 劳伦特·尤内斯著
- :earth_africa: "面向科学的监督式机器学习" 克里斯托夫·莫尔纳尔和蒂莫·弗赖斯莱本著
- :earth_africa: "Python数据科学手册" 杰克·范德普拉斯著
- :earth_africa: "数据分析指南" 迈克·阮著
- :earth_africa: "面向表格数据的应用机器学习" 马克斯·库恩和凯尔·约翰逊著
- :earth_africa: "Python中的应用机器学习:附带代码的实践指南" 迈克尔·J·皮尔茨著
- :earth_africa: "学习数据科学" 萨姆·劳、乔伊·冈萨雷斯和黛布·诺兰著
- :earth_africa: "真实数据科学:负责任的数据分析与决策实践" 毕玉和丽贝卡·L·巴特尔著
R 相关
- :earth_africa: 奥斯卡·巴鲁法著《R 大书》(Big Book of R)
- :earth_africa: 加雷特·格罗勒蒙德著《R 编程实战》(Hands-On Programming with R)
- :earth_africa: 布拉德利·博姆克和布兰登·格林韦尔著《R 机器学习实战》(Hands-On Machine Learning with R)
- :earth_africa: 莎娜·雷斯·贝内特著《R 数据科学中的线性代数》(Linear Algebra for Data Science with examples in R)
- :orange_book: 马雷克·加戈莱夫斯基著《深度 R 编程》(Deep R Programming)
- :earth_africa: 科林·吉莱斯皮和罗宾·洛弗莱斯著《高效 R 编程》(Efficient R programming)
- :earth_africa: 哈德利·威克汉姆、米妮·切廷卡亚-伦德尔和加雷特·格罗勒蒙德著《R 数据科学》(R for Data Science)
- :earth_africa: 哈德利·威克汉姆著《高级 R》(Advanced R)
- :earth_africa: 尼尔·巴特拉主编《流行病学家 R 手册》(The Epidemiologist R Handbook)
- :earth_africa: 康斯坦丁诺斯·I·布吉乌卡斯著《R 在医学中的实用统计》(Practical Statistics in Medicine with R)
- :earth_africa: 朱莉娅·西尔格和戴维·罗宾逊著《R 整洁文本挖掘》(Text Mining with R: A Tidy Approach)
- :earth_africa: 保拉·莫拉加著《数据科学空间统计:理论与实践(R 版)》(Spatial Statistics for Data Science: Theory and Practice with R)
- :earth_africa: 温斯顿·张著《R 绘图手册》(R Graphics Cookbook)
- :earth_africa: 伊吉特·艾德德著《社会科学家与政策分析师工具箱:应用机器学习与 R 的预测分析》(Toolbox for Social Scientists and Policy Analysts: Applied Predictive Analytics with Machine Learning and R)
- :earth_africa: 杰玛·费尔南德斯-阿维莱斯·卡尔德龙和何塞-玛丽亚·蒙特罗著《R 数据科学基础》(Fundamentos de ciencia de datos con R)
- :earth_africa: 罗伯特·卡巴科夫著《现代 R 数据可视化》(Modern Data Visualization with R)
- :earth_africa: 克里斯托夫·汉克、马丁·阿诺德、亚历山大·格尔伯和马丁·施梅尔策著《R 计量经济学导论》(Introduction to Econometrics with R)
- :orange_book: 帕特里克·伯恩斯著《R 地狱》(The R Inferno)
特征工程
- :earth_africa: 马克斯·库恩和凯尔·约翰逊著《特征工程与选择:预测模型的实用方法》(Feature Engineering and Selection: A Practical Approach for Predictive Models)
- :earth_africa: 埃米尔·赫维特费尔特著《特征工程 A-Z》(Feature Engineering A-Z)
可解释性/可理解性
- :orange_book: 库什·R·瓦尔什尼著《可信机器学习》(Trustworthy Machine Learning)
- :orange_book: 巴林特·穆恰尼、迈克尔·基尔霍夫、埃丽莎·阮、亚历山大·鲁宾斯坦和吴成俊著《可信机器学习:理论、应用与直觉》(Trustworthy Machine Learning: Theory, Applications, Intuitions)
- :orange_book: 谢伟哲等著《可解释人工智能全面指南:从经典模型到大型语言模型》(A Comprehensive Guide to Explainable AI: From Classical Models to LLMs)
- :orange_book: 韦策尔、哈、伊滕、克洛波泰克和刘著《物理学中的可解释机器学习:综述》(Interpretable Machine Learning in Physics: A Review)
- :earth_africa: 克里斯托夫·莫尔纳尔著《可解释机器学习:让黑盒模型可解释的指南》(Interpretable Machine Learning: A Guide for Making Black Box Models Explainable)
- :earth_africa: 普热米斯瓦夫·别采克和托马什·布尔齐科夫斯基著《解释性模型分析》(Explanatory Model Analysis)
深度学习 / 神经网络
- :orange_book: 朱利叶斯·伯纳、菲利普·格罗斯、吉塔·库蒂尼奥克和菲利普·彼得森著《现代深度学习数学》(The Modern Mathematics of Deep Learning)
- :orange_book: 巴特·M.N. 斯梅茨著《神经网络数学》(Mathematics of Neural Networks)
- :orange_book: 丹尼尔·A·罗伯茨、肖·亚达和鲍里斯·哈宁著《深度学习理论原理》(The Principles of Deep Learning Theory)
- :orange_book: 伯恩哈德·梅利格著《基于神经网络的机器学习》(Machine learning with neural networks)
- :orange_book: 阿斯顿·张、扎卡里·C·利普顿、穆·李和亚历山大·J·斯莫拉著《深入深度学习》(Dive into Deep Learning)
- :orange_book: 姚马和唐继良著《图上的深度学习》(Deep Learning on Graphs)
- :orange_book: 尼尔斯·图雷、菲利普·霍尔、马克西米利安·穆勒、帕特里克·施奈尔、费利克斯·特罗斯和基翁·乌姆著《基于物理的深度学习》(Physics-based Deep Learning)
- :orange_book: 西蒙·J.D. 普林斯著《理解深度学习》(Understanding Deep Learning)
- :orange_book: 弗朗索瓦·弗勒雷著《深度学习小书》(The Little Book of Deep Learning)
- :orange_book: 阿努尔夫·延岑、本诺·库库克和菲利普·冯·武斯特恩贝格著《深度学习数学入门:方法、实现与理论》(Mathematical Introduction to Deep Learning: Methods, Implementations, and Theory)
- :orange_book: 菲利普·彼得森和雅各布·泽赫著《深度学习数学理论》(Mathematical theory of deep learning)
- :orange_book: 桑杰夫·阿罗拉等人著《深度学习理论》(Theory of Deep Learning)
- :orange_book: 胡安·特尔文、黛安娜·M·科尔多瓦-埃斯帕萨、阿方索·拉米雷斯-佩德拉萨、埃德加·A·查韦斯-乌尔比奥拉和胡里奥·A·罗梅罗-冈萨雷斯著《深度学习中的损失函数与评估指标》(Loss Functions and Metrics in Deep Learning)
- :orange_book: 奇塔·兰詹著《理解深度学习》(Understanding Deep Learning)
- :earth_africa: 克里斯托弗·M·毕晓普和休·毕晓普著《深度学习:基础与概念》(Deep Learning: Foundations and Concepts)
- :earth_africa: 杰里米·霍华德和西尔万·古格著《使用 fastai 和 PyTorch 的编码者深度学习:无需博士学位的 AI 应用》(Deep Learning for Coders with fastai and PyTorch: AI Applications Without a PhD)
- :earth_africa: 弗朗索瓦·肖莱和马修·沃森著《Python 深度学习(第三版)》(Deep Learning with Python, Third Edition)
强化学习
- :orange_book: 《强化学习:导论》 作者:理查德·S·萨顿、安德鲁·G·巴托
- :orange_book: 《多智能体强化学习》 作者:斯特法诺·V·阿尔布雷希特、菲利波斯·克里斯蒂亚诺斯、卢卡斯·舍费尔
- :orange_book: 《分布强化学习》 作者:马克·G·贝勒马尔、威尔·达布尼、马克·罗兰
- :orange_book: 《强化学习的数学基础》 作者:赵世宇
- :orange_book: 《强化学习:基础》 作者:希耶·曼诺尔、伊沙伊·曼苏尔、阿维夫·塔马尔
- :orange_book: 《强化学习概述》 作者:凯文·墨菲
- :orange_book: 《深度强化学习导论》 作者:文森特·弗朗索瓦-拉韦、彼得·亨德森、里亚沙特·伊斯兰、马克·G·贝勒马尔、乔埃尔·皮诺
- :orange_book: 《强化学习的数学》 作者:莱夫·多林
推荐系统
异常检测
- :earth_africa: 《太奇怪了!使用R进行异常检测》 作者:罗布·J·海因德曼
计算机视觉
- :orange_book: 《计算机视觉:模型、学习与推理》 作者:西蒙·J·D·普林斯
- :orange_book: 《计算机视觉:算法与应用》(第1版) 作者:理查德·塞利斯基
- :earth_africa: 《计算机视觉基础》 作者:安东尼奥·托拉尔巴、菲利普·伊索拉、威廉·弗里曼
自然语言处理(NLP)和大型语言模型(LLM)
- :orange_book: 《语音与语言处理:自然语言处理、计算语言学与语音识别导论》 作者:丹·朱拉夫斯基、詹姆斯·H·马丁
- :orange_book: 《大型语言模型》 作者:迈克尔·R·道格拉斯
- :orange_book: 《面向自然语言处理的图神经网络:综述》 作者:吴凌飞、陈宇、沈凯、郭晓杰、高汉宁、李书诚、裴健、龙博
- :orange_book: 《语言建模的形式化方面》 作者:瑞安·科特雷尔、阿内伊·斯韦特、克拉拉·迈斯特、刘天宇、杜莉
- :orange_book: 《自然语言处理的基础模型》 作者:格哈德·帕斯、斯文·吉塞尔巴赫
- :orange_book: 《什么是嵌入》 作者:维姬·博伊基斯
- :orange_book: 《大型语言模型综述》 作者:韦恩·辛·赵等
- :orange_book: 《大型语言模型:综述》 作者:谢尔文·米纳伊等
- :orange_book: 《大型语言模型综合概述》 作者:胡姆扎·纳维德等
- :orange_book: 《关于大型语言模型的综述及其能力与局限性的见解》 作者:安德烈亚·马塔拉佐、里卡多·托尔洛内
- :orange_book: 《大型语言模型的基础》 作者:肖彤、朱景波
- :earth_africa: 《用R进行文本挖掘:整洁的方法》 作者:朱莉娅·西尔格、大卫·罗宾逊
- :earth_africa: 《用Python进行自然语言处理——使用自然语言工具包分析文本》 作者:史蒂文·伯德、伊万·克莱因、爱德华·洛珀
因果推断
- :orange_book: 《因果机器学习:综述与开放问题》 作者:让·卡杜尔、埃昂格斯·林奇、刘琪、马特·J·库斯纳、里卡多·席尔瓦
- :orange_book: 《因果推断与机器学习的最新进展》 作者:珍妮·E·布兰德、周翔、谢宇
- :orange_book: 《因果推断入门课程》 作者:丁鹏
- :orange_book: 《因果因子投资》 作者:马科斯·M·洛佩斯·德·普拉多
- :orange_book: 《时间序列因果发现方法的调查与评估》 作者:查尔斯·K·阿萨德、艾米莉·德维日韦、埃里克·戈西耶
- :orange_book: 《由ML和AI驱动的应用因果推断》 作者:维克托·切尔诺祖科夫、克里斯蒂安·汉森、内森·卡卢斯、马丁·施平德勒、瓦西里斯·西尔加尼斯
- :orange_book: 《因果推断:统计学习方法》 作者:斯特凡·韦格尔
- :orange_book: 《概率与因果:条件效应与平均总效应》 作者:罗尔夫·施泰耶
- :orange_book: 《如果……会怎样》 作者:米格尔·A·埃尔南、詹姆斯·M·罗宾斯
- :orange_book: 《因果人工智能》 作者:埃利亚斯·巴雷因博伊姆
- :earth_africa: 《应用因果推断》 作者:乌代·卡马特、肯尼思·格雷厄姆、米切尔·奈勒
- :earth_africa: 《勇敢者与真诚者的因果推断》 作者:马修斯·法库雷·阿尔维斯
- :earth_africa: 《如何使用marginaleffects解读R和Python中的统计模型》 作者:文森特·阿雷尔-邦多克、诺亚·格赖弗、安德鲁·海斯
保形预测
- :orange_book: 格伦·谢弗和弗拉基米尔·沃夫克所著的《保形预测教程》(arxiv.org/pdf/0706.3188.pdf)
- :orange_book: 马泰奥·丰塔纳、詹卢卡·泽尼和西蒙内·万蒂尼所著的《保形预测:理论统一回顾与新挑战》(arxiv.org/pdf/2005.07972.pdf)
- :orange_book: 安纳斯塔西奥斯·N·安杰洛普洛斯和史蒂芬·贝茨所著的《保形预测与无分布不确定性量化入门》(arxiv.org/pdf/2107.07511.pdf)
- :orange_book: 安纳斯塔西奥斯·N·安杰洛普洛斯、丽娜·福伊格尔·巴伯和史蒂芬·贝茨所著的《保形预测的理论基础》(arxiv.org/pdf/2411.11824)
- :orange_book: 拉斐尔·伊兹比基所著的《机器学习超越点预测:不确定性量化》(rafaelizbicki.com/UQ4ML.pdf)
时间序列:预测
- :earth_africa: 罗布·J·欣德曼和乔治·阿塔纳索普洛斯所著的《预测:原理与实践》(otexts.com/fpp3/)
- :earth_africa: 罗布·J·欣德曼、乔治·阿塔纳索普洛斯、阿祖尔·加尔萨、克里斯蒂安·查卢、马克斯·梅尔根塔勒和金·G·奥利瓦雷斯合著的《预测:原理与实践——Python式方法》(otexts.com/fpppy/)
- :orange_book: 弗提奥斯·佩特罗普洛斯等人所著的《预测:理论与实践》(arxiv.org/pdf/2012.03854.pdf)
- :earth_africa: 《预测:理论与实践》(在线版)(forecasting-encyclopedia.com),编者:弗提奥斯·佩特罗普洛斯、颜飞·康和冯莉
- :orange_book: 汉西卡·赫瓦马拉吉亚、克劳斯·阿克曼和克里斯托夫·贝格迈尔所著的《数据科学家的预测评估:常见误区与最佳实践》(arxiv.org/pdf/2203.10716.pdf)
- :orange_book: 亚历山大·奥伊所著的《时间序列分析》(batch.libretexts.org/print/Letter/Finished/stats-826/Full.pdf)
- :orange_book: 约翰·H·科克伦所著的《宏观经济学与金融的时间序列》(static1.squarespace.com/static/5e6033a4ea02d801f37e15bb/t/5ed92dcb7665261af1aa23f2/1591291342389/time_series_book.pdf)
- :earth_africa: 斯特凡·科拉萨、巴赫曼·罗斯塔米-塔巴尔和恩诺·齐姆森合著的《面向高管与专业人士的需求预测》(dfep.netlify.app)
相似工具推荐
openclaw
OpenClaw 是一款专为个人打造的本地化 AI 助手,旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚,能够直接接入你日常使用的各类通讯渠道,包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息,OpenClaw 都能即时响应,甚至支持在 macOS、iOS 和 Android 设备上进行语音交互,并提供实时的画布渲染功能供你操控。 这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地,用户无需依赖云端服务即可享受快速、私密的智能辅助,真正实现了“你的数据,你做主”。其独特的技术亮点在于强大的网关架构,将控制平面与核心助手分离,确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者,以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力(支持 macOS、Linux 及 Windows WSL2),即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你
stable-diffusion-webui
stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。
everything-claude-code
everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上
ComfyUI
ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。
markitdown
MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具,专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片(含 OCR)、音频(含语音转录)、HTML 乃至 YouTube 链接等多种格式的解析,能够精准提取文档中的标题、列表、表格和链接等关键结构信息。 在人工智能应用日益普及的今天,大语言模型(LLM)虽擅长处理文本,却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点,它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式,成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外,它还提供了 MCP(模型上下文协议)服务器,可无缝集成到 Claude Desktop 等 LLM 应用中。 这款工具特别适合开发者、数据科学家及 AI 研究人员使用,尤其是那些需要构建文档检索增强生成(RAG)系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性,但其核心优势在于为机器
LLMs-from-scratch
LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目,旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型(LLM)。它不仅是同名技术著作的官方代码库,更提供了一套完整的实践方案,涵盖模型开发、预训练及微调的全过程。 该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型,却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码,用户能够透彻掌握 Transformer 架构、注意力机制等关键原理,从而真正理解大模型是如何“思考”的。此外,项目还包含了加载大型预训练权重进行微调的代码,帮助用户将理论知识延伸至实际应用。 LLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API,而是渴望探究模型构建细节的技术人员而言,这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计:将复杂的系统工程拆解为清晰的步骤,配合详细的图表与示例,让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础,还是为未来研发更大规模的模型做准备