awesome-interpretable-machine-learning

917 141 非常简单 1 次阅读 1周前其他开发框架数据工具

AI 解读由 AI 自动生成，仅供参考

awesome-interpretable-machine-learning 是一份精心整理的开源资源清单，旨在帮助开发者和研究人员深入理解机器学习模型的内部运作机制。在人工智能日益复杂的今天，许多高精度模型如同“黑盒”，难以解释其决策依据，这在医疗、金融等高风险领域尤为棘手。这份清单正是为了解决模型透明度与可解释性难题而生，它系统性地汇集了从基础理论到前沿实践的各类资料。

内容涵盖三大核心板块：首先是“可解释模型”，介绍了决策树、规则集及线性回归等天生具备透明度的算法；其次是“特征重要性”，提供了随机森林、提升树等模型中评估变量影响力的方法与论文，甚至探讨了通用型的模型无关度量技术；最后是“特征选择”，梳理了筛选关键输入变量的各类策略。无论是希望构建可信 AI 系统的算法工程师，还是致力于研究模型公平性与鲁棒性的学者，都能从中找到极具价值的参考文献、代码实现和技术讨论。通过整合经典论文与现代工具，awesome-interpretable-machine-learning 让复杂的模型决策过程变得清晰可见，是通往可信赖人工智能的重要指南。

使用场景

某金融风控团队正在构建信用卡欺诈检测模型，急需向监管机构证明算法决策的公平性与逻辑依据。

没有 awesome-interpretable-machine-learning 时

团队盲目选用高精度的黑盒模型（如深度神经网络），却无法解释为何拒绝特定用户的申请，面临合规审计风险。
在筛选关键风险特征时，缺乏系统性的方法论指导，误用了存在偏差的特征重要性评估方式，导致遗漏核心欺诈指标。
业务人员完全无法理解模型逻辑，只能机械执行预测结果，一旦模型出错难以快速定位原因，信任度极低。
面对监管问询，只能提供晦涩的数学公式，无法生成人类可读的规则或可视化报告，沟通成本极高。

使用 awesome-interpretable-machine-learning 后

团队参考资源列表，转而采用贝叶斯规则集或可解释决策树等模型，在保持精度的同时直接输出“若交易地点异常且金额过大则拦截”的清晰规则。
利用列表中推荐的无偏特征重要性评估方法（如 Model Reliance），精准识别出真正的欺诈驱动因子，剔除了无关噪声干扰。
借助可视化工具将复杂的决策边界转化为直观图表，业务人员能轻松理解判罚逻辑，并主动参与模型优化迭代。
直接引用成熟的学术论文与开源实现，快速生成符合监管要求的解释性报告，将合规审查周期从数周缩短至两天。

awesome-interpretable-machine-learning 通过提供经过筛选的可解释性资源与方法论，帮助团队在确保模型性能的同时，彻底打破了算法黑盒，实现了技术落地与合规透明的双赢。

运行环境要求

GPU

未说明

内存

未说明

依赖

notes该仓库是一个“意见性资源列表”（Opinionated list of resources），主要收集了关于可解释机器学习的论文、博客文章、演示文稿以及其他开源工具（如 LIME, SHAP, Boruta, rFerns 等）的链接。它本身不是一个可直接运行的软件工具或库，因此没有特定的操作系统、GPU、内存、Python 版本或依赖库要求。用户需根据列表中引用的具体子项目（例如 github.com/marcotcr/lime 或 github.com/slundberg/shap）去查阅各自的运行环境需求。

python未说明

awesome-interpretable-machine-learning hero image

快速开始

令人惊叹的可解释机器学习 [[https://awesome.re][https://awesome.re/badge.svg]]

一份带有观点的资源列表，旨在促进模型的可解释性（包括内省、简化、可视化和解释）。

** 可解释模型

可解释模型
- 简单决策树
- 规则
- （正则化）线性回归
- k-NN
(2008) 杰罗姆·H·弗里德曼、博格丹·E·波佩斯库的《基于规则集成的预测学习》
- https://dx.doi.org/10.1214/07-AOAS148
(2014) 亚历克斯·A·弗雷塔斯的《可理解的分类模型》
- https://dx.doi.org/10.1145/2594473.2594475
- http://www.kdd.org/exploration_files/V15-01-01-Freitas.pdf
- 对几种分类模型的可解释性进行了有趣的讨论（决策树、分类规则、决策表、最近邻以及贝叶斯网络分类器）
(2015) 使用规则和贝叶斯分析的可解释分类器：构建更好的中风预测模型，作者为本杰明·莱瑟姆、辛西娅·鲁丁、泰勒·H·麦考密克、大卫·马迪根
- https://arxiv.org/pdf/1511.01644
- https://dx.doi.org/10.1214/15-AOAS848
(2017) 从噪声数据中学习解释性规则，作者为理查德·埃文斯、爱德华·格雷芬斯特特
- https://arxiv.org/pdf/1711.04574
(2019) 基于多层逻辑感知机和随机二值化的透明分类，作者为卓王、魏张、宁刘、建勇王
- https://arxiv.org/pdf/1912.04695
- 代码：https://github.com/12wang3/mllp

** 特征重要性

提供特征重要性度量的模型
- 随机森林
- 提升树
- 极端随机树
  - (2006) 皮埃尔·热尔茨、达米安·恩斯特、路易·韦亨凯尔的《极端随机树》
    - https://dx.doi.org/10.1007/s10994-006-6226-1
- 随机蕨类
  - (2015) 米隆·B·库尔萨的《rFerns：用于通用机器学习的随机蕨类方法实现》
- 线性回归（需谨慎对待）
(2007) 卡罗琳·施特罗布勒、安妮-洛尔·布勒斯泰克斯、阿希姆·蔡莱斯、托斯滕·霍索恩的《随机森林变量重要性度量中的偏差：说明、来源及解决方案》
- https://dx.doi.org/10.1186/1471-2105-8-25
(2008) 卡罗琳·施特罗布勒、安妮-洛尔·布勒斯泰克斯、托马斯·克奈布、托马斯·奥古斯丁、阿希姆·蔡莱斯的《随机森林的条件变量重要性》
- https://dx.doi.org/10.1186/1471-2105-9-307
(2018) 亚伦·费舍尔、辛西娅·鲁丁、弗朗切斯卡·多米尼奇的《模型类别依赖性：来自“拉什莫恩”视角的任何机器学习模型类别的变量重要性度量》
- https://arxiv.org/pdf/1801.01489
- https://github.com/aaronjfisher/mcr
- 通用的（与模型无关的）变量重要性度量
(2019) 吉尔斯·胡克、卢卡斯·门奇的《请停止打乱特征：解释与替代方案》
- https://arxiv.org/pdf/1905.03151
- 一篇倡导反对通过打乱特征来评估重要性的论文
(2018) 朱塞佩·卡萨利基奥、克里斯托夫·莫尔纳尔、伯恩德·比施尔的《黑盒模型的特征重要性可视化》
- https://arxiv.org/pdf/1804.06620
- https://github.com/giuseppec/featureImportance
- 全局和局部的（与模型无关的）变量重要性度量（基于模型依赖性）
一篇非常好的博客文章，描述了随机森林特征重要性的不足以及置换重要性
- http://explained.ai/rf-importance/index.html
在Eli5文档中介绍了置换重要性——一种简单的与模型无关的方法
- https://eli5.readthedocs.io/en/latest/blackbox/permutation_importance.html

** 特征选择

特征选择方法的分类
- 过滤法
- 包装法
- 嵌入式方法
(2003) 伊莎贝尔·居永、安德烈·埃利塞夫的《变量与特征选择导论》
- http://www.jmlr.org/papers/volume3/guyon03a/guyon03a.pdf
- 务必阅读这篇非常具有说明性的特征选择入门文章
过滤法
- (2006) 帕特里克·迈耶、詹卢卡·邦坦皮的《在癌症分类中利用变量互补性进行特征选择》
  - https://dx.doi.org/10.1007/11732242_9
  - https://pdfs.semanticscholar.org/d72f/f5063520ce4542d6d9b9e6a4f12aafab6091.pdf
  - 引入了信息论方法——双输入对称相关性（DISR）
- (2012) 加文·布朗、亚当·波科克、赵明杰、米克尔·卢汉的《条件似然最大化：信息论特征选择的统一框架》
  - http://www.jmlr.org/papers/volume13/brown12a/brown12a.pdf
  - 代码：https://github.com/Craigacp/FEAST
  - 讨论了基于互信息的各种方法（MIM、mRMR、MIFS、CMIM、JMI、DISR、ICAP、CIFE、CMI）
- (2012) 亚当·波科克的《基于联合似然的特征选择》
  - http://www.cs.man.ac.uk/~gbrown/publications/pocockPhDthesis.pdf
- (2017) 瑞安·J·厄巴诺维奇、梅丽莎·米克尔、威廉·拉卡瓦、兰德尔·S·奥尔森、杰森·H·摩尔的《基于Relief的特征选择：介绍与综述》
  - https://arxiv.org/pdf/1711.08421
- (2017) 瑞安·J·厄巴诺维奇、兰德尔·S·奥尔森、彼得·施密特、梅丽莎·米克尔、杰森·H·摩尔的《生物信息学数据挖掘中基于Relief的特征选择方法的基准测试》
  - https://arxiv.org/pdf/1711.08477
包装法
- (2015) 米隆·B·库尔萨、维托尔德·R·鲁德尼基的《使用BorutaPackage进行特征选择》
  - https://dx.doi.org/10.18637/jss.v036.i11
  - https://cran.r-project.org/web/packages/Boruta/
  - 官方R语言代码：https://notabug.org/mbq/Boruta/
  - Python代码：https://github.com/scikit-learn-contrib/boruta_py
- Boruta适合赶时间的人
  - https://cran.r-project.org/web/packages/Boruta/vignettes/inahurry.pdf
一般
- (1994) 乔治·约翰、罗恩·科哈维、卡尔·普弗勒格的《无关特征与子集选择问题》
  - https://pdfs.semanticscholar.org/a83b/ddb34618cc68f1014ca12eef7f537825d104.pdf
  - 一篇经典的论文，讨论了弱相关特征、无关特征和强相关特征
- (2003) JMLR关于特征选择的专刊——比较旧（2003年）
  - http://www.jmlr.org/papers/special/feature03.html
- (2004) 伊莎贝尔·居永、史蒂夫·冈恩、阿萨·本-赫尔、吉迪昂·德罗尔的《NIPS 2003特征选择挑战赛结果分析》
  - 论文：https://papers.nips.cc/paper/2728-result-analysis-of-the-nips-2003-feature-selection-challenge.pdf
  - 网站：http://clopinet.com/isabelle/Projects/NIPS2003/
(2007) 多项式时间内用于模式识别的一致性特征选择，作者：罗兰·尼尔松、何塞·佩尼亚、约翰·比约克格伦、耶斯珀·特格纳 + http://www.jmlr.org/papers/volume8/nilsson07a/nilsson07a.pdf + 讨论了特征选择中的最小最优方法与全相关方法
- 特征工程与选择，作者：库恩和约翰逊
  - 略微偏离主题，但是一本非常有趣的书
  - http://www.feat.engineering/index.html
  - https://bookdown.org/max/FES/
  - https://github.com/topepo/FES
- H. J. van Veen 的特征工程演示文稿
  - 略微偏离主题，但是一套非常有趣的幻灯片
  - 幻灯片：https://www.slideshare.net/HJvanVeen/feature-engineering-72376750

** 模型解释 *** 哲学 + 《磁铁》——理查德·费曼著 https://www.youtube.com/watch?v=wMFPe-DwULM

+ (2002) 走进黑箱：利奥·布雷伊曼的演讲
  + https://www.stat.berkeley.edu/users/breiman/wald2002-2.pdf

+ (2011) 解释还是预测？——加利特·舒梅利著
  + https://arxiv.org/pdf/1101.0891
  + https://dx.doi.org/10.1214/10-STS330

+ (2016) 模型可解释性的神话——扎卡里·C·利普顿著
  + https://arxiv.org/pdf/1606.03490
  + https://www.youtube.com/watch?v=mvzBQci04qA

+ (2017) 朝着严谨的可解释机器学习科学迈进——菲娜莱·多希-维莱兹、彬·金著
  + https://arxiv.org/pdf/1702.08608

+ (2017) 人类评估在模型可解释性中的承诺与风险——伯妮丝·赫尔曼著
  + https://arxiv.org/pdf/1711.07414

+ (2018) 《为什么：因果关系的新科学》——朱迪亚·珀尔著
  + http://bayes.cs.ucla.edu/WHY/why-intro.pdf

+ (2018) 请停止做“可解释”的机器学习——辛西娅·鲁丁著
  + 视频（从17分30秒开始，时长10分钟）：https://zoom.us/recording/play/0y-iI9HamgyDzzP2k_jiTu6jB7JgVVXnjWZKDMbnyRTn3FsxTDZy6Wkrj3_ekx4J
  + 链接：https://users.cs.duke.edu/~cynthia/mediatalks.html

+ (2018) 解释解释：一种评估机器学习可解释性的方法——莱拉尼·H·吉尔平、大卫·鲍、本·Z·袁、阿耶莎·巴杰瓦、迈克尔·斯佩克特、拉拉娜·卡加尔著
  + https://arxiv.org/pdf/1806.00069

+ (2019) 可解释的机器学习：定义、方法与应用——W·詹姆斯·默多克、钱丹·辛格、卡尔·昆比尔、雷扎·阿巴西-阿斯勒、宾·俞著
  + https://arxiv.org/pdf/1901.04592

+ (2019) 关于可解释机器学习的误解：更以人为本的机器学习——帕特里克·霍尔著
  + https://github.com/jphall663/xai_misconceptions/blob/master/xai_misconceptions.pdf
  + https://github.com/jphall663/xai_misconceptions

+ (2019) 机器学习可解释性导论：公平、问责、透明与可解释AI的应用视角——帕特里克·霍尔和纳夫迪普·吉尔著
  + https://www.h2o.ai/wp-content/uploads/2019/08/An-Introduction-to-Machine-Learning-Interpretability-Second-Edition.pdf

*** 模型无关的解释 + (2009) 如何解释个体分类决策——大卫·贝伦斯、蒂蒙·施罗特、斯特凡·哈梅林、川边元明、卡佳·汉森、克劳斯-罗伯特·穆勒著 + https://arxiv.org/pdf/0912.1128

+ (2013) 探索黑箱：用个体条件期望图可视化统计学习——亚历克斯·戈德斯坦、亚当·卡佩尔纳、贾斯汀·布莱奇、埃米尔·皮特金著
  + https://arxiv.org/pdf/1309.6392

+ (2016) “我为什么要信任你？”：解释任何分类器的预测——马尔科·图利奥·里贝罗、萨米尔·辛格、卡洛斯·盖斯特林著
  + https://arxiv.org/pdf/1602.04938
  + 代码：https://github.com/marcotcr/lime
  + https://github.com/marcotcr/lime-experiments
  + https://www.youtube.com/watch?v=bCgEP2zuYxI
  + 提出了LIME方法（局部可解释的模型无关解释）

+ (2016) 模型解释系统：最新更新与扩展——瑞安·特纳著
  + https://arxiv.org/pdf/1606.09517
  + http://www.blackboxworkshop.org/pdf/Turner2015_MES.pdf

+ (2017) 通过影响函数理解黑箱预测——庞伟·科和珀西·梁著
  + https://arxiv.org/pdf/1703.04730

+ (2017) 一种统一的模型预测解释方法——斯科特·伦德伯格、苏-因·李著
  + https://arxiv.org/pdf/1705.07874
  + 代码：https://github.com/slundberg/shap
  + 提出了SHAP方法（Shapley Additive Explanations），是对LIME方法的推广

+ (2018) 锚定：高精度的模型无关解释——马尔科·里贝罗、萨米尔·辛格、卡洛斯·盖斯特林著
  + https://homes.cs.washington.edu/~marcotcr/aaai18.pdf
  + 代码：https://github.com/marcotcr/anchor-experiments

+ (2018) 学习解释：基于信息论的模型解释视角——简博·陈、乐松、马丁·J·韦恩赖特、迈克尔·I·乔丹著
  + https://arxiv.org/pdf/1802.07814

+ (2018) 使用live和breakDown软件包解释模型预测——马特乌什·斯塔尼亚克、普热米斯瓦夫·别切克著
  + https://arxiv.org/pdf/1804.01955
  + 文档：https://mi2datalab.github.io/live/
  + 代码：https://github.com/MI2DataLab/live
  + 文档：https://pbiecek.github.io/breakDown
  + 代码：https://github.com/pbiecek/breakDown

+ (2018) 一本综述书籍——《可解释的机器学习：让黑箱模型变得可解释的指南》，作者：克里斯托夫·莫尔纳尔
  + https://christophm.github.io/interpretable-ml-book/
+ (2018) 停止为高风险决策解释黑箱机器学习模型，转而使用可解释模型——辛西娅·鲁丁著
  + https://arxiv.org/pdf/1811.10154
+ (2019) 通过功能分解量化任意机器学习模型的可解释性——克里斯托夫·莫尔纳尔、朱塞佩·卡萨利奇奥、伯恩德·比施尔著
  + https://arxiv.org/pdf/1904.03867

*** 模型特定的解释——神经网络 + (2013) 可视化与理解卷积网络——马修·D·齐勒、罗布·弗格斯著 + https://arxiv.org/pdf/1311.2901

+ (2013) 深入卷积网络：图像分类模型与显著性图的可视化——卡伦·西蒙扬、安德烈亚·韦达尔迪、安德鲁·齐瑟曼著
  + https://arxiv.org/pdf/1312.6034

+ (2015) 通过深度可视化理解神经网络——杰森·约辛斯基、杰夫·克鲁恩、安·阮、托马斯·福克斯、霍德·利普森著
  + https://arxiv.org/pdf/1506.06579
  + https://github.com/yosinski/deep-visualization-toolbox

+ (2016) Grad-CAM：基于梯度定位的深度网络可视化解释——拉姆普拉萨特·R·塞尔瓦拉朱、迈克尔·科格斯威尔、阿比舍克·达斯、拉马克里希纳·韦丹塔姆、黛薇·帕里克、德鲁夫·巴特拉著
  + https://arxiv.org/pdf/1610.02391

+ (2016) 生成视觉解释——丽莎·安·亨德里克斯、泽内普·阿卡塔、马库斯·罗尔巴赫、杰夫·多纳休、伯恩特·席勒、特雷弗·达雷尔著
  + https://arxiv.org/pdf/1603.08507

(2016) 通过理性化神经网络预测——陶磊、雷吉娜·巴尔齐莱、汤米·雅科拉 + https://arxiv.org/pdf/1606.04155 + https://people.csail.mit.edu/taolei/papers/emnlp16_rationale_slides.pdf + 代码：https://github.com/taolei87/rcnn/tree/master/code/rationale
- (2016) 反事实梯度——穆昆德·桑达拉贾恩、安库尔·塔利、齐奇·颜
  - https://arxiv.org/pdf/1611.02639
- 像素熵可用于检测相关图像区域（适用于卷积神经网络）
  - 参见论文的可视化部分及图5
    - (2017) 高分辨率乳腺癌筛查：基于多视角深度卷积神经网络——克日什托夫·J·格拉斯、斯泰西·沃尔夫森、沈一秋、吴楠、S·吉恩·金、埃里克·金、劳拉·希考克、乌贾斯·帕里克、琳达·莫伊、崔炯炫
      - https://arxiv.org/pdf/1703.07047
- (2017) SVCCA：用于深度学习动态与可解释性的奇异向量典型相关分析——迈特拉·拉古、贾斯汀·吉尔默、杰森·约辛斯基、雅莎·索尔-迪克斯坦
  - https://arxiv.org/pdf/1706.05806
  - https://research.googleblog.com/2017/11/interpreting-deep-neural-networks-with.html
- (2017) 通过解释进行视觉说明：提升深度神经网络的视觉反馈能力——何塞·奥拉马斯、王凯莉、蒂妮·图伊特拉尔斯
  - https://arxiv.org/pdf/1712.06302
- (2017) 深度网络的公理化归因——穆昆德·桑达拉贾恩、安库尔·塔利、齐奇·颜
  - https://arxiv.org/pdf/1703.01365
  - 代码：https://github.com/ankurtaly/Integrated-Gradients
  - 提出了集成梯度方法
  - 另请参阅：反事实梯度 https://arxiv.org/pdf/1611.02639.pdf
- (2017) 通过传播激活差异学习重要特征——阿万提·施里库马尔、佩顿·格林赛德、安舒尔·昆达杰
  - https://arxiv.org/pdf/1704.02685
  - 提出了DeepLift方法
  - 代码：https://github.com/kundajelab/deeplift
  - 视频：https://www.youtube.com/playlist?list=PLJLjQOkqSRTP3cLB2cOOi_bQFw6KPGKML
- (2017) 显著性方法的（不可）靠性——皮特-扬·金德曼斯、萨拉·胡克、朱利叶斯·阿德巴约、马克西米利安·阿尔伯、克里斯托夫·T·许特、斯文·代内、杜米特鲁·埃尔汉、彬·金
  - https://arxiv.org/pdf/1711.0867
  - 回顾了用于提取对预测最重要像素的方法的失败案例
- (2018) 分类器无关的显著性图提取——孔拉德·佐尔纳、克日什托夫·J·格拉斯、崔炯炫
  - https://arxiv.org/pdf/1805.08249
  - 代码：https://github.com/kondiz/casme
- (2018) 深度神经网络可解释性方法的基准——萨拉·胡克、杜米特鲁·埃尔汉、皮特-扬·金德曼斯、彬·金
  - https://arxiv.org/pdf/1806.10758
- (2018) 可解释性的构建模块——克里斯·奥拉、阿尔温德·萨蒂亚纳拉扬、伊恩·约翰逊、珊·卡特、路德维希·舒伯特、凯瑟琳·叶、亚历山大·莫尔德文采夫
  - https://dx.doi.org/10.23915/distill.00010
  - 包含一些嵌入式笔记本链接
  - 使用Lucid库 https://github.com/tensorflow/lucid
- (2018) 神经网络预测的层次化解释——钱丹·辛格、W·詹姆斯·默多克、余斌
  - https://arxiv.org/pdf/1806.05337
  - 代码：https://github.com/csinva/hierarchical_dnn_interpretations
- (2018) iNNvestigate神经网络！——马克西米利安·阿尔伯、塞巴斯蒂安·拉普施金、菲利普·泽格勒、米里亚姆·海格勒、克里斯托夫·T·许特、格雷戈瓦·蒙塔冯、沃伊切赫·萨梅克、克劳斯-罗伯特·穆勒、斯文·代内、皮特-扬·金德曼斯
  - https://arxiv.org/pdf/1808.04260
  - 代码：https://github.com/albermax/innvestigate
- (2018) YASENN：通过划分激活序列解释神经网络——亚罗斯拉夫·扎罗夫、丹尼斯·科尔任科夫、帕维尔·什韦奇科夫、亚历山大·图日林
  - https://arxiv.org/pdf/1811.02783
- (2019) 注意力并非解释——萨尔塔克·贾因、拜伦·C·华莱士
  - https://arxiv.org/pdf/1902.10186
- (2019) NLP任务中注意力机制的可解释性——希卡尔·瓦希斯特、夏亚姆·乌帕迪亚伊、高拉夫·辛格·托马尔、玛纳尔·法鲁基
  - https://arxiv.org/pdf/1909.11218
- (2019) GRACE：生成简洁且信息丰富的对比样本以解释神经网络模型的预测——泰·勒、王苏航、李东元
  - https://arxiv.org/pdf/1911.02042
  - 代码：https://github.com/lethaiq/GRACE_KDD20

** 从复杂模型中提取可解释模型

(2017) 利用查询和反例从循环神经网络中提取自动机——盖尔·魏斯、约阿夫·戈德堡、埃兰·亚哈夫
- https://arxiv.org/pdf/1711.09576
(2017) 将神经网络蒸馏为软决策树——尼古拉斯·弗罗斯特、杰弗里·欣顿
- https://arxiv.org/pdf/1711.09784
(2017) 利用透明模型蒸馏检测黑盒模型中的偏见——萨拉·谭、里奇·卡鲁阿纳、贾尔斯·胡克、尹·楼
- http://www.aies-conference.com/2018/contents/papers/main/AIES_2018_paper_96.pdf

** 模型可视化

可视化统计模型：摘下眼罩
- http://had.co.nz/stat645/model-vis.pdf
部分依赖图
- http://scikit-learn.org/stable/auto_examples/ensemble/plot_partial_dependence.html
- pdp：一个用于构建部分依赖图的R包 https://journal.r-project.org/archive/2017/RJ-2017-016/RJ-2017-016.pdf https://cran.r-project.org/web/packages/pdp/index.html
ggfortify：统一接口，用于可视化流行R包的统计结果
- https://journal.r-project.org/archive/2016-2/tang-horikoshi-li.pdf
- CRAN https://cran.r-project.org/web/packages/ggfortify/index.html
RandomForestExplainer
- 硕士论文 https://rawgit.com/geneticsMiNIng/BlackBoxOpener/master/randomForestExplainer_Master_thesis.pdf
- R代码
  - CRAN https://cran.r-project.org/web/packages/randomForestExplainer/index.html
  - 代码：https://github.com/MI2DataLab/randomForestExplainer
ggRandomForest
- 论文（小插曲） https://github.com/ehrlinger/ggRandomForests/raw/master/vignettes/randomForestSRC-Survival.pdf
- R代码
  - CRAN https://cran.r-project.org/web/packages/ggRandomForests/index.html
  - 代码：https://github.com/ehrlinger/ggRandomForests

** 精选综述演讲与教程

2017年ICML会议上的可解释机器学习教程
- 幻灯片：http://people.csail.mit.edu/beenkim/papers/BeenK_FinaleDV_ICML2017_tutorial.pdf
P. Biecek，《给我看看你的模型——统计模型可视化工具》
- 视频：https://channel9.msdn.com/Events/useR-international-R-User-conferences/useR-International-R-User-2017-Conference/Show-Me-Your-Model-tools-for-visualisation-of-statistical-models
S. Ritchie，《AI的“就这样”故事》
- 视频：https://www.youtube.com/watch?v=DiWkKqZChF0
- 幻灯片：https://speakerdeck.com/sritchie/just-so-stories-for-ai-explaining-black-box-predictions
C. Jarmul，《迈向可解释且负责任的模型》
- 视频：https://www.youtube.com/watch?v=B3PtcF-6Dtc
- 幻灯片：https://docs.google.com/presentation/d/e/2PACX-1vR05kpagAbL5qo1QThxwu44TI5SQAws_UFVg3nUAmKp39uNG0xdBjcMA-VyEeqZRGGQtt0CS5h2DMTS/embed?start=false&loop=false&delayms=3000
- I. Oszvald，《你真该早点知道的机器学习库》
  - 演讲的很大一部分内容涉及模型解释与可视化
  - 视频：https://www.youtube.com/watch?v=nDF7_8FOhpI
  - 相关的回归预测解释笔记本：https://github.com/ianozsvald/data_science_delivered/blob/master/ml_explain_regression_prediction.ipynb
- G. Varoquaux，《理解与诊断你的机器学习模型》（涵盖 PDP 和 Lime 等方法）
  - 视频：https://www.youtube.com/watch?v=kbj3llSbaVA
  - 幻灯片：http://gael-varoquaux.info/interpreting_ml_tuto/

** 场所

可解释机器学习研讨会（NIPS 2017）（包含论文、幻灯片和视频的链接）
- http://interpretable.ml/
- 辩论：机器学习中可解释性是否必要
  - https://www.youtube.com/watch?v=2hW05ZfsUUo
机器学习中人类可解释性研讨会（WHI），与 ICML 联合举办
- 2018 年（包含论文和幻灯片的链接）
  - https://sites.google.com/view/whi2018
  - 会议论文集 https://arxiv.org/html/1807.01308
- 2017 年（包含论文和幻灯片的链接）
  - https://sites.google.com/view/whi2017/home
  - 会议论文集 https://arxiv.org/html/1708.02666
- 2016 年（包含论文的链接）
  - https://sites.google.com/site/2016whi/
  - 会议论文集 https://arxiv.org/html/1607.02531 或 [[https://drive.google.com/open?id=0B9mGJ4F63iKGZWk0cXZraTNjRVU][此处]]
针对自然语言处理的神经网络分析与解释研讨会（BlackboxNLP），与 EMNLP 联合举办
- 2019 年（以下链接未来可能会加上 2019 的前缀）
  - https://blackboxnlp.github.io/
  - https://blackboxnlp.github.io/program.html
  - 论文应在 arXiv 上可查
- 2018 年
FAT/ML 机器学习中的公平性、问责制与透明度[[https://www.fatml.org/]]
- 2018 年
  - https://www.fatml.org/schedule/2018
- 2017 年
  - https://www.fatml.org/schedule/2017
- 2016 年
  - https://www.fatml.org/schedule/2016
- 2016 年
  - https://www.fatml.org/schedule/2016
- 2015 年
  - https://www.fatml.org/schedule/2015
- 2014 年
  - https://www.fatml.org/schedule/2014
    - AAAI/ACM 人工智能、伦理与社会年度会议
- 2019 年（以下链接未来可能会加上 2019 的前缀）
  - http://www.aies-conference.com/accepted-papers/
- 2018 年
  - http://www.aies-conference.com/2018/accepted-papers/
  - http://www.aies-conference.com/2018/accepted-student-papers/ ** 软件每篇论文都会提到与其相关的软件。此处仅列出独立的软件。
DALEX - R 包，用于描述性机器学习解释
- CRAN https://cran.r-project.org/web/packages/DALEX/DALEX.pdf
- 代码：https://github.com/pbiecek/DALEX
ELI5 - Python 包，专门用于调试机器学习分类器并解释其预测结果
- 代码：https://github.com/TeamHG-Memex/eli5
- https://eli5.readthedocs.io/en/latest/
forestmodel - R 包，使用所谓的森林图可视化不同模型的系数
- CRAN https://cran.r-project.org/web/packages/forestmodel/index.html
- 代码：https://github.com/NikNakk/forestmodel
fscaret - R 包，提供来自 'caret' 的自动化特征选择功能
- CRAN https://cran.r-project.org/web/packages/fscaret/
- 教程：https://cran.r-project.org/web/packages/fscaret/vignettes/fscaret.pdf
iml - R 包，用于可解释的机器学习
- CRAN https://cran.r-project.org/web/packages/iml/
- 代码：https://github.com/christophM/iml
- 出版物：http://joss.theoj.org/papers/10.21105/joss.00786
interpret - Python 包，由微软开发，用于训练可解释模型并解释黑盒系统
- 代码：https://github.com/microsoft/interpret
lime - R 包，实现了 LIME 方法
- https://github.com/thomasp85/lime
lofo-importance - Python 包，基于“留一法”计算特征重要性
- 代码：https://github.com/aerdem4/lofo-importance
Lucid - 一套用于神经网络可解释性研究的基础设施和工具集合
- 代码：https://github.com/tensorflow/lucid
praznik - R 包，包含一系列特征选择过滤器，采用贪婪优化互信息为基础的有效性标准，参见 JMLR 13, 27−66 (2012)
- CRAN https://cran.r-project.org/web/packages/praznik/index.html
- 代码：https://notabug.org/mbq/praznik
yellowbrick - Python 包，提供可视化分析和诊断工具，以帮助选择机器学习模型
- 代码：https://github.com/DistrictDataLabs/yellowbrick
- http://www.scikit-yb.org/en/latest/

** 其他资源

Patrick Hall 整理的“Awesome”资源列表
- https://github.com/jphall663/awesome-machine-learning-interpretability
Przemysław Biecek 整理的“Awesome” XAI 资源列表
- https://github.com/pbiecek/xai_resources

awesome-interpretable-machine-learning 快速上手指南

awesome-interpretable-machine-learning 并非一个单一的 Python 包或可执行软件，而是一个精选资源列表（Awesome List），汇集了关于可解释性机器学习（Interpretable ML）的论文、模型实现、教程和开源代码库。

本指南旨在帮助开发者利用该列表中的资源，快速搭建可解释性机器学习环境并掌握核心工具（如 LIME, SHAP, Boruta 等）。

环境准备

由于列表中包含多种语言（主要是 Python 和 R）的实现，建议根据你计划使用的具体算法准备环境。以下以最常用的 Python 生态为例。

操作系统: Linux, macOS, 或 Windows
Python 版本: 推荐 Python 3.8 及以上
前置依赖:
- pip (Python 包管理工具)
- conda (可选，推荐用于管理数据科学环境)
- 基础数据科学库：numpy, pandas, scikit-learn, matplotlib

国内加速建议：在安装依赖时，推荐使用清华源或阿里源以提升下载速度：
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple <package_name>

安装步骤

由于这是一个资源列表，你需要安装列表中提到的具体工具库。以下是两个最主流、通用的可解释性工具库的安装命令：

1. 安装 SHAP (SHapley Additive exPlanations)

适用于全局和局部特征重要性分析，支持多种模型。

pip install shap
# 或使用国内镜像
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple shap

2. 安装 LIME (Local Interpretable Model-agnostic Explanations)

适用于解释单个预测结果，支持图像、文本和表格数据。

pip install lime
# 或使用国内镜像
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple lime

3. 其他常用库 (可选)

Boruta (特征选择): pip install boruta (注意：Python 版本通常为 boruta_py)
ELI5 (调试和可视化): pip install eli5
InterpretML (微软出品，包含多种解释器): pip install interpret

基本使用

以下示例展示如何使用列表中推荐的 SHAP 库对一个简单的随机森林模型进行解释。这是理解“黑盒”模型最直接的入门方式。

示例：使用 SHAP 解释随机森林模型

import shap
import sklearn
from sklearn.ensemble import RandomForestClassifier
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split

# 1. 准备数据
X, y = load_iris(return_X_y=True)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 2. 训练模型 (黑盒模型)
model = RandomForestClassifier(n_estimators=100, random_state=42)
model.fit(X_train, y_train)

# 3. 创建 SHAP 解释器
# TreeExplainer 专门针对树模型进行了优化，速度极快
explainer = shap.TreeExplainer(model)

# 4. 计算 SHAP 值
shap_values = explainer.shap_values(X_test)

# 5. 可视化结果
# 绘制摘要图，展示特征对模型输出的整体影响
shap.summary_plot(shap_values, X_test, feature_names=load_iris().feature_names)

# 绘制依赖图，查看单个特征与 SHAP 值的关系
shap.dependence_plot(0, shap_values, X_test, feature_names=load_iris().feature_names)

进阶：使用 LIME 解释单个样本

如果你需要解释某一次特定预测的原因（例如：为什么模型认为这张图片是猫？），可以使用 LIME：

import lime
import lime.lime_tabular
import numpy as np

# 假设已有训练好的 model 和训练数据 X_train (numpy array)
# 定义预测函数 (LIME 需要概率输出)
def predict_fn(x):
    return model.predict_proba(x)

# 创建 LIME 解释器
explainer = lime.lime_tabular.LimeTabularExplainer(
    training_data=X_train,
    feature_names=load_iris().feature_names,
    class_names=['setosa', 'versicolor', 'virginica'],
    mode='classification'
)

# 解释测试集中的第一个样本
exp = explainer.explain_instance(X_test[0], predict_fn, num_features=4)

# 在 Jupyter Notebook 中显示结果
exp.show_in_notebook()
# 或者打印文本结果
print(exp.as_list())

提示：awesome-interpretable-machine-learning 列表中包含了大量论文链接（如 Friedman 的 Rule Ensembles, Rudin 的 Interpretable Classifiers 等）。若要复现这些特定算法，请访问 README 中对应的 GitHub 代码链接（如 https://github.com/12wang3/mllp）获取专用实现。

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

★ 349.3k|★★★☆☆|1周前

Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|1周前

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 160.4k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 109.2k|★★☆☆☆|今天

开发框架图像Agent

gemini-cli

gemini-cli 是一款由谷歌推出的开源 AI 命令行工具，它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言，它提供了一条从输入提示词到获取模型响应的最短路径，无需切换窗口即可享受智能辅助。这款工具主要解决了开发过程中频繁上下文切换的痛点，让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用，还是执行复杂的 Git 操作，gemini-cli 都能通过自然语言指令高效处理。它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口，具备出色的逻辑推理能力；内置 Google 搜索、文件操作及 Shell 命令执行等实用工具；更独特的是，它支持 MCP（模型上下文协议），允许用户灵活扩展自定义集成，连接如图像生成等外部能力。此外，个人谷歌账号即可享受免费的额度支持，且项目基于 Apache 2.0 协议完全开源，是提升终端工作效率的理想助手。

★ 100.8k|★★☆☆☆|1周前

插件Agent图像

markitdown

MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器

★ 93.4k|★★☆☆☆|1周前

插件开发框架