scikit-plot

2.4k 288 非常简单 1 次阅读 5天前MIT数据工具其他开发框架

AI 解读由 AI 自动生成，仅供参考

scikit-plot 是一个专为机器学习打造的可视化辅助库，旨在为 scikit-learn 对象快速添加直观的绘图功能。在数据科学工作中，从枯燥的数字输出到清晰的图表展示往往是关键一步，而手动编写复杂的绘图代码既耗时又容易出错。scikit-plot 正是为了解决这一痛点而生，它让开发者只需调用一行代码，即可生成混淆矩阵、ROC 曲线、学习曲线等专业且美观的评估图表。

这款工具特别适合 Python 数据科学家、机器学习工程师以及科研人员使用。无论您是希望快速验证模型效果的研究者，还是需要向团队展示清晰结果的开发人员，scikit-plot 都能大幅简化工作流程。其核心亮点在于“极简主义”的设计哲学：默认配置即可产出高质量图形，同时保留了丰富的参数选项以满足深度定制需求。此外，虽然它紧密集成于 scikit-learn 生态，但并不强制依赖特定对象，只要提供符合格式的数据（如来自 Keras 或其他框架的预测概率），它同样能出色完成绘图任务。通过 scikit-plot，您可以将更多精力专注于算法优化与数据分析，而非纠缠于绘图样板代码。

使用场景

某电商数据团队正在构建用户流失预警模型，需要在最终汇报前快速验证多分类算法（如随机森林）的性能并生成可视化报告。

没有 scikit-plot 时

代码冗余繁琐：绘制多分类 ROC 曲线或混淆矩阵需要编写大量 Matplotlib 底层代码，包括手动计算指标、循环遍历类别及调整坐标轴，耗时且易错。
图表美观度差：默认生成的图表缺乏商业报告所需的细节（如热力图颜色映射、类别标签注解），显得简陋且不直观。
沟通效率低下：向非技术背景的业务方展示时，枯燥的数字矩阵或简陋线条图难以直接传达模型在特定用户群上的表现短板。
调试成本高：每次尝试不同可视化视角（如从精确率 - 召回率曲线切换到学习曲线）都需要重构绘图逻辑，严重拖慢迭代节奏。

使用 scikit-plot 后

一行代码出图：只需调用 skplt.metrics.plot_roc 或 plot_confusion_matrix 等单行函数，即可自动处理多分类逻辑并生成完整图表。
视觉效果专业：内置美学优化，自动生成带数值注解的混淆矩阵热力图和包含微/宏平均曲线的 ROC 图，直接达到汇报标准。
洞察获取迅速：色彩丰富的可视化让团队成员能瞬间识别模型对“高价值流失用户”的误判情况，大幅降低沟通门槛。
灵活扩展性强：在保持代码简洁的同时，支持通过参数轻松定制标题、图例和样式，无需深入底层绘图库即可满足个性化需求。

scikit-plot 将数据科学家从繁琐的绘图样板代码中解放出来，让模型评估从“艰难编码”转变为“即时洞察”。

运行环境要求

GPU

未说明

内存

未说明

依赖

notes该工具是一个基于 scikit-learn 和 matplotlib 的可视化库，旨在简化机器学习图表的绘制。它不强制要求使用 scikit-learn 模型，只要提供真实的标签值和预测概率，即可兼容 Keras、NLTK 或其他自定义分类器。可通过 pip 或 conda 安装。

python未说明

scikit-learn

matplotlib

快速开始

欢迎使用 Scikit-plot

用于详细可视化的单行函数

从分析到……的最快捷、最简单的方式

roc_curves

……再到这样。

Scikit-plot 是一位不太擅长艺术的数据科学家在深刻认识到“可视化是数据科学流程中至关重要的组成部分，而不仅仅是事后的补充”之后的产物。

当你看到一张带有类别标签的混淆矩阵彩色热图时，获取洞察会比查看括号内的一行数字更容易。此外，如果你需要向他人展示你的成果（几乎每次有人雇佣你做数据科学工作时），你展示给他们的都是可视化图表，而不是一堆 Excel 中的数字。

话虽如此，在机器学习中经常会出现一些特定的可视化图表。Scikit-plot 的诞生正是为了帮助像我这样审美能力欠佳的程序员，以尽可能少的样板代码快速生成美观的图表和图形。

那么，让我们看看实际效果吧。来个例子！

假设我们使用朴素贝叶斯进行多分类，并希望可视化一个常见的分类指标——受试者工作特征曲线下面积。由于 ROC 曲线仅适用于二分类问题，因此我们需要为每个类别单独绘制其作为正类时的 ROC 曲线。此外，我们还可以在图中同时展示微平均和宏平均的 ROC 曲线。

下面我们将使用 scikit-learn 中的 digits 数据集来演示 Scikit-plot 的用法。

# 常规的训练集与测试集划分
from sklearn.datasets import load_digits
from sklearn.model_selection import train_test_split
from sklearn.naive_bayes import GaussianNB

X, y = load_digits(return_X_y=True)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.33)
nb = GaussianNB()
nb.fit(X_train, y_train)
predicted_probas = nb.predict_proba(X_test)

# 神奇之处就在这里
import matplotlib.pyplot as plt
import scikitplot as skplt
skplt.metrics.plot_roc(y_test, predicted_probas)
plt.show()

roc_curves

真漂亮。

而且……就这么简单！这个小示例浓缩了 Scikit-plot 的全部理念：用于详细可视化的单行函数。你只需查阅文档中提供的各种图表，然后调用相应的函数并传入必要的参数即可。Scikit-plot 尽量不干扰你的工作流程，没有多余的花哨功能。当然，如果你确实需要这些功能，每个函数都提供了丰富的参数，可以自定义图表中的各个元素。

最后，请对比并查看不使用 Scikit-plot 绘制多分类 ROC 曲线的方法。你更愿意选择哪种方式呢？

最大程度的灵活性。兼容非 scikit-learn 对象。

尽管 Scikit-plot 在一定程度上基于 scikit-learn 的接口设计，但你并不需要使用 scikit-learn 提供的对象才能使用这些函数。只要按照函数的要求提供所需的数据，它们就会为你绘制出漂亮的图表。

这里有一个快速示例，展示如何在 Keras 分类器上对样本数据集生成精确率-召回率曲线。

# 导入 Functions API 所需的库
import matplotlib.pyplot as plt
import scikitplot as skplt

# 这是一个 Keras 分类器。我们将在测试集上生成概率。
keras_clf.fit(X_train, y_train, batch_size=64, nb_epoch=10, verbose=2)
probas = keras_clf.predict_proba(X_test, batch_size=64)

# 现在开始绘图。
skplt.metrics.plot_precision_recall_curve(y_test, probas)
plt.show()

p_r_curves

我们可以清楚地看到，skplt.metrics.plot_precision_recall_curve 只需要真实的标签值 y 和预测的概率值就能生成图表。这意味着你可以使用任何你想要的分类器，无论是 Keras 神经网络、NLTK 朴素贝叶斯，还是你自己刚刚开发的突破性分类算法。

可能性是无限的。

安装

安装非常简单！首先，请确保已安装依赖项 Scikit-learn 和 Matplotlib。

然后只需运行：

pip install scikit-plot

如果你想使用最新的开发版本，可以克隆本仓库并在根目录下运行：

python setup.py install

如果你使用 conda，可以通过以下命令安装 Scikit-plot：

conda install -c conda-forge scikit-plot

文档与示例

探索 Scikit-plot 的全部功能。

详细的文档可以在这里找到。

示例则位于本仓库的examples 文件夹中。

贡献 Scikit-plot

发现 bug？提出新功能建议？想为库添加自己的图表吗？请访问我们的贡献指南。

引用 Scikit-plot

你在学术论文中使用了 Scikit-plot 吗？当然应该使用！审稿人通常很喜欢视觉上吸引人的内容。

如果是这样，请考虑使用 DOI 引用 Scikit-plot ：

APA

Reiichiro Nakano. (2018). reiinakano/scikit-plot: 0.3.7 [数据集]. Zenodo. http://doi.org/10.5281/zenodo.293191

IEEE

[1]Reiichiro Nakano, “reiinakano/scikit-plot: 0.3.7”. Zenodo, 19-Feb-2017.

ACM

[1]Reiichiro Nakano 2018. reiinakano/scikit-plot: 0.3.7. Zenodo.

祝您绘图愉快！

Scikit-plot 快速上手指南

Scikit-plot 是一个基于 Matplotlib 的 Python 可视化库，旨在通过单行代码生成精美的机器学习图表。它能将枯燥的数据分析结果瞬间转化为直观的视觉报告，特别适用于需要快速展示模型性能（如混淆矩阵、ROC 曲线等）的场景。

环境准备

在开始之前，请确保您的开发环境满足以下要求：

操作系统：Windows, macOS, 或 Linux
Python 版本：支持 Python 3.x
前置依赖：
- Scikit-learn
- Matplotlib

提示：如果您尚未安装上述依赖，可以通过 pip install scikit-learn matplotlib 先行安装。

安装步骤

您可以选择以下任意一种方式进行安装。推荐国内开发者使用清华镜像源以加速下载。

方式一：使用 pip 安装（推荐）

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple scikit-plot

方式二：使用 Conda 安装

如果您使用 Anaconda 或 Miniconda 环境：

conda install -c conda-forge scikit-plot

方式三：从源码安装（开发版）

如需体验最新开发版本：

git clone https://github.com/reiinakano/scikit-plot.git
cd scikit-plot
python setup.py install

基本使用

Scikit-plot 的核心哲学是“单行函数实现详细可视化”。只需导入库并调用相应的绘图函数，即可生成专业图表。

以下是一个完整的示例，展示如何使用高斯朴素贝叶斯分类器对数字数据集进行分类，并一键绘制多分类 ROC 曲线：

# 1. 准备数据与模型
from sklearn.datasets import load_digits
from sklearn.model_selection import train_test_split
from sklearn.naive_bayes import GaussianNB

X, y = load_digits(return_X_y=True)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.33)

nb = GaussianNB()
nb.fit(X_train, y_train)
predicted_probas = nb.predict_proba(X_test)

# 2. 引入 scikit-plot 并绘图
import matplotlib.pyplot as plt
import scikitplot as skplt

# 核心魔法：单行代码生成包含微平均和宏平均的多分类 ROC 曲线
skplt.metrics.plot_roc(y_test, predicted_probas)
plt.show()

说明：

skplt.metrics.plot_roc 函数自动处理多分类逻辑，为每个类别绘制 ROC 曲线，并计算 Micro-average 和 Macro-average。
该库不仅限于 Scikit-learn 模型，只要提供真实的标签 (y_true) 和预测概率 (y_pred_probs)，即可用于 Keras、PyTorch 或其他自定义模型的可视化。

版本历史

v0.3.72018/08/19

v0.3.52018/05/12

v0.3.42018/02/05

v0.3.32017/10/26

v0.3.22017/10/25

v0.3.12017/09/17

v0.3.02017/09/13

v0.2.82017/09/08

v0.2.72017/07/09

v0.2.62017/05/17

v0.2.52017/04/30

v0.2.42017/04/25

v0.2.32017/03/19

v0.2.22017/02/26

v0.2.12017/02/19

v0.2.02017/02/18

v0.1.02017/02/17

常见问题

升级 scikit-plot 时遇到导入错误（如 tkinter 或 matplotlib 相关报错）怎么办？

如何只绘制多分类问题中某一个特定类的精度 - 召回曲线（Precision-Recall Curve）？

混淆矩阵中的数字太大导致重叠，如何隐藏叠加的计数值？

SVM 分类器（如 SVC 或 LinearSVC）没有 predict_proba 方法，如何绘制精度 - 召回曲线？

运行单元测试或示例代码时提示参数不存在（如 'curves' 参数），如何解决？

安装 scikit-plot 时出现 "No module named sklearn.metrics" 错误怎么办？

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

★ 349.3k|★★★☆☆|1周前

Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|1周前

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 159.3k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 108.3k|★★☆☆☆|1周前

开发框架图像Agent

gemini-cli

gemini-cli 是一款由谷歌推出的开源 AI 命令行工具，它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言，它提供了一条从输入提示词到获取模型响应的最短路径，无需切换窗口即可享受智能辅助。这款工具主要解决了开发过程中频繁上下文切换的痛点，让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用，还是执行复杂的 Git 操作，gemini-cli 都能通过自然语言指令高效处理。它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口，具备出色的逻辑推理能力；内置 Google 搜索、文件操作及 Shell 命令执行等实用工具；更独特的是，它支持 MCP（模型上下文协议），允许用户灵活扩展自定义集成，连接如图像生成等外部能力。此外，个人谷歌账号即可享受免费的额度支持，且项目基于 Apache 2.0 协议完全开源，是提升终端工作效率的理想助手。

★ 100.8k|★★☆☆☆|1周前

插件Agent图像

markitdown

MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器

★ 93.4k|★★☆☆☆|1周前

插件开发框架