mAP

3k 919 非常简单 1 次阅读 4天前Apache-2.0图像开发框架

AI 解读由 AI 自动生成，仅供参考

mAP 是一款专为评估物体识别神经网络性能而设计的开源工具。在深度学习领域，开发者训练出模型后，往往难以量化其实际检测效果，mAP 正是为了解决这一痛点，通过计算“平均精度均值”来提供客观、标准的性能评分。分数越高，代表模型在给定真实数据下的表现越出色。

这款工具特别适合人工智能研究人员、算法工程师以及计算机视觉开发者使用。无论是正在调试目标检测模型的学生，还是需要在工业场景中验证算法鲁棒性的专业人士，都能利用它快速获得可靠的评估结果。

mAP 的核心技术亮点在于严格遵循了权威的 PASCAL VOC 2012 竞赛评估标准。它将原本复杂的官方 Matlab 评估代码成功移植为更易用的 Python 版本，确保了计算结果的准确性与一致性。其工作原理是先将模型的检测结果按置信度排序，再基于标签匹配和交并比（IoU≥0.5）判定真假阳性，进而绘制精确率 - 召回率曲线并计算曲线下面积得出各类别的平均精度（AP），最终汇总为整体的 mAP 值。此外，它还支持可选的可视化功能，能够生成直观的图表甚至动画演示，帮助用户更深入地理解模型的误检与漏检情况，从而针对性地优化网络结构。

使用场景

某自动驾驶初创团队正在迭代其车载行人检测模型，急需量化评估新版本算法在复杂路况下的真实表现。

没有 mAP 时

团队仅凭肉眼观察测试视频截图来判断模型优劣，主观性强且无法发现细微的性能倒退。
缺乏统一的置信度阈值标准，不同开发人员对“检测成功”的定义不一致，导致沟通成本极高。
无法区分模型是漏检了目标还是产生了大量误报，难以针对性地调整损失函数或数据增强策略。
在向投资人汇报进展时，只能展示几张效果好的图片，缺乏如 PASCAL VOC 标准般权威的量化数据支撑。

使用 mAP 后

通过计算平均精度均值（mAP），团队获得了 0 到 100% 的客观评分，能精确对比出新版模型比旧版提升了 3.5%。
利用 IoU≥0.5 的匹配机制和置信度排序，自动识别出模型在远距离小目标上的漏检问题，指导数据收集方向。
生成的精度 - 召回率曲线直观展示了模型在不同阈值下的表现，帮助工程师快速锁定最佳推理阈值。
基于行业通用的评估标准输出详细报告，让技术成果可度量、可复现，显著提升了项目汇报的说服力。

mAP 将模糊的视觉感受转化为精确的数学指标，成为驱动目标检测模型持续优化的核心标尺。

运行环境要求

操作系统

Linux
macOS
Windows

GPU

未说明

内存

未说明

依赖

notes该工具主要用于评估目标检测模型的性能（计算 mAP），本身不包含神经网络训练或推理代码，因此无特定 GPU 或大内存需求。核心功能仅需 Python 环境。若需可视化结果或生成动画，需分别安装 Matplotlib 和 OpenCV。提供了将 PASCAL VOC、Darkflow 和 YOLO 格式转换为所需格式的脚本。输入数据需按特定格式整理为文本文件。

python未说明具体版本，需安装 Python

matplotlib (可选，用于绘图)

opencv-python (可选，用于动画)

快速开始

mAP（平均精度均值）

这段代码将评估您的神经网络在目标识别任务中的性能。

在实践中，更高的 mAP 值 表示在给定真实标签和类别集合的情况下，您的神经网络具有 更好的性能。

引用

本项目是为以下论文开发的，请考虑引用该论文：

@INPROCEEDINGS{8594067,
  author={J. {Cartucho} and R. {Ventura} and M. {Veloso}},
  booktitle={2018 IEEE/RSJ 国际智能机器人与系统会议 (IROS)}, 
  title={移动机器人中基于共生深度学习的鲁棒目标识别}, 
  year={2018},
  pages={2336-2341},
}

说明

您的神经网络性能将使用 PASCAL VOC 2012 竞赛中定义的 mAP 准则来评判。我们只是将官方 MATLAB 代码转换为 Python（在我们的测试中，两者给出了相同的结果）。

首先 (1.)，我们为真实标签中存在的每个类别计算平均精度 (AP)。最后 (2.)，我们计算 mAP（平均精度均值）的值。

1. 计算 AP

对于每个类别：

首先，您的神经网络的 检测结果 按置信度从高到低排序，并与 真实标签对象 进行匹配。当它们具有 相同的标签且 IoU ≥ 0.5（交并比大于等于 50%）时，即视为“匹配”。如果该真实标签对象尚未被使用过，则此“匹配”被视为真正例（以避免对同一对象进行多次检测）。

利用这一准则，我们计算精确率/召回率曲线。例如：

然后，我们通过将召回率 r 的精确率设置为任何召回率 r' > r 所获得的最大精确率，来计算一个 精确率单调递减 的测量精确率/召回率曲线版本（显示为浅红色）。

最后，我们通过数值积分计算 AP，即 该曲线下的面积（显示为浅蓝色）。由于曲线是分段常数，因此不涉及任何近似。

2. 计算 mAP

我们将所有 AP 的平均值计算出来，得到一个介于 0 到 100% 之间的 mAP 值。例如：

前提条件

您需要安装：

Python

可选：

如果想 绘制结果图，请安装 Matplotlib - Linux、macOS 和 Windows：
1. python -mpip install -U pip
2. python -mpip install -U matplotlib
如果想展示 动画效果，请安装 OpenCV：
1. python -mpip install -U pip
2. python -mpip install -U opencv-python

快速入门

要开始使用 mAP，您需要克隆仓库：

git clone https://github.com/Cartucho/mAP

运行代码

逐步操作：

创建真实标签文件
将真实标签文件复制到 input/ground-truth/ 文件夹中。
创建检测结果文件
将检测结果文件复制到 input/detection-results/ 文件夹中。
运行代码： python main.py

可选（如果您想查看 动画效果）：

将图像插入 input/images-optional/ 文件夹中。

PASCAL VOC、Darkflow 和 YOLO 用户

在 scripts/extra 文件夹中，您可以找到用于将 PASCAL VOC、darkflow 和 YOLO 文件转换为所需格式的附加脚本。

创建真实标签文件

为每张图像创建一个单独的真实标签文本文件。
使用 匹配的文件名（例如，图像：“image_1.jpg”，真实标签：“image_1.txt”）。

在这些文件中，每行应采用以下格式：

<class_name> <left> <top> <right> <bottom> [<difficult>]

difficult 参数是可选的，如果您希望计算时忽略某个特定检测，可以使用它。

例如，“image_1.txt”：

tvmonitor 2 10 173 238
book 439 157 556 241
book 437 246 518 351 difficult
pottedplant 272 190 316 259

创建检测结果文件

为每张图像创建一个单独的检测结果文本文件。
使用 匹配的文件名（例如，图像：“image_1.jpg”，检测结果：“image_1.txt”）。

在这些文件中，每行应采用以下格式：

<class_name> <confidence> <left> <top> <right> <bottom>

例如，“image_1.txt”：

tvmonitor 0.471781 0 13 174 244
cup 0.414941 274 226 301 265
book 0.460851 429 219 528 247
chair 0.292345 0 199 88 436
book 0.269833 433 260 506 336

作者：

João Cartucho

欢迎贡献

mAP 快速上手指南

mAP (mean Average Precision) 是一个用于评估目标检测神经网络性能的开源工具。它基于 PASCAL VOC 2012 竞赛标准，通过计算平均精度（AP）和平均精度均值（mAP）来量化模型效果。mAP 值越高（0-100%），表示模型性能越好。

环境准备

本工具主要依赖 Python 运行，可选安装绘图和动画库以可视化结果。

操作系统：Linux, macOS, Windows
核心依赖：
- Python (建议 Python 3.x)
可选依赖（用于生成图表和动画）：
- matplotlib：用于绘制精度/召回率曲线。
- opencv-python：用于生成检测结果的动画演示。

国内加速提示：在中国大陆地区，建议使用国内镜像源安装依赖以提升速度。例如使用清华源： pip install -i https://pypi.tuna.tsinghua.edu.cn/simple <包名>

安装步骤

克隆项目仓库 将代码下载到本地：

git clone https://github.com/Cartucho/mAP
cd mAP

安装可选依赖（推荐安装以便查看完整报告）

首先升级 pip：

python -mpip install -U pip

安装 Matplotlib（绘图）：

# 通用命令
python -mpip install -U matplotlib

# 或使用国内镜像
python -mpip install -U matplotlib -i https://pypi.tuna.tsinghua.edu.cn/simple

安装 OpenCV（动画）：

# 通用命令
python -mpip install -U opencv-python

# 或使用国内镜像
python -mpip install -U opencv-python -i https://pypi.tuna.tsinghua.edu.cn/simple

基本使用

使用前需准备好两类数据文件：真实标注文件 (ground-truth) 和 检测结果文件 (detection-results)。

1. 准备数据文件

在项目根目录下创建输入文件夹结构（如果不存在）：

mkdir -p input/ground-truth
mkdir -p input/detection-results
mkdir -p input/images-optional  # 可选：放入原图以生成动画

A. 制作真实标注文件 (ground-truth)

为每张测试图片创建一个 .txt 文件，文件名需与图片名一致（例如 image_1.jpg 对应 image_1.txt）。将文件放入 input/ground-truth/ 目录。

文件格式（每行一个物体）：

<class_name> <left> <top> <right> <bottom> [<difficult>]

<class_name>: 类别名称
<left> <top> <right> <bottom>: 边界框坐标
[<difficult>]: 可选参数，若标记为 difficult 则该物体不参与评估

示例 (input/ground-truth/image_1.txt)：

tvmonitor 2 10 173 238
book 439 157 556 241
book 437 246 518 351 difficult
pottedplant 272 190 316 259

B. 制作检测结果文件 (detection-results)

同样为每张测试图片创建一个 .txt 文件，文件名与图片名一致。将文件放入 input/detection-results/ 目录。

文件格式（每行一个检测结果，按置信度排序更佳）：

<class_name> <confidence> <left> <top> <right> <bottom>

<confidence>: 模型预测的置信度分数

示例 (input/detection-results/image_1.txt)：

tvmonitor 0.471781 0 13 174 244
cup 0.414941 274 226 301 265
book 0.460851 429 219 528 247
chair 0.292345 0 199 88 436
book 0.269833 433 260 506 336

提示：如果你使用的是 PASCAL VOC、Darkflow 或 YOLO 格式的数据，可查看 scripts/extra 文件夹中的脚本进行格式转换。

2. 运行评估

确保文件已放入对应文件夹后，执行以下命令：

python main.py

程序运行结束后，将在终端输出各类别的 AP 值及最终的 mAP 值。如果安装了 matplotlib 和 opencv-python 并放入了可选图片，还会自动生成精度曲线图和检测动画。

版本历史

v0.02018/04/09

常见问题

如何计算对数平均漏检率（log-average miss rate）？

如何将 YOLOv3/Darknet 的测试结果解析为该仓库所需的格式？

如果类别标签中包含空格导致报错，该如何解决？

如何为自己的图片创建符合格式要求的地面真值（ground-truth）文件？

为什么评估结果只显示部分边界框，而不是检测到的所有对象？

如何使用脚本批量处理 YOLOv4 或其他版本的预测结果？

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

★ 349.3k|★★★☆☆|昨天

Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|2天前

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 142.7k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 107.9k|★★☆☆☆|昨天

开发框架图像Agent

markitdown

MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器

★ 93.4k|★★☆☆☆|今天

插件开发框架

LLMs-from-scratch

LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目，旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型（LLM）。它不仅是同名技术著作的官方代码库，更提供了一套完整的实践方案，涵盖模型开发、预训练及微调的全过程。该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型，却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码，用户能够透彻掌握 Transformer 架构、注意力机制等关键原理，从而真正理解大模型是如何“思考”的。此外，项目还包含了加载大型预训练权重进行微调的代码，帮助用户将理论知识延伸至实际应用。 LLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API，而是渴望探究模型构建细节的技术人员而言，这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计：将复杂的系统工程拆解为清晰的步骤，配合详细的图表与示例，让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础，还是为未来研发更大规模的模型做准备

★ 90.1k|★★★☆☆|昨天

语言模型图像Agent