AI 解读由 AI 自动生成，仅供参考

MMDeploy 是 OpenMMLab 社区推出的开源深度学习模型部署工具箱，旨在打通从算法训练到实际落地的“最后一公里”。它主要解决了研究人员和开发者在将 PyTorch 模型转化为工业级推理格式时面临的兼容性差、转换流程复杂以及不同硬件后端适配困难等痛点。

这款工具非常适合算法工程师、嵌入式开发人员以及希望将 AI 模型应用于生产环境的科研人员使用。无论是需要在服务器端利用 TensorRT 加速，还是在移动端通过 NCNN 运行，亦或是在边缘设备上借助 OpenVINO 部署，MMDeploy 都能提供统一且高效的解决方案。

其核心技术亮点在于对 OpenMMLab 全家桶（如 MMDetection、MMSegmentation 等）模型的全面原生支持，能够无缝衔接最新的 2.0 版本代码库。MMDeploy 内置了强大的模型转换引擎，支持一键将训练好的模型导出为 ONNX、TensorRT、NCNN、OpenVINO 等多种主流推理格式。此外，配套的 Deploee 平台还提供了超过 2300 种预转换模型及真实硬件性能剖析功能，帮助用户在部署前即可评估模型在不同设备上的表现，极大降低了部署门槛并提升了开发效率。

使用场景

某智慧交通团队需要将基于 MMDetection 训练的 YOLOv8 车辆检测模型，快速部署到路侧的 NVIDIA Jetson 边缘计算设备上，以实现实时的违章抓拍。

没有 mmdeploy 时

手动转换极易出错：工程师需手动编写复杂的 PyTorch 转 ONNX 脚本，常因算子不支持或动态轴设置错误导致导出失败，排查耗时数天。
推理性能低下：直接在边缘设备运行 PyTorch 模型，显存占用高且推理延迟超过 200ms，无法满足实时性要求。
环境依赖地狱：生产环境需安装庞大的 PyTorch 全套依赖，与嵌入式系统的精简需求冲突，部署包体积过大。
多后端适配困难：若想尝试 TensorRT 加速，需额外学习特定编译流程，代码耦合度高，切换推理后端几乎等于重写。

使用 mmdeploy 后

一键式模型转换：通过 mmdeploy 提供的统一接口，仅需一条命令即可自动处理算子重写与动态轴，成功导出高精度 ONNX 模型。
极致推理加速：利用 mmdeploy 内置的 TensorRT 后端支持，自动完成引擎构建与优化，将推理延迟降低至 30ms 以内，提升近 7 倍。
轻量级运行时：生成的部署包仅包含必要的推理库，彻底移除训练框架依赖，完美适配资源受限的边缘设备。
灵活的后端切换：无需修改业务代码，只需调整配置文件即可在 ONNX Runtime、TensorRT 或 OpenVINO 之间无缝切换，便于不同硬件选型。

mmdeploy 通过屏蔽底层异构硬件的复杂性，让算法团队能专注于模型优化，实现了从“训练完成”到“落地应用”的分钟级跨越。

运行环境要求

操作系统

Linux
Windows
macOS
Android

GPU

非必需（支持 CPU 后端）
若使用 NVIDIA GPU 加速，需支持 CUDA 11.3+ (TensorRT/ONNXRuntime)，具体显存取决于模型大小
支持华为 Ascend、Rockchip NPU 及 Apple M1 (CoreML) 等特定硬件

内存

未说明

依赖

notesMMDeploy 1.x 版本需与 OpenMMLab 2.0 系列算法库对齐（如 mmengine 0.x, mmcv 2.x, mmdet 3.x）。支持多种推理后端（ONNXRuntime, TensorRT, NCNN, OpenVINO, SNPE, CANN 等），不同后端对操作系统和硬件架构（x86_64, ARM, RISC-V）有特定兼容性要求，详见支持矩阵表。默认分支已切换至 main，0.x 版本即将弃用。

python未说明

mmengine>=0.x.y

mmcv>=2.x.y

mmdet>=3.x.y (针对检测任务)

onnxruntime

tensorrt

ncnn

openvino

torchscript

快速开始

OpenMMLab官网 ^热门 OpenMMLab平台 ^立即体验

English | 简体中文

亮点

MMDeploy 1.x 已发布，该版本适配了 OpenMMLab 2.0 的上游代码库。使用时请务必对齐版本号。

默认分支已从 master 切换至 main。MMDeploy 0.x（master）将被废弃，未来新功能仅会添加到 MMDeploy 1.x（main）中。

mmdeploy	mmengine	mmcv	mmdet	others
0.x.y	-	<=1.x.y	<=2.x.y	0.x.y
1.x.y	0.x.y	2.x.y	3.x.y	1.x.y

deploee 提供超过 2,300 种 AI 模型，支持 ONNX、NCNN、TRT 和 OpenVINO 格式。deploee 内置真实硬件设备列表，允许用户将 Torch 模型转换为任意目标推理格式，以进行性能分析。

简介

MMDeploy 是一个开源的深度学习模型部署工具集，它是 OpenMMLab 项目的一部分。

主要特性

完全支持 OpenMMLab 模型

目前支持的代码库和模型如下，未来还将继续增加：

支持多种推理后端

支持的设备-平台-推理后端矩阵如下，未来还将兼容更多选项。

基准测试结果可参见这里。

设备 / 平台	Linux	Windows	macOS	Android
x86_64 CPU	_onnxruntime _pplnn _ncnn _LibTorch _OpenVINO _TVM	_onnxruntime _OpenVINO _ncnn	-	-
ARM CPU	_ncnn	-	-	_ncnn
RISC-V	_ncnn	-	-	-
NVIDIA GPU	_onnxruntime _TensorRT _LibTorch _pplnn	_onnxruntime _TensorRT	-	-
NVIDIA Jetson	_TensorRT	-	-	-
Huawei ascend310	_CANN	-	-	-
Rockchip	_RKNN	-	-	-
Apple M1	-	-	_CoreML	-
Adreno GPU	-	-	-	_SNPE _ncnn
Hexagon DSP	-	-	-	_SNPE

高效且可扩展的 C/C++ SDK 框架

SDK 中的各种模块均可扩展，例如用于图像处理的 Transform、用于神经网络推理的 Net、用于后处理的 Module 等等。

文档

请阅读 getting_started，了解 MMDeploy 的基本用法。我们还提供了以下教程：

基准测试与模型库

您可以在这里找到支持的模型，以及它们在基准测试中的表现。

贡献

我们非常感谢所有对 MMDeploy 的贡献。请参阅 .github/CONTRIBUTING.md 获取贡献指南。

致谢

我们衷心感谢以下团队对 MMDeploy 的贡献：

引用

如果您在研究中发现本项目有用，请考虑引用：

@misc{=mmdeploy,
    title={OpenMMLab 的模型部署工具箱},
    author={MMDeploy 贡献者},
    howpublished = {\url{https://github.com/open-mmlab/mmdeploy}},
    year={2021}
}

许可证

本项目采用 Apache 2.0 许可证发布。

OpenMMLab 中的项目

MMEngine：OpenMMLab 用于训练深度学习模型的基础库。
MMCV：OpenMMLab 用于计算机视觉的基础库。
MMPretrain：OpenMMLab 的预训练工具箱和基准。
MMagic：OpenMMLab 高级、生成式和智能创作工具箱。
MMDetection：OpenMMLab 的检测工具箱和基准。
MMDetection3D：OpenMMLab 下一代通用 3D 物体检测平台。
MMYOLO：OpenMMLab YOLO 系列工具箱和基准。
MMRotate：OpenMMLab 旋转目标检测工具箱和基准。
MMTracking：OpenMMLab 视频感知工具箱和基准。
MMSegmentation：OpenMMLab 语义分割工具箱和基准。
MMOCR：OpenMMLab 文本检测、识别和理解工具箱。
MMPose：OpenMMLab 姿态估计工具箱和基准。
MMHuman3D：OpenMMLab 3D 人体参数化模型工具箱和基准。
MMFewShot：OpenMMLab 少样本学习工具箱和基准。
MMAction2：OpenMMLab 下一代动作理解工具箱和基准。
MMFlow：OpenMMLab 光流工具箱和基准。
MMDeploy：OpenMMLab 模型部署框架。
MMRazor：OpenMMLab 模型压缩工具箱和基准。
MIM：MIM 用于安装 OpenMMLab 的软件包。
Playground：一个汇集和展示基于 OpenMMLab 构建的精彩项目的中心平台。

MMDeploy 快速上手指南

MMDeploy 是 OpenMMLab 推出的开源深度学习模型部署工具集，支持将 OpenMMLab 系列算法模型转换为多种推理后端格式（如 ONNX, TensorRT, NCNN, OpenVINO 等），并提供高效的 C/C++ SDK。

环境准备

在开始之前，请确保满足以下系统要求和依赖版本对齐。MMDeploy 1.x 版本需配合 OpenMMLab 2.0 系列代码库使用。

版本对齐要求

组件	MMDeploy 0.x (已弃用)	MMDeploy 1.x (推荐)
mmdeploy	0.x.y	1.x.y
mmengine	-	0.x.y
mmcv	<= 1.x.y	2.x.y
mmdet (示例)	<= 2.x.y	3.x.y
其他算法库	0.x.y	1.x.y

前置依赖

操作系统: Linux (推荐), Windows, macOS (部分后端), Android
Python: 3.6+
PyTorch: 1.8+ (需与 mmcv/mmcv-full 版本匹配)
CUDA: 根据选择的推理后端（如 TensorRT）安装对应版本（可选，CPU 后端无需 CUDA）

安装步骤

推荐使用 pip 进行安装。为确保下载速度，建议使用国内镜像源。

1. 安装基础依赖

首先安装 PyTorch 和 MMEngine、MMCV。以下命令以 CUDA 11.x 为例（如需 CPU 版本或其他 CUDA 版本，请参考 PyTorch 官网）：

# 使用清华镜像源加速安装
pip install torch torchvision torchaudio --index-url https://pypi.tuna.tsinghua.edu.cn/simple

# 安装 MMEngine
pip install -U openmim
mim install mmengine

# 安装 MMCV 2.x (注意：MMDeploy 1.x 需要 mmcv >= 2.0.0)
mim install "mmcv>=2.0.0"

2. 安装 MMDeploy

直接通过 pip 安装最新稳定版：

# 使用国内镜像源
pip install -U mmdeploy --extra-index-url https://pypi.tuna.tsinghua.edu.cn/simple

# 或者安装包含特定后端的版本（例如 TensorRT，需先配置好 TensorRT 环境）
# pip install -U mmdeploy[tensorrt]

注意：如果需要从源码编译以支持特定硬件后端（如 RKNN, Ascend, SNPE 等），请参考官方文档的“从源码构建”章节。

基本使用

MMDeploy 的核心功能是通过 tools/deploy.py 脚本将训练好的模型转换为部署格式。以下是一个将 MMDetection 模型转换为 ONNX 格式的简单示例。

1. 准备模型配置文件与权重

假设你有一个基于 MMDetection 3.x 训练的模型，拥有配置文件 config.py 和权重文件 checkpoint.pth。

2. 执行模型转换

运行以下命令将模型导出为 ONNX 格式：

python tools/deploy.py \
    <deploy-config> \
    <model-config> \
    <checkpoint> \
    <input-image> \
    --work-dir <output-dir>

具体示例（以 MMDetection 的 Faster R-CNN 为例）：

# 1. 获取 MMDeploy 自带的部署配置文件 (若未安装源码，可从 GitHub 下载对应的 config 文件)
# 这里假设使用的是 mmdet 的 onnxruntime 静态形状配置
wget https://raw.githubusercontent.com/open-mmlab/mmdeploy/main/configs/mmdet/instance-seg/onnxruntime/static.py -O deploy_config.py

# 2. 执行转换
python tools/deploy.py \
    deploy_config.py \
    path/to/mmdet_config.py \
    path/to/checkpoint.pth \
    demo.jpg \
    --work-dir work_dir

3. 验证与推理

转换成功后，work-dir 目录下将生成 .onnx 模型文件及相关的元数据。你可以使用 MMDeploy 提供的测试脚本验证模型效果：

python tools/test.py \
    path/to/mmdet_config.py \
    work_dir/end2end.onnx \
    --img demo.jpg \
    --show

或者使用生成的 SDK 进行 C++/Python 推理（需编译 SDK）。

更多详细用法、支持的模型列表及特定后端（如 TensorRT, NCNN）的配置，请参阅 MMDeploy 官方文档。

版本历史

v1.3.12023/12/25

v1.3.02023/09/22

v1.2.02023/06/30

v1.1.02023/05/24

v1.0.02023/04/06

v0.14.02023/04/06

v1.0.0rc32023/02/24

v1.0.0rc22023/02/16

v0.13.02023/02/16

v1.0.0rc12022/12/30

v0.12.02022/12/30

v1.0.0rc02022/12/01

v0.11.02022/12/01

v0.10.02022/10/31

v0.9.02022/09/29

v0.8.02022/09/07

v0.7.02022/08/04

v0.6.02022/06/30

v0.5.02022/06/09

v0.4.12022/04/29

常见问题

使用 C++ SDK 进行实例分割时，输出的掩码（mask）为空或无法显示，如何解决？

模型转换为 TensorRT 引擎后，检测结果的置信度（Score）大幅下降怎么办？

在 Windows 上编译或使用 C++ SDK 时，遇到找不到 DLL 文件（如 opencv_world460.dll）或加载失败的问题如何解决？

在 Windows 上编译支持 CUDA 的 SDK 时，出现 "Enable language CUDA" 错误或 MSBuild 集成问题怎么办？

使用 Python 脚本转换模型成功，但在使用 C++ 推理时提示需要安装插件库，该如何操作？

CMake 配置时报错找不到 cuDNN 头文件或库文件，即使指定了 cudatoolkit 目录也不行，如何解决？

模型转换过程中出现大量 TracerWarning 警告（如 tensor 转 int、迭代 tensor 等），会影响最终模型效果吗？

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

★ 349.3k|★★★☆☆|昨天

Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|昨天

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 142.7k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 107.9k|★★☆☆☆|今天

开发框架图像Agent

markitdown

MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器

★ 93.4k|★★☆☆☆|今天

插件开发框架

LLMs-from-scratch

LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目，旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型（LLM）。它不仅是同名技术著作的官方代码库，更提供了一套完整的实践方案，涵盖模型开发、预训练及微调的全过程。该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型，却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码，用户能够透彻掌握 Transformer 架构、注意力机制等关键原理，从而真正理解大模型是如何“思考”的。此外，项目还包含了加载大型预训练权重进行微调的代码，帮助用户将理论知识延伸至实际应用。 LLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API，而是渴望探究模型构建细节的技术人员而言，这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计：将复杂的系统工程拆解为清晰的步骤，配合详细的图表与示例，让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础，还是为未来研发更大规模的模型做准备

★ 90.1k|★★★☆☆|今天

语言模型图像Agent