open_model_zoo

4.4k 1.4k 简单 1 次阅读昨天Apache-2.0开发框架语言模型

AI 解读由 AI 自动生成，仅供参考

open_model_zoo 是 Intel OpenVINO™ 工具套件的一部分，提供了一个丰富的高质量预训练深度学习模型库及配套演示程序。它的核心目标是帮助开发者跳过耗时的模型训练过程，直接利用已经过优化、推理速度极快的现成模型，从而大幅加速高性能人工智能应用的开发与落地部署。

对于希望快速构建计算机视觉、自然语言处理等 AI 功能的软件工程师和算法研究人员而言，open_model_zoo 是极佳的起点。它不仅收录了 Intel 官方优化的模型，还整合了广泛的公共预训练模型，并通过自动化的“模型下载器”工具简化获取流程。此外，项目内置的“精度检查器”能有效验证模型表现，而丰富的示例代码则直观展示了如何将这些模型与 OpenVINO™ 结合，实现从云端到边缘设备的高效推理。

值得一提的是，该仓库目前主要处于维护模式，官方更推荐用户结合最新的 Jupyter Notebook 教程进行探索。作为一个基于 Apache 2.0 协议开源的项目，open_model_zoo 以免费、开放的态度支持社区贡献，旨在让人工智能技术的门槛更低，让创新想法能更快地转化为实际产品。

使用场景

某智慧交通团队需要在边缘设备上快速部署一套高精度车辆检测系统，以实时分析路口车流数据。

没有 open_model_zoo 时

团队需从零开始收集海量交通图像数据并手动标注，耗时数周且成本高昂。
自行训练深度学习模型需要反复调参优化，不仅占用大量 GPU 算力，还难以保证收敛效果。
将训练好的通用模型移植到 Intel 边缘设备时，面临复杂的算子适配问题，推理延迟高达数百毫秒。
缺乏现成的验证工具，无法快速量化模型在实际场景中的准确率，导致上线风险不可控。

使用 open_model_zoo 后

直接通过 Model Downloader 获取经 Intel 预训练并优化的车辆检测模型（如 vehicle-detection-0200），立即可用。
省去漫长的训练过程，利用内置的 Accuracy Checker 工具迅速完成模型在特定数据集上的精度验证。
模型已针对 OpenVINO 工具包深度优化，在边缘设备上推理速度提升数倍，轻松满足实时性要求。
参考官方提供的 Demo 代码快速搭建原型应用，将原本数月的开发周期压缩至几天内完成。

open_model_zoo 通过提供高质量、即插即用的预训练模型与自动化工具，让开发者跳过繁琐的训练与适配环节，实现高性能 AI 应用的极速落地。

运行环境要求

GPU

未说明

内存

未说明

依赖

notes该仓库主要提供针对 OpenVINO™ Toolkit 优化的预训练模型和演示程序。目前处于维护模式，建议用户参考 openvino_notebooks 中的 Jupyter Notebook 教程。包含模型下载器、精度检查器等自动化工具。支持通过命令关闭遥测数据收集。

python未说明

OpenVINO™ Toolkit

快速开始

OpenVINO™ 工具套件 - Open Model Zoo 仓库

[!注意] Open Model Zoo 目前作为模型来源处于维护模式。请参阅 Jupyter 笔记本中的模型教程。

该仓库包含经过优化的深度学习模型和一系列演示程序，旨在加速高性能深度学习推理应用的开发。您可以使用这些免费的预训练模型，而无需自行训练模型，从而加快开发和生产部署流程。

英特尔致力于尊重人权并避免参与侵犯人权的行为，这一政策体现在英特尔全球人权原则中。因此，通过访问本平台上的英特尔材料，您即表示同意不会将这些材料用于可能导致或助长违反国际公认人权的产品或应用程序中。

仓库组成部分：

英特尔预训练模型
公开预训练模型
模型下载器及其他自动化工具
展示如何使用 OpenVINO™ 工具套件运行模型的演示程序
用于验证模型准确性的准确性检查工具

许可证

Open Model Zoo 采用 Apache 许可证 2.0 版许可。

遥测

OpenVINO™ 会收集软件性能和使用数据，以改进 OpenVINO™ 工具。这些数据由 OpenVINO™ 直接收集，或通过 Google Analytics 4 收集。您可以通过运行以下命令随时选择退出：

opt_in_out --opt_out

在线文档

其他使用示例

如何贡献

我们欢迎社区为 Open Model Zoo 仓库做出贡献。如果您有任何改进产品的想法，请按照以下步骤与我们分享：

确保您能够构建产品，并使用您的补丁运行所有演示程序。
如果是较大的功能，请提供相应的演示。
在 https://github.com/openvinotoolkit/open_model_zoo/pulls 提交拉取请求。

有关模型贡献的更多信息，请参阅这里。

我们将审核您的贡献，如果需要进行额外的修复或修改，可能会向您提供建议以指导您。一旦被接受，您的拉取请求将被合并到 GitHub* 仓库中。

Open Model Zoo 采用 Apache 许可证 2.0 版。通过为该项目做出贡献，您即表示同意其中的许可和版权条款，并在此许可下发布您的贡献。

支持

如有任何问题、错误或建议，请通过以下方式反馈：

StackOverflow* 上的 #open_model_zoo 标签
GitHub* 的问题页面 (https://github.com/openvinotoolkit/open_model_zoo/issues)
论坛 (https://community.intel.com/t5/Intel-Distribution-of-OpenVINO/bd-p/distribution-openvino-toolkit)
Gitter (https://gitter.im/open_model_zoo/community)

* 其他名称和品牌可能属于其各自的所有者。

Open Model Zoo 快速上手指南

Open Model Zoo 是 OpenVINO™ 工具包的一部分，提供大量经过优化的预训练深度学习模型和演示程序，旨在加速高性能推理应用的开发与部署。

注意：Open Model Zoo 目前处于维护模式，主要作为模型来源。建议开发者参考 OpenVINO Notebooks 中的 Jupyter 教程获取最新的使用示例。

环境准备

在开始之前，请确保您的开发环境满足以下要求：

操作系统：
- Linux (Ubuntu 18.04/20.04/22.04, CentOS 7/8)
- Windows 10/11
- macOS (部分支持)
前置依赖：
- OpenVINO™ Toolkit：必须已安装 OpenVINO 运行时或开发套件（推荐版本 2023.0 及以上）。
- Python：建议 Python 3.8 - 3.11。
- CMake：用于构建演示程序（如需编译 C++ 演示）。
- Git：用于克隆仓库。
- pip：用于安装 Python 依赖。

国内加速建议：由于仓库托管在 GitHub，国内用户克隆时若速度较慢，可使用 Gitee 镜像（如有）或配置 Git 代理。安装 Python 依赖时，建议指定国内 pip 源（如清华源、阿里源）以加速下载。

安装步骤

1. 克隆仓库

将 Open Model Zoo 代码克隆到本地：

git clone https://github.com/openvinotoolkit/open_model_zoo.git
cd open_model_zoo

2. 安装模型下载工具依赖

进入工具目录并安装必要的 Python 包：

cd tools/model_tools
pip install -r requirements.in
# 国内用户推荐使用清华源加速：
# pip install -r requirements.in -i https://pypi.tuna.tsinghua.edu.cn/simple

3. 验证环境

确保 omz_downloader 命令可用（需将 OpenVINO 环境变量加载到当前终端）：

Linux:

source /opt/intel/openvino_2023/bin/setupvars.sh
# 或者如果您安装在其他路径，请调整上述路径

Windows (PowerShell):

& "C:\Program Files (x86)\Intel\openvino_2023\bin\setupvars.ps1"

基本使用

Open Model Zoo 的核心功能是快速下载预训练模型并运行演示。以下是两个最常用的场景。

场景一：下载模型

使用 omz_downloader 工具从云端下载模型。以下示例下载一个常用的人脸检测模型 face-detection-adas-0001。

omz_downloader --name face-detection-adas-0001

下载后的模型默认保存在 intel-models 目录中。
您可以使用 --list 参数查看所有可用模型名称。

场景二：运行演示程序

下载模型后，可以使用提供的演示程序验证模型效果。以下示例使用人脸检测模型进行图像推理。

构建演示程序（以 C++ 演示为例，需先安装 CMake 和编译器）：
```
cd demos
mkdir build && cd build
cmake ..
make
```
运行演示：假设您已下载模型并有一张测试图片 test.jpg：
```
./object_detection_demo_ssd_async \
  -m ../../intel-models/intel/face-detection-adas-0001/FP32/face-detection-adas-0001.xml \
  -i test.jpg \
  -d CPU
```
- -m: 指定模型路径 (.xml 文件)。
- -i: 指定输入图片或视频路径。
- -d: 指定推理设备（如 CPU, GPU, MYRIAD 等）。

提示：对于 Python 开发者，更推荐直接使用 OpenVINO Notebooks 中的示例代码，通过几行 Python 代码即可加载模型并进行推理，无需编译 C++ 演示。

常见问题

如何在 OpenCV 中使用 Intel Inference Engine 预训练模型进行物体检测（如人脸、车辆）？

如何在 OpenCV 中处理具有多个输入层（如 "data" 和 "seq_ind"）的模型？

在 Raspberry Pi 4 上运行 C++ demo 时出现 "malloc(): unsorted double linked list corrupted" 错误如何解决？

使用 OpenVINO POT 工具量化模型时遇到 "Quantize layer only supports per tensor and per channel quantization" 错误怎么办？

加载 OpenVINO 预构建的 OpenCV 时提示 "Build OpenCV with Inference Engine to enable loading models" 错误如何解决？

为什么 human-pose-estimation-0001 模型的 mAP 只有 42.8%，低于 OpenPose 论文的 60%？

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

★ 349.3k|★★★☆☆|1周前

Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|1周前

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 157.4k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 108.3k|★★☆☆☆|6天前

开发框架图像Agent

gemini-cli

gemini-cli 是一款由谷歌推出的开源 AI 命令行工具，它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言，它提供了一条从输入提示词到获取模型响应的最短路径，无需切换窗口即可享受智能辅助。这款工具主要解决了开发过程中频繁上下文切换的痛点，让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用，还是执行复杂的 Git 操作，gemini-cli 都能通过自然语言指令高效处理。它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口，具备出色的逻辑推理能力；内置 Google 搜索、文件操作及 Shell 命令执行等实用工具；更独特的是，它支持 MCP（模型上下文协议），允许用户灵活扩展自定义集成，连接如图像生成等外部能力。此外，个人谷歌账号即可享受免费的额度支持，且项目基于 Apache 2.0 协议完全开源，是提升终端工作效率的理想助手。

★ 100.8k|★★☆☆☆|6天前

插件Agent图像

markitdown

MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器

★ 93.4k|★★☆☆☆|1周前

插件开发框架