awesome-emdl

767 167 非常简单 1 次阅读 2天前MIT开发框架

AI 解读由 AI 自动生成，仅供参考

awesome-emdl 是一个专注于嵌入式与移动端深度学习研究的开源资源合集。随着人工智能向边缘设备延伸，如何在算力有限、内存受限的微控制器和手机上高效运行深度模型，成为行业一大难题。awesome-emdl 正是为解决这一痛点而生，它系统性地整理了该领域的前沿学术论文、轻量级模型架构以及底层系统优化方案。

这份清单不仅涵盖了模型压缩、神经架构搜索（NAS）等综述文章，还收录了 MobileNet、GhostNet、MCUNet 等经典的轻量化网络，以及针对 FPGA 加速和随机计算等底层系统的最新研究成果。对于希望深入理解 TinyML 技术栈的研究人员，或是需要在实际项目中部署高效 AI 模型的嵌入式开发者而言，awesome-emdl 提供了一条清晰的学习路径和权威的参考文献索引。它帮助用户快速定位从理论综述到代码实现的关键资源，避免了在海量信息中盲目摸索。无论是学术探索还是工程落地，awesome-emdl 都是进入嵌入式深度学习领域不可或缺的导航工具。

使用场景

某嵌入式团队正致力于在低功耗微控制器上部署实时跌倒检测算法，以用于独居老人的智能监护手环。

没有 awesome-emdl 时

文献检索如大海捞针：工程师需手动在 arXiv、IEEE 及各大会议网站分散搜索"TinyML"或“模型压缩”相关论文，耗时数周仍难以覆盖最新成果。
选型缺乏硬件依据：面对众多轻量级网络，无法快速找到针对特定微控制器（如 ARM Cortex-M）的基准测试数据，导致模型在内存占用或推理速度上不达标。
复现成本极高：缺少系统整理的开源代码库链接，团队需从零复现经典算法（如 MobileNet 变体），常因细节缺失而陷入调试困境。
技术视野受限：容易忽略跨领域的创新方案（如基于 FPGA 的加速框架或随机计算新方法），错失优化系统能效的最佳路径。

使用 awesome-emdl 后

一站式获取前沿资源：直接通过分类清晰的列表，快速获取包括 NeurIPS、CVPR 在内的顶会最新综述与核心论文，将调研周期从数周缩短至两天。
精准匹配硬件约束：利用收录的基准测试报告（如 TinyML Platforms Benchmarking），迅速锁定适合手环芯片的极致轻量模型（如 EtinyNet 或 MCUNet）。
加速落地验证：通过列表中提供的官方 Repo 链接，直接复用经过验证的代码实现，大幅降低开发门槛并提升原型迭代速度。
激发系统级创新：接触到 BSC 块随机计算等前沿系统优化方案，成功在保持精度的同时将功耗进一步降低 30%，延长了设备续航。

awesome-emdl 将碎片化的嵌入式深度学习研究资源整合为结构化知识图谱，帮助开发者在资源受限的边缘设备上高效实现从理论到落地的跨越。

运行环境要求

GPU

未说明

内存

未说明

依赖

notes该仓库（awesome-emdl）并非一个可执行的软件工具或框架，而是一个嵌入式和移动深度学习（TinyML/EMDL）领域的论文、项目和库的资源列表（Awesome List）。README 内容主要包含相关研究论文链接以及现有的推理框架（如 MNN, CoreML, Arm NN, Paddle Lite 等）的引用。因此，该仓库本身没有特定的操作系统、GPU、内存、Python 版本或依赖库要求。用户若需运行列表中提到的具体项目或使用列出的框架，需参考各自项目的文档以获取具体的环境需求。

python未说明

快速开始

令人惊叹的 EMDL

嵌入式与移动深度学习研究笔记。

论文

剪枝

近似

特征分析

智能手机上深度学习应用初探 [WWW'19]
Facebook的机器学习：理解边缘推理 [HPCA'19]
NetAdapt：面向移动应用的平台感知型神经网络自适应 [ECCV 2018]
移动计算机视觉中卷积神经网络的延迟与吞吐量特征分析 [MMSys’18]

库

推理框架

阿里巴巴 - MNN - 是一个极速、轻量级的深度学习框架，已在阿里巴巴的关键业务场景中经过严格考验。
苹果 - CoreML - 用于将机器学习模型集成到你的应用中。BERT和GPT-2在iPhone上的实现
Arm - ComputeLibrary - 是一套针对Arm CPU和GPU优化的计算机视觉和机器学习函数库，采用了SIMD技术。简介
Arm - Arm NN - 是Android和Linux平台上性能最优的机器学习推理引擎，可在Arm Cortex-A CPU和Arm Mali GPU上加速机器学习任务。
百度 - Paddle Lite - 是一个多平台的高性能深度学习推理引擎。
DeepLearningKit - 是适用于苹果iOS、OS X和tvOS的开源深度学习框架。
Edge Impulse - 一个交互式平台，用于生成可在微控制器上运行的模型。他们在社交媒体上也非常活跃，分享关于边缘AI/ TinyML的最新动态。
谷歌 - TensorFlow Lite - 是一个面向设备端推理的开源深度学习框架。
英特尔 - OpenVINO - 是一个全面的工具包，用于优化你的流程以实现更快的推理速度。
JDAI计算机视觉 - dabnn - 是一个针对移动平台加速二值神经网络推理的框架。
Meta - PyTorch Mobile - 是一个新框架，旨在帮助移动开发者和机器学习工程师将PyTorch的ML模型嵌入到设备端。
微软 - DeepSpeed - 是一个深度学习优化库，使分布式训练和推理变得简单、高效且有效。
微软 - ELL - 允许你设计并部署智能机器学习模型到资源受限的平台和小型单板计算机上，如Raspberry Pi、Arduino和micro:bit。
微软 - ONNX Runtime - 是一个跨平台、高性能的ML推理和训练加速器。
英伟达 - TensorRT - 是一个C++库，用于在NVIDIA GPU和深度学习加速器上实现高性能推理。
OAID - Tengine - 是一个轻量级、高性能、模块化的嵌入式设备推理引擎。
高通 - AI神经处理SDK - 提供给开发者的库，用于在骁龙移动平台上运行NN模型，充分利用CPU、GPU和/或DSP。
腾讯 - ncnn - 是一个为移动平台优化的高性能神经网络推理框架。
uTensor - 基于mbed（一种针对ARM芯片组的RTOS）和TensorFlow的AI推理库。
小米 - Mace - 是一个为移动异构计算平台优化的深度学习推理框架。
xmartlabs - Bender - 轻松在iOS上构建快速的神经网络！使用TensorFlow模型。底层采用Metal技术。

优化工具

Neural Network Distiller - 用于神经网络压缩研究的Python软件包。
PocketFlow - 一个自动模型压缩（AutoMC）框架，用于开发更小、更快的AI应用。

研究演示

RSTensorFlow - 面向普通安卓设备的GPU加速TensorFlow。

Web

mil-tokyo/webdnn - 在Web浏览器上最快的DNN执行框架。

通用

边缘 / Tiny MLOps

Tiny-MLOps：一个用于在物联网系统远端编排ML应用的框架 [EAIS '22]
TinyML的MLOps：大规模部署TinyML的挑战与方向 [TinyML Talks '22]
TinyMLOps：广泛采用边缘AI面临的运营挑战 [arXiv '22]
用于物联网中机器学习的TinyMLaaS生态系统：概述与研究挑战 [VLSI-DAT '21]
SOLIS：从数据采集到可操作洞察的MLOps之旅 [arXiv '21]
边缘MLOps：面向AIoT应用的自动化框架 [IC2E '21]
SensiX++：将MLOPs和多租户模型服务引入感官边缘设备 [arXiv '21，诺基亚]

Vulkan

OpenCL

DeepMon

RenderScript

Mobile_ConvNet：Android上的RenderScript CNN

教程

通用

NEON

NEON™程序员指南

OpenCL

课程

工具

GPU

驱动程序

awesome-emdl 快速上手指南

awesome-emdl 并非一个可直接安装运行的软件库或框架，而是一个嵌入式与移动端深度学习（Embedded & Mobile Deep Learning）的研究资源清单。它汇集了该领域最新的综述论文、高效模型架构、系统优化方案、量化剪枝技术以及主流推理框架。

本指南旨在帮助中国开发者如何利用该清单快速构建知识体系并选择合适的工具链进行开发。

环境准备

由于本项目是资源索引，无需特定的运行时环境。但为了复现清单中提到的模型或使用相关框架，建议准备以下基础环境：

操作系统：Linux (Ubuntu 18.04/20.04 推荐), macOS, 或 Windows (WSL2)
编程语言：Python 3.6+
核心依赖：
- PyTorch 或 TensorFlow (用于模型训练与转换)
- Git (用于克隆仓库)
硬件目标（可选）：
- 移动端：Android/iOS 设备
- 嵌入式：树莓派 (Raspberry Pi), NVIDIA Jetson 系列，或 STM32 等微控制器
网络加速：
- 访问 GitHub 源码时，建议使用国内镜像源（如 Gitee 搜索对应项目镜像）或配置代理。
- 下载论文数据集时，可使用 ArXiv 国内镜像。

获取资源

该项目没有传统的“安装”步骤，主要通过克隆仓库获取资源列表。

# 克隆仓库到本地
git clone https://github.com/aihacker/awesome-emdl.git

# 进入目录
cd awesome-emdl

# 查看资源列表
cat README.md

提示：如果 GitHub 连接缓慢，可尝试在 Gitee 上搜索 awesome-emdl 查找国内镜像仓库进行克隆。

基本使用

使用 awesome-emdl 的核心在于根据你的具体需求（如：模型压缩、特定硬件部署、低精度推理），从清单中定位对应的论文或开源框架。

场景一：寻找适合移动端的轻量级模型

如果你需要在手机或嵌入式设备上运行目标检测或分类任务，请参考 Model 章节：

查阅 MobileNetV3, GhostNet, 或 MCUNet 相关论文链接。
根据论文标题旁的 [Repo] 标识（如有）或论文名称，在 GitHub 搜索官方实现代码。
例如，搜索 MobileNetV3 pytorch 获取预训练模型。

场景二：选择端侧推理引擎

如果你已经训练好模型，需要将其部署到特定硬件，请参考 Libraries -> Inference Framework 章节：

Android/Linux (ARM 架构): 推荐使用 MNN (阿里开源，国内文档完善) 或 Arm NN。
- MNN 地址：https://github.com/alibaba/MNN
iOS/macOS: 直接使用 CoreML。
微控制器 (MCU): 参考 Edge Impulse 平台或 TinyML 相关论文。

场景三：模型压缩与加速

如果需要减小模型体积或提升推理速度，请参考 Quantization (量化) 和 Pruning (剪枝) 章节：

阅读 Deep Compression 或 Quantizing deep convolutional networks 等综述了解原理。
查找 Awesome-Pruning 仓库获取具体的剪枝算法实现代码。
利用 PyTorch Quantization 或 TensorFlow Lite 内置工具进行实验。

示例工作流

假设你要在树莓派上部署一个图像分类模型：

选型：在 Model 部分选择 MobileNetV2 或 ShuffleNet。
训练：使用 PyTorch 训练模型。
转换：在 Libraries 部分选择 MNN 或 TFLite (虽未列出但属同类)，将模型转换为 .mnn 或 .tflite 格式。
部署：参考对应框架的 C++ 或 Python API 文档在树莓派上加载模型并推理。

通过浏览 awesome-emdl 的分类目录，你可以快速找到上述每个环节的最优学术方案和工业界实现。

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

★ 349.3k|★★★☆☆|1周前

Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|1周前

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 160.4k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 109.2k|★★☆☆☆|今天

开发框架图像Agent

gemini-cli

gemini-cli 是一款由谷歌推出的开源 AI 命令行工具，它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言，它提供了一条从输入提示词到获取模型响应的最短路径，无需切换窗口即可享受智能辅助。这款工具主要解决了开发过程中频繁上下文切换的痛点，让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用，还是执行复杂的 Git 操作，gemini-cli 都能通过自然语言指令高效处理。它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口，具备出色的逻辑推理能力；内置 Google 搜索、文件操作及 Shell 命令执行等实用工具；更独特的是，它支持 MCP（模型上下文协议），允许用户灵活扩展自定义集成，连接如图像生成等外部能力。此外，个人谷歌账号即可享受免费的额度支持，且项目基于 Apache 2.0 协议完全开源，是提升终端工作效率的理想助手。

★ 100.8k|★★☆☆☆|1周前

插件Agent图像

markitdown

MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器

★ 93.4k|★★☆☆☆|1周前

插件开发框架

使用场景

没有 awesome-emdl 时

使用 awesome-emdl 后

运行环境要求

快速开始

令人惊叹的 EMDL

论文

综述

模型

系统

量化

剪枝

近似

特征分析

库

推理框架

优化工具

研究演示

Web

通用

边缘 / Tiny MLOps

Vulkan

OpenCL

RenderScript

教程

通用

NEON

OpenCL

课程

工具

GPU

驱动程序

相关仓库

awesome-emdl 快速上手指南

环境准备

获取资源

基本使用

场景一：寻找适合移动端的轻量级模型

场景二：选择端侧推理引擎

场景三：模型压缩与加速

示例工作流

相似工具推荐

openclaw

stable-diffusion-webui

everything-claude-code

ComfyUI

gemini-cli

markitdown