tinyml-papers-and-projects

994 160 非常简单 1 次阅读今天MIT图像开发框架

AI 解读由 AI 自动生成，仅供参考

tinyml-papers-and-projects 是一个专注于 TinyML（微型机器学习）领域的精选资源库，旨在汇集该方向最具价值的学术论文、开源项目、技术文章及演讲资料。随着物联网设备对本地智能处理需求的激增，如何在内存仅几 KB 的微控制器上高效运行深度学习模型成为一大挑战，而该资源库正是为解决这一痛点而生。它系统性地整理了从模型压缩、量化训练到硬件感知架构搜索等关键技术的前沿成果，帮助从业者快速定位从理论突破到落地实践的核心资料。

无论是希望深入探索算法优化的研究人员，还是需要在资源受限设备上部署 AI 应用的嵌入式开发者，都能从中获益。资源库按年份梳理了包括 SqueezeNet、CMSIS-NN、ProxylessNAS 等里程碑式论文，并收录了如 OpenMV、GesturePod 等具有参考价值的实战项目代码。其独特的亮点在于不仅涵盖纯理论研究，还特别关注软硬件协同设计与实际基准测试，提供了从书籍、课程到工具库的全方位学习路径。对于想要入门或深耕端侧智能的工程师而言，tinyml-papers-and-projects 就像一位博学的向导，让复杂的技术演进脉络变得清晰可循，极大地降低了学习与研发门槛。

使用场景

一家初创团队正致力于开发一款基于微控制器的智能助听器，需要在极低的功耗和有限的内存（仅几百 KB）下实现实时的噪音消除与人声增强。

没有 tinyml-papers-and-projects 时

文献检索如大海捞针：团队成员需分别在 arXiv、IEEE 和各大会议网站手动搜索"TinyML"、“模型压缩”等关键词，耗时数周仍难以覆盖 2016 年至 2024 年的关键论文（如 SqueezeNet 或 HAQ）。
技术选型缺乏依据：面对量化、剪枝等多种优化方案，无法快速找到针对 ARM Cortex-M 架构的基准测试数据，导致在算法选择上盲目试错。
重复造轮子风险高：由于不了解开源社区已有的成熟项目（如 CMSIS-NN 内核或 OpenMV 案例），团队可能花费大量精力重新实现基础功能。
硬件适配周期漫长：缺乏针对特定硬件的资源清单，工程师在将模型部署到 2KB RAM 设备时，常因内存溢出问题陷入漫长的调试循环。

使用 tinyml-papers-and-projects 后

一站式获取核心成果：团队直接通过该列表按年份筛选，迅速锁定了《Deep Compression》和《Hello Edge》等奠基性论文，半天内完成了技术背景调研。
精准匹配硬件方案：借助列表中"Hardware-Aware"相关的论文与项目链接，直接采用了经过验证的混合精度量化策略，显著提升了推理效率。
复用成熟代码库：通过"Awesome Projects"板块找到了针对微控制器优化的神经网络内核源码，直接集成而非从头编写，节省了两个月开发时间。
规避已知陷阱：参考列表中关于资源受限设备的案例分析，提前规划了内存管理策略，一次性通过了在低功耗芯片上的部署测试。

tinyml-papers-and-projects 将原本分散且晦涩的学术资源转化为结构化的工程指南，极大地缩短了从理论验证到嵌入式落地的研发周期。

运行环境要求

GPU

未说明

内存

未说明

依赖

notes该仓库是一个关于 TinyML（微型机器学习）的论文、项目和资源列表（Awesome List），本身不是一个可执行的软件工具或代码库，因此没有特定的操作系统、硬件或依赖库安装需求。用户主要利用此列表查找相关研究论文和外部项目链接。部分列出的子项目（如 TensorFlow Lite Micro, CMSIS-NN）通常针对微控制器（MCU）等嵌入式设备，而非通用计算机环境。

python未说明

快速开始

TinyML 论文与项目

TinyML 太棒了。

这是一个关于 TinyML 的有趣论文、项目、文章和演讲的列表。

精彩论文: 2016 | 2017 | 2018 | 2019 | 2020 | 2022 | 2023 | 2024 | 2025
精彩项目: 项目源代码 | 项目文章
基准测试
资源
联系与反馈

精彩论文

2016

DEEP COMPRESSION: 使用剪枝、量化训练和霍夫曼编码压缩深度神经网络 | [pdf]
[SQUEEZENET] 以比 AlexNet 少 50 倍的参数和小于 0.5MB 的模型大小实现 AlexNet 级别的准确率 | [pdf]

2017

用于仅使用整数运算高效推理的神经网络量化与训练 | [pdf]
物联网中仅需 2 KB 内存的资源高效机器学习 | [pdf]
ProtoNN: 面向资源匮乏设备的压缩且精确的 kNN | [pdf]
OPENMV: 一款由 Python 驱动、可扩展的机器视觉相机 | [pdf] [官方代码]

2018

[AMC] 用于移动设备上模型压缩与加速的 AutoML | [pdf] [官方代码]
ARM 上的移动机器学习硬件：片上系统（SoC）视角 | [pdf]
[HAQ] 具有混合精度的硬件感知自动化量化 | [pdf]
面向真实世界系统的高效且鲁本的机器学习 | [pdf]
[GesturePod] 针对视障人士的手势交互手杖 | [pdf]
[YOLO-LITE] 针对非 GPU 计算机优化的实时目标检测算法 | [pdf]
[CMSIS-NN] 适用于 Arm Cortex-M CPU 的高效神经网络内核 | [pdf]
为高效推理而对深度卷积网络进行量化：白皮书 | [pdf]
[Hello Edge] 微控制器上的关键词检测 | [pdf]

▲ 返回顶部

2019

FastGRNN: 一种快速、准确、稳定且体积小巧的千字节级门控循环神经网络 | [pdf]
物联网边缘设备上的图像分类：性能分析与建模 | [pdf]
[PROXYLESSNAS] 直接在目标任务和硬件上进行神经架构搜索 | [pdf] [官方代码]
通过迁移学习实现设备端 CNN 推理的节能硬件 | [pdf]
Visual Wake Words 数据集 | [pdf]
将 KB 级机器学习模型编译到微型物联网设备 | [pdf]
可重构的多任务音频动态处理方案 | [pdf]
推进 RNN 压缩的极限 | [pdf]
一种低功耗的端到端混合神经形态框架，用于监控应用 | [pdf]
边缘计算中的深度学习 | [pdf]
基于内存驱动的混合低精度量化，以在微控制器上实现深度网络推理 | [pdf] [官方代码]
[SpArSe] 面向资源受限微控制器的 CNN 稀疏架构搜索 | [pdf]
[MobileNetV2] 反转残差与线性瓶颈 | [pdf]
隐式权重并不存在：重新思考二值化神经网络优化 | [pdf]
低功耗计算机视觉：现状、挑战与机遇 | [pdf]

▲ 返回顶部

2020

使用克罗内克积将 RNN 在物联网设备上压缩 15 至 38 倍 |[pdf]
轻量级机器学习系统的基准测试：挑战与方向 |[pdf]
具有长短程注意力的轻量级 Transformer |[pdf]
[FANN-on-MCU] 用于物联网边缘端节能神经网络推理的开源工具包 |[pdf]
[TENSORFLOW LITE MICRO] 轻量级机器学习系统上的嵌入式机器学习 |[pdf]
[AttendNets] 通过视觉注意力浓缩器实现的面向边缘的微型深度图像识别神经网络 |[pdf]
[TinySpeech] 用于边缘设备上深度语音识别神经网络的注意力浓缩器 |[pdf]
使用轻量级机器学习实现自主小型车辆的鲁棒导航 |[pdf] [官方代码]
[MICRONETS] 用于在通用微控制器上部署轻量级机器学习应用的神经网络架构 |[pdf]
[TinyLSTMs] 面向助听器的高效神经语音增强 |[pdf]
[MCUNet] 物联网设备上的微型深度学习 |[pdf] [官方代码]
基于残数数系的高效 Winograd 卷积 | [pdf]
深度学习推理中的整数量化：原理与经验评估 | [pdf]
关于唤醒词检测前端增益不变建模的研究 | [pdf]
向数据高效的唤醒词检测建模迈进 | [pdf]
使用 CNN 精确检测唤醒词的起始与结束 | [pdf]
[PoPS] 面向深度强化学习的策略剪枝与缩减 | [pdf]
Howl：一个已部署的开源唤醒词检测系统 | [pdf] [官方代码]
[LeakyPick] 物联网音频间谍探测器 | [pdf]
设备端机器学习：算法与学习理论视角 | [pdf]
利用自动化混合低精度量化技术优化小型边缘微控制器 | [pdf]
优化关键指标：使用最终指标训练 DNN-HMM 关键字检测模型 | [pdf]
[RNNPool] 面向内存受限推理的高效非线性池化 | [博客] [pdf] [官方代码]
[Shiftry] 在 2KB 内存中进行 RNN 推理 |[pdf]
[Once for All] 训练一个网络并针对高效部署进行特化 |[pdf] [官方代码]
面向资源受限终端的医疗口罩检测微型 CNN 架构 |[pdf]
重新思考极低内存占用边缘设备上的美国手语预测泛化问题 |[pdf] [演示文稿]
[ShadowNet] 一种安全高效的设备端模型推理系统 |[pdf]
面向通用及专用硬件的高效关键字检测硬件感知训练 |[pdf]
针对缺乏独特标记的野生动物的自动化面部识别：基于深度学习的棕熊识别方法 |[pdf]
[HyNNA]：利用混合神经网络架构提升基于神经形态视觉传感器的监控性能 |[pdf]
硬件彩票 |[pdf]
MLPerf 推理基准测试 |[pdf]
MLPerf 移动推理基准测试：为什么移动 AI 基准测试困难以及如何应对 |[pdf]
[TinyRL] 学习寻找：纳米四旋翼无人机上的微型机器人源点搜索学习 |[pdf] [演示文稿]
使用 Microsoft 浮点数在云端规模下推动窄精度推理的极限 |[pdf]
[TinyBERT] 用于自然语言理解的 BERT 知识蒸馏 |[pdf]
[Larq] 一个用于训练二值化神经网络的开源库 |[pdf] [演示文稿] [官方代码]
[FedML] 一个用于联邦学习的研究库和基准测试平台 |[pdf]
机器学习加速器综述 |[pdf]

▲ 返回顶部

2021

[I-BERT] 仅整数的 BERT 量化 |[pdf]
[TinyTL] 减少内存而非参数，实现高效的设备端学习 |[pdf] [官方代码]
循环神经网络的量化研究 |[pdf]
[TINY TRANSDUCER] 一种在边缘设备上运行的高效率语音识别模型 |[pdf]
LARQ 计算引擎：设计、基准测试及部署最先进的二值化神经网络 |[pdf]
[LEAF] 用于音频分类的可学习前端 |[pdf]
通过交换技术在微型微控制器上运行大型神经网络 |[pdf]
用于嵌入式平台上量化推理的卷积神经网络定点量化 |[pdf]
通过低成本 BLE 设备估计室内人员占用情况 |[pdf]
[Tiny Eats] 在微控制器上进行进食检测 |[pdf]
[DEVICETTS] 一种占用空间小、速度快、稳定的设备端文本转语音网络 |[pdf]
基于 FPGA 的 0.57-GOPS/DSP 目标检测 PIM 加速器 |[pdf]
重新思考神经架构与硬件加速器的协同设计 |[pdf]
深度学习中的稀疏性：剪枝与生长在神经网络高效推理和训练中的应用 |[pdf]
[Apollo] 可迁移的架构探索 |[pdf]
基于深度神经网络的咳嗽检测，利用床边加速度计测量数据 |[pdf]
TapNet：一款用于屏幕外移动输入的多任务学习 CNN 的设计、训练、实现及应用 |[pdf]
智能设备上的内存高效语音识别 |[pdf]
SWIS——共享权重位稀疏性，用于高效神经网络加速 |[pdf]
面向通用及专用硬件的高效关键词检测的硬件感知训练 |[pdf]
边缘设备上高效超维度计算的超向量设计 |[pdf]
软弱有时反而更坚韧：受节肢动物外骨骼启发的抗碰撞四旋翼无人机 |[pdf]
[TinyOL] 微控制器上的在线学习 TinyML |[pdf]
针对紧凑型 TinyML 模型的量化引导训练 |[pdf]
hls4ml：一个开源联合设计工作流，助力科学低功耗机器学习设备 |[pdf]
基于超维度计算的内存高效、肢体位置感知手势识别 |[pdf]
动态可调节吞吐量的神经网络（TNN） |[pdf]
硬件感知神经架构搜索综合综述 |[pdf]
用于非接触式呼吸频率监测的智能床传感器系统 |[pdf]
衡量真正重要的东西：为 TinyML 优化神经网络 |[pdf]
任意语言下的少量样本关键词检测 |[pdf]
DOPING：一种利用稀疏结构化加法矩阵实现 LSTM 模型极端压缩的技术 |[pdf]
[OutlierNets] 用于设备端声学异常检测的高度紧凑的深度自编码器网络架构 |[pdf]
[TENT] 使用锥形定点实现边缘设备上神经网络的高效量化 |[pdf]
基于 1D-CNN 的深度学习技术，用于物联网传感器中的睡眠呼吸暂停检测 |[pdf]
适用于低功耗 CPU 的自适应测试时增强 |[pdf]
面向嵌入式平台深度学习工作负载的编译工具链 |[pdf]
[ProxiMic] 通过单个麦克风检测近场语音实现便捷的语音激活功能 |[pdf]
[Fusion-DHL] WiFi、IMU 和楼层平面图融合，用于室内环境中的密集位置历史记录 |[pdf]
[µNAS] 面向微控制器的约束神经架构搜索 |[pdf]
使用树莓派结合功率激光中和蚊子 |[pdf]
通过 TinyML 扩大应用机器学习的普及范围 |[pdf]
嵌入式系统中的机器学习应用 |[pdf]
[FRILL] 一种面向移动设备的非语义语音嵌入 |[pdf]
任意语言下的少量样本关键词检测 |[pdf]
MLPerf Tiny 基准测试 |[pdf]
高效神经网络推理的量化方法综述 |[pdf]
高效深度学习：关于如何使深度学习模型更小、更快、更好的综述 |[pdf]
AttendSeg：一种用于边缘语义分割的微型注意力浓缩神经网络 |[pdf]
神经网络训练中的随机性：工具对影响的表征 |[pdf]
TinyML：ESP32 SoC 中 Xtensa LX6 微处理器在神经网络应用中的分析 |[pdf]
[Keyword Transformer]：一种用于关键词检测的自注意力模型 |[pdf]
LB-CNN：一个使用 Chainer 和 Cupy 快速训练轻量级二值卷积神经网络的开源框架 |[pdf]
[Only Train Once]：一种一次性神经网络训练与剪枝框架 |[pdf]
[BEANNA]：一种支持二值化的神经网络加速架构 |[pdf]
一个基于量化潜在重放的设备端持续学习 TinyML 平台 |[pdf]
利用机器学习技术和嵌入式传感器对异常步态的分类 |[pdf]
[MOBILEVIT]：一种轻量级、通用且适合移动端的视觉 Transformer |[pdf]
[MCUNetV2]：面向小型深度学习的内存高效补丁式推理 |[pdf]
[LCS]：学习可压缩子空间，用于推理时的自适应网络压缩 |[pdf]
基于腕部光电容积脉搏波传感器的特征增强混合 CNN，用于压力识别 |[pdf]
[ANALOGNETS]：噪声鲁棒型 TinyML 模型与始终开启的模拟存内计算加速器的软硬件协同设计 |[pdf]
[BSC]：基于块的随机计算，以实现准确高效的 TinyML |[pdf]
[TiWS-iForest]：弱监督和 Tiny ML 场景下的孤立森林 |[pdf]
[RadarNet]：利用微型雷达传感器的高效手势识别技术 |[pdf]
工业物联网中复杂事件处理与 TinyML 的协同作用 |[pdf]

▲ 返回顶部

2022

用于灵活端到端推理真实世界深度神经网络的异构存内计算集群 |[pdf]
CFU Playground：面向FPGA上TinyML加速的全栈开源框架 |[pdf]
BottleFit：在深度神经网络中学习压缩表示，以实现高效分割计算 |[pdf]
[UDC]：适用于可压缩TinyML模型的统一DNA结构 |[pdf]
一种基于虚拟机/容器的方法，用于扩展TinyML应用 |[pdf]
一种快速网络探索策略，用于为关键词检测任务进行低功耗性能分析 |[pdf]
PocketNN：通过直接反馈对齐和Pocket激活函数，在纯C++中实现仅整数运算的神经网络训练与推理 |[pdf]
[TinyMLOps]：大规模边缘AI部署面临的运营挑战 |[pdf]
[Auritus]：一个开源优化工具包，用于使用可穿戴设备训练和开发人体运动模型及滤波器 |[pdf] |[code]
在生产环境中实现机器学习分类器的超参数调优 |[pdf]
TinyOdom：硬件感知的高效神经惯性导航 |[pdf] |[code]
针对边缘TPU上的设备端ML搜索高效神经架构 |[pdf]
绿色加速霍夫丁树 |[pdf]
tinyRadar：基于毫米波雷达的人体活动分类，用于边缘计算 |[pdf]
机器学习传感器 |[pdf]
评估物联网环境中的多时间序列短期预测 |[pdf]
如何为嵌入式系统训练高精度二值神经网络？ |[pdf]
Vildehaye：一系列多功能、适用广泛且经过实地验证的轻量级野生动物追踪与传感标签 |[pdf]
设备端内存小于256KB下的在线训练 |[pdf]
基于辅助网络的TinyML深度剪枝 |[pdf]
[EdgeNeXt]：面向移动视觉应用的高效融合CNN-Transformer架构 |[pdf]
小型机器人学习：资源受限机器人中机器学习的挑战与方向 |[pdf]
[POET]：在微型设备上训练神经网络，结合集成重化与分页 |[pdf]
基于决策树和CNN的微控制器上两阶段人体活动识别 |[pdf]
如何规模化管理小型机器学习——工业视角 |[pdf]
[SeLoC-ML]：面向工业物联网中机器学习应用的语义低代码工程 |[pdf]
[IMU2Doppler]：利用IMU数据进行基于多普勒的活动识别的跨模态域适应 |[pdf]
[Tiny-HR]：迈向可解释的边缘设备心率估计机器学习流水线 |[pdf]
[在微型能量采集物联网设备上实现快速深度学习] |[pdf]
极其简单的激活形状设计，用于分布外检测 |[pdf]
面向资源受限的TinyML应用的像素内存储处理范式 |[pdf]
[tinySNN]：迈向内存与能耗高效的脉冲神经网络 |[pdf]
[DeepPicarMicro]：将TinyML应用于自主网络物理系统 |[pdf]
面向手势与视觉智能传感器的增量式在线学习算法比较 |[pdf]
[Protean]：一个节能且异构的平台，用于自适应和硬件加速的无电池计算 |[pdf]
传感器内计算与类脑计算足以实现节能计算机视觉 |[pdf]
基于二的幂量化实现神经网络的节能硬件加速 |[pdf]
实现无ISP的低功耗计算机视觉 |[pdf]
重新思考视觉Transformer，使其达到MobileNet的尺寸与速度 |[pdf]
类脑计算与传感技术在太空中的应用 |[pdf]
联合数据深化与预取，实现边缘学习的节能 |[pdf]
PreMa：在嵌入式边缘层面实时预测并维护电磁阀 | pdf]

▲ 返回顶部

2023

[Coral NPU]：专为边缘端节能型AI设计的机器学习加速器核心。|[代码]
[cpp-transformer]：一种无需特殊库依赖的Transformer C++实现，包含训练与推理功能。|[代码]
探索在资源受限的可穿戴设备上本地自动识别健身锻炼 |[pdf]
[MetaLDC]：用于设备端快速适配的低维计算分类器元学习 |[pdf]
更快的注意力机制正是你需要的：通过双重压缩注意力浓缩器构建面向边缘的快速自注意力神经网络骨干架构 |[pdf]
[TinyReptile]：结合联邦元学习的TinyML |[[pdf](https://arxiv.org/pdf/2304.05201.pdf)
[TinyProp] - 面向高效TinyML设备端学习的自适应稀疏反向传播 |[[pdf](https://arxiv.org/pdf/2308.09201.pdf)
[LiteTrack] - 基于异步特征提取的层剪枝技术，用于轻量级高效视觉跟踪 - 自适应稀疏反向传播以实现高效的TinyML设备端学习 |[[pdf](https://arxiv.org/pdf/2409.00608v1)
[MCUFormer] - 在内存有限的微控制器上部署视觉Transformer |[[pdf](https://arxiv.org/abs/2310.16898)

2024

模型压缩实践：来自创建设备端机器学习体验的从业者的经验教训 | [pdf]
TinyAgent：在边缘端进行函数调用 | [pdf]
[SENSORLLM]：将大型语言模型与运动传感器对齐，用于人类活动识别 | [pdf]
[Penetrative AI]：让大语言模型理解物理世界 | [pdf]
[MobileCLIP]：通过多模态强化训练实现快速图文模型 | [pdf]
[Zero-TPrune]：利用预训练Transformer中的注意力图进行零样本标记剪枝 | [pdf]
通过大型语言模型迈向边缘通用智能：机遇与挑战 | [pdf]
[TinyTTA]：通过边缘设备上的早退出集成实现高效测试时适配 | [pdf]

2025

[EdgeMark]：嵌入式人工智能工具的自动化与基准测试系统 | [pdf] | [官方代码]
优化边缘AI：数据、模型和系统策略的综合综述 | [pdf] | [GitHub]
小型语言模型是代理型AI的未来 | [pdf] | [GitHub]
SensorLM：学习可穿戴传感器的语言 | [pdf]
PyTorch与TensorFlow在深度学习中的比较研究：易用性、性能与部署权衡 | [pdf]
[MobileCLIP2]：改进多模态强化训练 | [pdf] | [官方代码]
[FastVLM]：面向视觉语言模型的高效视觉编码 | [pdf]
[Flavors of Moonshine]：面向边缘设备的小型专用ASR模型 | [pdf]
大语言模型剪枝与蒸馏实践：Minitron方法 | [pdf]
嵌入式系统中TinyML模型的实时性能基准测试（PICO：推理、CPU及操作性能） | [pdf]
用于代理系统的小型语言模型：架构、能力与部署权衡综述 | [pdf]
AutoNeural：为NPU推理协同设计视觉-语言模型 | [pdf]

▲ 返回顶部

优秀的TinyML项目

项目源码

项目文章

▲ 返回顶部

基准测试及其他

EEMBC的EnergyRunner：EEMBC为MLPerf Tiny基准测试设计的能量运行应用框架。
MLPerf - Tiny：这是一个针对微控制器等极低功耗系统的机器学习基准测试套件。[GitHub]
FedML：一个用于联邦学习的研究库及基准测试平台。[GitHub]
FogML：一个用于生成嵌入式设备推理函数源代码的研究库。[GitHub]
边缘端机器学习基准测试

▲ 返回顶部

书籍

[2022-12] 边缘人工智能（D. Situnayake & J. Plunkett，2022年，O'Reilly）：[图书]
[2022-10] 商品级小型设备上的机器学习（S. Guo & Q. Zhou，2022年，CRC Press）：[图书]
[2022-07] TinyML入门（Rohit Sharma，2022年，AITS）：[图书] | [GitHub]
[2022-04] TinyML烹饪书（Gian Marco Iodice，2022年，Packt）：[图书] | [GitHub]
[2021-03] 物联网人工智能烹饪书（Michael Roshak，2021年，Packt）：[图书] | [GitHub]
[2020-04] 使用TensorFlow Lite、ML Kit和Flutter进行移动深度学习：构建可扩展的真实世界项目，在Android和iOS上实现端到端神经网络（Anubhav Singh、Rimjhim Bhadani，2020年，Packt）：[图书]
[2020-01] TinyML：在Arduino和超低功耗微控制器上使用TensorFlow Lite进行机器学习（Pete Warden，O'Reilly Media）：[图书]

▲ 返回顶部

文章

2019-12 TinyML即服务：它是什么，对物联网边缘计算意味着什么？
2019-12 TinyML即服务与边缘端机器学习的挑战
2020-05 使用TensorFlow Lite进行模型量化
2020-09 TinyML正在为数十亿设备注入活力
2020-12 2021年物联网嵌入式机器学习预测
2020-12 马修·马蒂纳：口袋里的救生模型
2020-12 如今，只需四比特微型计算机即可训练人工智能
2021-01 预测性维护如何彻底改变工业企业
2021-02 什么是TinyML？
2021-02 人工智能如何接管传感器
2021-04 MLCommons™发布MLPerf™推理v1.0结果，并首次提供功耗测量数据
2021-05 TapLock——一款搭载机器学习的自行车锁
2021-05 夺回控制权
2021-06 用于在通用微控制器上部署TinyML应用的神经网络架构
2021-06 MicroCosmos中的TinyML
2021-06 “小数据”对机器学习同样至关重要
2021-07 一种原生灵活的32位Arm微处理器
2021-07 可穿戴设备可降低盲人和视力障碍者的碰撞风险
2021-09 以模拟仪表为例的AI检测
2025-10 用于构建代理型AI解决方案的顶级小型语言模型

▲ 返回顶部

库与工具

Edge Impulse - 一个交互式平台，用于生成可在微控制器上运行的模型。他们在社交媒体上也非常活跃，经常分享关于边缘AI/TinyML的最新动态。
EVE是边缘虚拟化引擎
microTVM - 一个开源工具，用于优化张量程序。
Larq - 一个用于训练二值化神经网络的开源库。
微控制器上的神经网络（NNoM） - 一个专为微控制器设计的高级层式神经网络库，支持CMSIS-NN。
BerryNet - 一个基于树莓派及其他边缘设备的深度学习网关。
Rune - 提供容器来封装和部署边缘ML流水线及应用程序。
Onnxruntime - 一个跨平台、高性能的ML推理与训练加速器。
deepC - 一个与厂商无关的TinyML深度学习库、编译器和推理框架，适用于微型计算机和微控制器。
针对Arduino的deepC - 一个专为Arduino IDE定制的TinyML深度学习库。
emlearn - 面向微控制器和嵌入式系统的机器学习工具。可在Python中训练模型，然后在任何具备C99编译器的设备上进行推理。

▲ 返回顶部

课程

11-767：设备端机器学习秋季课程 - 卡内基梅隆大学 | [官网]
TinyML4D：UNIFEI-IESTI01-TinyML-2023.1 - UNIFEI | [官网]
嵌入式深度学习导论 - 卡内基梅隆大学 | [官网]
TinyML与高效深度学习 - 麻省理工学院 | [官网]
ARM边缘端机器学习：实用入门 - ARM | [edX]
CS249r：微型机器学习（TinyML） - 哈佛大学，由Vijay Janapa Reddi主讲：sites.google.com | [YouTube] | [edX] | [GitHub]
TinyML规模化MLOps - 哈佛大学，由Vijay Janapa Reddi主讲：[edX]
嵌入式机器学习导论 - Edge Impulse，由Shawn Hymel主讲：[Coursera]
嵌入式与分布式人工智能 - 瑞典延雪平大学，由Beril Sirmacek主讲：[YouTube]
MLT人工智能——边缘AI - 东京机器学习：[YouTube]
TinyML @ 宾夕法尼亚大学 | [官网] | [YouTube]

▲ 返回顶部

TinyML 讲座与会议

TinyML 讲座、峰会及研究研讨会：[官网] | [YouTube]
嵌入式视觉峰会 - 边缘 AI 与视觉联盟 (Edge AI & Vision Alliance)：[官网] | [YouTube]
低功耗计算机视觉挑战赛 (LPCV)：[官网] | [YouTube]

标题	演讲者	发布日期	链接
TinyML 设备大规模部署面临的挑战	G. Raghavan	2022-04-29	幻灯片
为嵌入式工程师构建以数据为中心的 AI 工具链	D. Situnayake	2022-04-29	幻灯片
传感器与机器学习：用更少的资源实现更智能的唤醒	A. Ataya	2022-05-04	幻灯片
适用于 TinyML 的 MLOps：在规模化应用中落地 TinyML 的挑战与方向	V.J. Reddi	2022-05-24	幻灯片
振动监测机器学习演示	J. Edwards	2020-12-22	GitHub
从 AI 到 IntelligentAI：降低边缘端 AI 成本	J. Edwards	2020-12-22	官网

▲ 返回顶部

竞赛

[LPCV]：低功耗计算机视觉挑战赛 |[官网]

其他精彩仓库

优秀的人类活动识别资源

联系与反馈

如果您对 TinyML 相关论文和项目有任何建议，欢迎随时给我发送邮件 :)

TinyML Papers and Projects 快速上手指南

tinyml-papers-and-projects 并非一个需要编译安装的可执行软件或 Python 库，而是一个精选资源列表仓库。它汇集了关于 TinyML（微型机器学习）的学术论文、开源项目、基准测试工具及相关教程。

本指南将指导开发者如何获取该资源库，并从中提取有价值的代码项目进行实践。

环境准备

由于本项目主要是文档和链接集合，无需特殊的系统运行环境，但为了运行列表中引用的具体项目（如 TensorFlow Lite Micro, MCUNet 等），建议准备以下基础环境：

操作系统: Windows, macOS 或 Linux (推荐 Ubuntu 20.04+)
版本控制: Git
开发语言: Python 3.8+ (用于脚本处理和运行部分示例)
硬件目标 (可选): ARM Cortex-M 系列开发板 (如 Arduino Nano 33 BLE, STM32), ESP32, 或 Raspberry Pi Pico。
依赖管理: pip, virtualenv 或 conda

国内加速建议：
克隆仓库时，若 GitHub 连接缓慢，可使用国内镜像源（如 Gitee 镜像，若有）或配置代理。
安装 Python 依赖时，推荐使用清华源或阿里源：
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

安装步骤（获取资源）

你只需要将该仓库克隆到本地即可开始浏览和使用其中的资源。

打开终端 (Terminal / CMD / PowerShell)。
克隆仓库：
```
git clone https://github.com/gigwegbe/tinyml-papers-and-projects.git
```
(如果速度较慢，可尝试使用国内镜像地址，例如：git clone https://gitee.com/mirrors/tinyml-papers-and-projects.git，若镜像不存在则直接使用原地址)
进入目录：
```
cd tinyml-papers-and-projects
```
查看内容：直接在浏览器中打开根目录下的 README.md 文件，或者在终端使用 cat README.md 查看分类索引。

基本使用

该仓库的核心价值在于指引。使用流程通常为：查阅论文/项目 -> 定位官方代码链接 -> 克隆具体项目进行实验。

1. 浏览与检索

打开 README.md，根据年份（如 2020, 2023）或类别（Awesome Projects, Libraries and Tools）查找感兴趣的内容。

找算法: 查看 "Awesome Papers" 部分，点击 [pdf] 阅读论文。
找代码: 查看带有 [official code] 标记的项目。

2. 实战示例：运行一个具体的 TinyML 项目

假设你在列表中对 2020 年的 MCUNet (Tiny Deep Learning on IoT Devices) 感兴趣，以下是将其拉取并探索的典型步骤：

步骤 A: 获取具体项目代码 从列表中复制 MCUNet 的官方代码地址并克隆：

git clone https://github.com/mit-han-lab/mcunet.git
cd mcunet

步骤 B: 安装该项目特定依赖 大多数列出的项目都包含自己的 requirements.txt 或 setup.py。

# 推荐使用国内源加速安装
pip install -e . -i https://pypi.tuna.tsinghua.edu.cn/simple
# 或者安装具体要求
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

步骤 C: 运行示例推理 参考该项目自身的 README 进行演示（以下为伪代码示例，具体命令需参照 MCUNet 原文档）：

# 示例：运行一个简单的图像分类演示
python demo.py --model mcunet --image test.jpg

3. 常用工具链推荐

在仓库的 Resources -> Libraries and Tools 章节，你可以找到直接用于开发的工具，例如：

TensorFlow Lite Micro: 部署模型到微控制器。
CMSIS-NN: ARM Cortex-M 优化的神经网络内核。
Larq: 训练二值化神经网络。

直接访问这些工具的官方文档进行安装即可，本仓库提供了最权威的入口索引。

相似工具推荐

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|今天

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 139k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 107.7k|★★☆☆☆|2天前

开发框架图像Agent

NextChat

NextChat 是一款轻量且极速的 AI 助手，旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性，以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发，NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言，它也提供了便捷的自托管方案，支持一键部署到 Vercel 或 Zeabur 等平台。 NextChat 的核心亮点在于其广泛的模型兼容性，原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型，让用户在一个界面即可自由切换不同 AI 能力。此外，它还率先支持 MCP（Model Context Protocol）协议，增强了上下文处理能力。针对企业用户，NextChat 提供专业版解决方案，具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能，满足公司对数据隐私和个性化管理的高标准要求。

★ 87.6k|★★☆☆☆|今天

开发框架语言模型

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。

★ 85k|★★☆☆☆|今天

图像数据工具视频

ragflow

RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。

★ 77.1k|★★★☆☆|昨天

Agent图像开发框架