[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"similar-OAID--Tengine":3,"tool-OAID--Tengine":64},[4,17,27,35,43,56],{"id":5,"name":6,"github_repo":7,"description_zh":8,"stars":9,"difficulty_score":10,"last_commit_at":11,"category_tags":12,"status":16},3808,"stable-diffusion-webui","AUTOMATIC1111\u002Fstable-diffusion-webui","stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。\n\n无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。",162132,3,"2026-04-05T11:01:52",[13,14,15],"开发框架","图像","Agent","ready",{"id":18,"name":19,"github_repo":20,"description_zh":21,"stars":22,"difficulty_score":23,"last_commit_at":24,"category_tags":25,"status":16},1381,"everything-claude-code","affaan-m\u002Feverything-claude-code","everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。\n\n通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。\n\n这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上",138956,2,"2026-04-05T11:33:21",[13,15,26],"语言模型",{"id":28,"name":29,"github_repo":30,"description_zh":31,"stars":32,"difficulty_score":23,"last_commit_at":33,"category_tags":34,"status":16},2271,"ComfyUI","Comfy-Org\u002FComfyUI","ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。\n\n这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。\n\n无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。",107662,"2026-04-03T11:11:01",[13,14,15],{"id":36,"name":37,"github_repo":38,"description_zh":39,"stars":40,"difficulty_score":23,"last_commit_at":41,"category_tags":42,"status":16},3704,"NextChat","ChatGPTNextWeb\u002FNextChat","NextChat 是一款轻量且极速的 AI 助手，旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性，以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发，NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。\n\n这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言，它也提供了便捷的自托管方案，支持一键部署到 Vercel 或 Zeabur 等平台。\n\nNextChat 的核心亮点在于其广泛的模型兼容性，原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型，让用户在一个界面即可自由切换不同 AI 能力。此外，它还率先支持 MCP（Model Context Protocol）协议，增强了上下文处理能力。针对企业用户，NextChat 提供专业版解决方案，具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能，满足公司对数据隐私和个性化管理的高标准要求。",87618,"2026-04-05T07:20:52",[13,26],{"id":44,"name":45,"github_repo":46,"description_zh":47,"stars":48,"difficulty_score":23,"last_commit_at":49,"category_tags":50,"status":16},2268,"ML-For-Beginners","microsoft\u002FML-For-Beginners","ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。\n\n无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。",84991,"2026-04-05T10:45:23",[14,51,52,53,15,54,26,13,55],"数据工具","视频","插件","其他","音频",{"id":57,"name":58,"github_repo":59,"description_zh":60,"stars":61,"difficulty_score":10,"last_commit_at":62,"category_tags":63,"status":16},3128,"ragflow","infiniflow\u002Fragflow","RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。\n\n在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。\n\n这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。",77062,"2026-04-04T04:44:48",[15,14,13,26,54],{"id":65,"github_repo":66,"name":67,"description_en":68,"description_zh":69,"ai_summary_zh":69,"readme_en":70,"readme_zh":71,"quickstart_zh":72,"use_case_zh":73,"hero_image_url":74,"owner_login":75,"owner_name":75,"owner_avatar_url":76,"owner_bio":77,"owner_company":78,"owner_location":78,"owner_email":79,"owner_twitter":78,"owner_website":78,"owner_url":80,"languages":81,"stars":113,"forks":114,"last_commit_at":115,"license":116,"difficulty_score":117,"env_os":118,"env_gpu":119,"env_ram":120,"env_deps":121,"category_tags":128,"github_topics":129,"view_count":23,"oss_zip_url":78,"oss_zip_packed_at":78,"status":16,"created_at":147,"updated_at":148,"faqs":149,"releases":179},3962,"OAID\u002FTengine","Tengine","Tengine is a lite, high performance, modular inference engine for embedded device ","Tengine 是由 OPEN AI LAB 主导开发的一款轻量级、高性能且模块化的深度学习推理引擎，专为嵌入式设备打造。它主要解决了神经网络模型在资源受限的 AIoT 设备上难以快速、高效部署的痛点，帮助开发者降低跨平台迁移的成本与门槛。\n\n这款工具非常适合嵌入式系统开发者、算法工程师以及希望在边缘端落地 AI 应用的研究人员使用。无论是进行图像分类、目标检测，还是复杂的异构计算任务，Tengine 都能提供强有力的支持。\n\n其核心技术亮点在于采用 C 语言编写核心模块，对框架进行了深度裁剪以适应低资源环境。独特的“前后端完全分离”架构设计，使得 Tengine 能够灵活适配 CPU、GPU、NPU 等多种异构计算单元，极大提升了移植效率。此外，它还提供了完善的模型转换与量化工具链，支持一键部署自动优化算子，并兼容多种主流深度学习框架模型。凭借简洁的 API 和活跃的社区生态，Tengine 让边缘侧的 AI 推理变得更加简单可靠。","\u003Cdiv align=\"center\">\n  \u003Cimg width=\"40%\" src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FOAID_Tengine_readme_481131bb3af3.png\">\n  \u003Ch3> \u003Ca href=\"https:\u002F\u002Ftengine-docs.readthedocs.io\u002Fen\u002Flatest\u002F\"> Documentation \u003C\u002Fa> | \u003Ca href=\"https:\u002F\u002Ftengine.readthedocs.io\u002Fzh_CN\u002Flatest\u002F\"> 中文文档 \u003C\u002Fa>  \u003C\u002Fh3>\n\u003C\u002Fdiv>\n\n简体中文 | [English](.\u002FREADME_EN.md)\n\n# Tengine\n\n[![GitHub license](http:\u002F\u002FOAID.github.io\u002Fpics\u002Fapache_2.0.svg)](.\u002FLICENSE)\n[![GitHub Workflow Status](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Factions\u002Fworkflow\u002Fstatus\u002FOAID\u002FTengine\u002Fbuild-and-test.yml?branch=tengine-lite)](https:\u002F\u002Fgithub.com\u002FOAID\u002FTengine\u002Factions)\n[![Test Status](https:\u002F\u002Fimg.shields.io\u002Ftravis\u002FOAID\u002FTengine\u002Ftengine-lite?label=test)](https:\u002F\u002Ftravis-ci.org\u002FOAID\u002FTengine)\n[![codecov](https:\u002F\u002Fcodecov.io\u002Fgh\u002FOAID\u002FTengine\u002Fbranch\u002Ftengine-lite\u002Fgraph\u002Fbadge.svg?token=kz9NcQPRrk)](https:\u002F\u002Fcodecov.io\u002Fgh\u002FOAID\u002FTengine)\n[![Language grade: C\u002FC++](https:\u002F\u002Fimg.shields.io\u002Flgtm\u002Fgrade\u002Fcpp\u002Fg\u002FOAID\u002FTengine.svg?logo=lgtm&logoWidth=18)](https:\u002F\u002Flgtm.com\u002Fprojects\u002Fg\u002FOAID\u002FTengine\u002Fcontext:cpp)\n\n\n## 简介\n\n**Tengine** 由 **[OPEN AI LAB](http:\u002F\u002Fwww.openailab.com)** 主导开发，该项目实现了深度学习神经网络模型在嵌入式设备上的**快速**、**高效**部署需求。为实现在众多 **AIoT** 应用中的跨平台部署，本项目使用 **C 语言**进行核心模块开发，针对嵌入式设备资源有限的特点进行了深度框架裁剪。同时采用了完全分离的前后端设计，有利于 CPU、GPU、NPU 等异构计算单元的快速移植和部署，降低评估、迁移成本。\n\nTengine 核心代码由 4 个模块组成：\n\n- [**device**](source\u002Fdevice)：NN Operators 后端模块，已提供 CPU、GPU、NPU 参考代码；\n- [**scheduler**](source\u002Fscheduler)：框架核心部件，包括 NNIR、计算图、硬件资源、模型解析器的调度和执行模块；\n- [**operator**](source\u002Foperator)：NN Operators 前端模块，实现 NN Operators 注册、初始化；\n- [**serializer**](source\u002Fserializer)：模型解析器，实现 tmfile 格式的网络模型参数解析。\n\n\n## 架构简析\n\n![Tengine 架构](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FOAID_Tengine_readme_dee569f03e4d.png)\n\n## 快速上手\n\n### 编译\n\n- [快速编译](doc\u002Fdocs_zh\u002Fsource_compile) 基于 cmake 实现简单的跨平台编译。\n\n### 示例\n\n- [examples](examples\u002F) 提供基础的分类、检测算法用例，根据 issue 需求持续更新。\n- [源安装](doc\u002Fdocs_zh\u002Fquick_start\u002Fapt-get-install_user_manual.md) 提供ubuntu系统的apt-get命令行安装和试用，目前支持x86\u002FA311D硬件。\n\n### 模型仓库\n\n- [百度网盘](https:\u002F\u002Fpan.baidu.com\u002Fs\u002F1JsitkY6FVV87Kao6h5yAmg) （提取码：7ke5）\n\n- [Google Drive](https:\u002F\u002Fdrive.google.com\u002Fdrive\u002Ffolders\u002F1hunePCa0x_R-Txv7kWqgx02uTCH3QWdS?usp=sharing)\n\n### 转换工具\n\n- [预编译版本](https:\u002F\u002Fgithub.com\u002FOAID\u002FTengine\u002Freleases\u002Fdownload\u002Flite-v1.2\u002Fconvert_tool.zip) ：提供 Ubuntu 18.04 系统上预编译好的模型转换工具；\n- [在线转换版本](https:\u002F\u002Fconvertmodel.com\u002F#outputFormat=tengine) ：基于 WebAssembly 实现（浏览器本地转换，模型不会上传；\n- [源码编译](https:\u002F\u002Fgithub.com\u002FOAID\u002FTengine\u002Ftree\u002Ftengine-lite\u002Ftools\u002Fconvert_tool) ：建议在服务器或者PC上编译，指令如下：\n  ```\n  mkdir build && cd build\n  cmake -DTENGINE_BUILD_CONVERT_TOOL=ON ..\n  make -j`nproc`\n  ```\n\n### 量化工具\n\n- [源码编译](tools\u002Fquantize\u002FREADME.md)：已开源量化工具源码，已支持 uint8\u002Fint8。\n\n### 速度评估\n\n- [Benchmark](benchmark\u002F) 基础网络速度评估工具，欢迎大家更新。\n\n### NPU Plugin\n\n- [TIM-VX](doc\u002Fdocs_zh\u002Fsource_compile\u002Fcompile_timvx.md) VeriSilicon NPU 使用指南。\n\n### AutoKernel Plugin\n\n- [AutoKernel](https:\u002F\u002Fgithub.com\u002FOAID\u002FAutoKernel.git) 是一个简单易用，低门槛的自动算子优化工具，AutoKernel Plugin实现了自动优化算子一键部署到 Tengine 中。\n\n### Container\n\n- [SuperEdge](https:\u002F\u002Fgithub.com\u002Fsuperedge\u002Fsuperedge) 借助 SuperEdge 边缘计算的开源容器管理系统，提供更便捷的业务管理方案；\n- [How to use Tengine with SuperEdge](doc\u002Fdocs_zh\u002Fsource_compile\u002Fdeploy_SuperEdge.md) 容器使用指南；\n- [Video Capture user manual](doc\u002Fdocs_zh\u002Fsource_compile\u002Fdemo_videocapture.md) Demo 依赖文件生成指南。\n\n## Roadmap\n\n- [Road map](doc\u002Fdocs_zh\u002Fintroduction\u002Froadmap.md)\n\n## 致谢\n\nTengine Lite 参考和借鉴了下列项目：\n\n- [Caffe](https:\u002F\u002Fgithub.com\u002FBVLC\u002Fcaffe)\n- [Tensorflow](https:\u002F\u002Fgithub.com\u002Ftensorflow\u002Ftensorflow)\n- [MegEngine](https:\u002F\u002Fgithub.com\u002FMegEngine\u002FMegEngine)\n- [ONNX](https:\u002F\u002Fgithub.com\u002Fonnx\u002Fonnx)\n- [ncnn](https:\u002F\u002Fgithub.com\u002FTencent\u002Fncnn)\n- [FeatherCNN](https:\u002F\u002Fgithub.com\u002FTencent\u002FFeatherCNN)\n- [MNN](https:\u002F\u002Fgithub.com\u002Falibaba\u002FMNN)\n- [Paddle Lite](https:\u002F\u002Fgithub.com\u002FPaddlePaddle\u002FPaddle-Lite)\n- [ACL](https:\u002F\u002Fgithub.com\u002FARM-software\u002FComputeLibrary)\n- [stb](https:\u002F\u002Fgithub.com\u002Fnothings\u002Fstb)\n- [convertmodel](https:\u002F\u002Fconvertmodel.com)\n- [TIM-VX](https:\u002F\u002Fgithub.com\u002FVeriSilicon\u002FTIM-VX)\n- [SuperEdge](https:\u002F\u002Fgithub.com\u002Fsuperedge\u002Fsuperedge)\n\n## License\n\n- [Apache 2.0](LICENSE)\n\n## 澄清说明\n\n- [在线上报功能] 在线上报功能主要目的是了解Tengine的使用信息，信息用于优化和迭代Tengine，不会影响任何正常功能。该功能默认开启，如需关闭，可修改如下配置关闭：(主目录 CMakeLists.txt )  OPTION (TENGINE_ONLINE_REPORT \"online report\" OFF)\n\n## FAQ\n\n- [FAQ 常见问题](doc\u002Fdocs_zh\u002Fintroduction\u002Ffaq.md)\n\n## 技术讨论\n\n- Github issues\n- QQ 群: 829565581\n- Email: Support@openailab.com\n","\u003Cdiv align=\"center\">\n  \u003Cimg width=\"40%\" src=\"https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FOAID_Tengine_readme_481131bb3af3.png\">\n  \u003Ch3> \u003Ca href=\"https:\u002F\u002Ftengine-docs.readthedocs.io\u002Fen\u002Flatest\u002F\"> 文档 \u003C\u002Fa> | \u003Ca href=\"https:\u002F\u002Ftengine.readthedocs.io\u002Fzh_CN\u002Flatest\u002F\"> 中文文档 \u003C\u002Fa>  \u003C\u002Fh3>\n\u003C\u002Fdiv>\n\n简体中文 | [English](.\u002FREADME_EN.md)\n\n# Tengine\n\n[![GitHub license](http:\u002F\u002FOAID.github.io\u002Fpics\u002Fapache_2.0.svg)](.\u002FLICENSE)\n[![GitHub Workflow Status](https:\u002F\u002Fimg.shields.io\u002Fgithub\u002Factions\u002Fworkflow\u002Fstatus\u002FOAID\u002FTengine\u002Fbuild-and-test.yml?branch=tengine-lite)](https:\u002F\u002Fgithub.com\u002FOAID\u002FTengine\u002Factions)\n[![Test Status](https:\u002F\u002Fimg.shields.io\u002Ftravis\u002FOAID\u002FTengine\u002Ftengine-lite?label=test)](https:\u002F\u002Ftravis-ci.org\u002FOAID\u002FTengine)\n[![codecov](https:\u002F\u002Fcodecov.io\u002Fgh\u002FOAID\u002FTengine\u002Fbranch\u002Ftengine-lite\u002Fgraph\u002Fbadge.svg?token=kz9NcQPRrk)](https:\u002F\u002Fcodecov.io\u002Fgh\u002FOAID\u002FTengine)\n[![Language grade: C\u002FC++](https:\u002F\u002Fimg.shields.io\u002Flgtm\u002Fgrade\u002Fcpp\u002Fg\u002FOAID\u002FTengine.svg?logo=lgtm&logoWidth=18)](https:\u002F\u002Flgtm.com\u002Fprojects\u002Fg\u002FOAID\u002FTengine\u002Fcontext:cpp)\n\n\n## 简介\n\n**Tengine** 由 **[OPEN AI LAB](http:\u002F\u002Fwww.openailab.com)** 主导开发，该项目实现了深度学习神经网络模型在嵌入式设备上的**快速**、**高效**部署需求。为实现在众多 **AIoT** 应用中的跨平台部署，本项目使用 **C 语言**进行核心模块开发，针对嵌入式设备资源有限的特点进行了深度框架裁剪。同时采用了完全分离的前后端设计，有利于 CPU、GPU、NPU 等异构计算单元的快速移植和部署，降低评估、迁移成本。\n\nTengine 核心代码由 4 个模块组成：\n\n- [**device**](source\u002Fdevice)：NN Operators 后端模块，已提供 CPU、GPU、NPU 参考代码；\n- [**scheduler**](source\u002Fscheduler)：框架核心部件，包括 NNIR、计算图、硬件资源、模型解析器的调度和执行模块；\n- [**operator**](source\u002Foperator)：NN Operators 前端模块，实现 NN Operators 注册、初始化；\n- [**serializer**](source\u002Fserializer)：模型解析器，实现 tmfile 格式的网络模型参数解析。\n\n\n## 架构简析\n\n![Tengine 架构](https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FOAID_Tengine_readme_dee569f03e4d.png)\n\n## 快速上手\n\n### 编译\n\n- [快速编译](doc\u002Fdocs_zh\u002Fsource_compile) 基于 cmake 实现简单的跨平台编译。\n\n### 示例\n\n- [examples](examples\u002F) 提供基础的分类、检测算法用例，根据 issue 需求持续更新。\n- [源安装](doc\u002Fdocs_zh\u002Fquick_start\u002Fapt-get-install_user_manual.md) 提供ubuntu系统的apt-get命令行安装和试用，目前支持x86\u002FA311D硬件。\n\n### 模型仓库\n\n- [百度网盘](https:\u002F\u002Fpan.baidu.com\u002Fs\u002F1JsitkY6FVV87Kao6h5yAmg) （提取码：7ke5）\n\n- [Google Drive](https:\u002F\u002Fdrive.google.com\u002Fdrive\u002Ffolders\u002F1hunePCa0x_R-Txv7kWqgx02uTCH3QWdS?usp=sharing)\n\n### 转换工具\n\n- [预编译版本](https:\u002F\u002Fgithub.com\u002FOAID\u002FTengine\u002Freleases\u002Fdownload\u002Flite-v1.2\u002Fconvert_tool.zip) ：提供 Ubuntu 18.04 系统上预编译好的模型转换工具；\n- [在线转换版本](https:\u002F\u002Fconvertmodel.com\u002F#outputFormat=tengine) ：基于 WebAssembly 实现（浏览器本地转换，模型不会上传；\n- [源码编译](https:\u002F\u002Fgithub.com\u002FOAID\u002FTengine\u002Ftree\u002Ftengine-lite\u002Ftools\u002Fconvert_tool) ：建议在服务器或者PC上编译，指令如下：\n  ```\n  mkdir build && cd build\n  cmake -DTENGINE_BUILD_CONVERT_TOOL=ON ..\n  make -j`nproc`\n  ```\n\n### 量化工具\n\n- [源码编译](tools\u002Fquantize\u002FREADME.md)：已开源量化工具源码，已支持 uint8\u002Fint8。\n\n### 速度评估\n\n- [Benchmark](benchmark\u002F) 基础网络速度评估工具，欢迎大家更新。\n\n### NPU Plugin\n\n- [TIM-VX](doc\u002Fdocs_zh\u002Fsource_compile\u002Fcompile_timvx.md) VeriSilicon NPU 使用指南。\n\n### AutoKernel Plugin\n\n- [AutoKernel](https:\u002F\u002Fgithub.com\u002FOAID\u002FAutoKernel.git) 是一个简单易用，低门槛的自动算子优化工具，AutoKernel Plugin实现了自动优化算子一键部署到 Tengine 中。\n\n### Container\n\n- [SuperEdge](https:\u002F\u002Fgithub.com\u002Fsuperedge\u002Fsuperedge) 借助 SuperEdge 边缘计算的开源容器管理系统，提供更便捷的业务管理方案；\n- [How to use Tengine with SuperEdge](doc\u002Fdocs_zh\u002Fsource_compile\u002Fdeploy_SuperEdge.md) 容器使用指南；\n- [Video Capture user manual](doc\u002Fdocs_zh\u002Fsource_compile\u002Fdemo_videocapture.md) Demo 依赖文件生成指南。\n\n## Roadmap\n\n- [Road map](doc\u002Fdocs_zh\u002Fintroduction\u002Froadmap.md)\n\n## 致谢\n\nTengine Lite 参考和借鉴了下列项目：\n\n- [Caffe](https:\u002F\u002Fgithub.com\u002FBVLC\u002Fcaffe)\n- [Tensorflow](https:\u002F\u002Fgithub.com\u002Ftensorflow\u002Ftensorflow)\n- [MegEngine](https:\u002F\u002Fgithub.com\u002FMegEngine\u002FMegEngine)\n- [ONNX](https:\u002F\u002Fgithub.com\u002Fonnx\u002Fonnx)\n- [ncnn](https:\u002F\u002Fgithub.com\u002FTencent\u002Fncnn)\n- [FeatherCNN](https:\u002F\u002Fgithub.com\u002FTencent\u002FFeatherCNN)\n- [MNN](https:\u002F\u002Fgithub.com\u002Falibaba\u002FMNN)\n- [Paddle Lite](https:\u002F\u002Fgithub.com\u002FPaddlePaddle\u002FPaddle-Lite)\n- [ACL](https:\u002F\u002Fgithub.com\u002FARM-software\u002FComputeLibrary)\n- [stb](https:\u002F\u002Fgithub.com\u002Fnothings\u002Fstb)\n- [convertmodel](https:\u002F\u002Fconvertmodel.com)\n- [TIM-VX](https:\u002F\u002Fgithub.com\u002FVeriSilicon\u002FTIM-VX)\n- [SuperEdge](https:\u002F\u002Fgithub.com\u002Fsuperedge\u002Fsuperedge)\n\n## License\n\n- [Apache 2.0](LICENSE)\n\n## 澄清说明\n\n- [在线上报功能] 在线上报功能主要目的是了解Tengine的使用信息，信息用于优化和迭代Tengine，不会影响任何正常功能。该功能默认开启，如需关闭，可修改如下配置关闭：(主目录 CMakeLists.txt )  OPTION (TENGINE_ONLINE_REPORT \"online report\" OFF)\n\n## FAQ\n\n- [FAQ 常见问题](doc\u002Fdocs_zh\u002Fintroduction\u002Ffaq.md)\n\n## 技术讨论\n\n- Github issues\n- QQ 群: 829565581\n- Email: Support@openailab.com","# Tengine 快速上手指南\n\nTengine 是由 OPEN AI LAB 主导开发的轻量级深度学习推理框架，专为嵌入式设备和 AIoT 场景设计。它支持 CPU、GPU、NPU 等异构计算单元，具备高性能、低资源占用的特点。\n\n## 1. 环境准备\n\n### 系统要求\n- **操作系统**：Linux (推荐 Ubuntu 18.04\u002F20.04), Android, macOS\n- **架构支持**：x86_64, ARM (ARMv7, ARMv8), RISC-V\n- **编译器**：GCC 5.4+ 或 Clang\n- **构建工具**：CMake 3.10+\n\n### 前置依赖\n在编译前，请确保安装以下基础依赖库：\n\n```bash\n# Ubuntu\u002FDebian 系统\nsudo apt-get update\nsudo apt-get install -y build-essential cmake git libprotobuf-dev protobuf-compiler\n```\n\n> **提示**：若需使用特定后端（如 Vulkan, TIM-VX 等），请参考对应插件文档安装额外依赖。\n\n## 2. 安装步骤\n\nTengine 推荐使用源码编译方式安装，以便根据目标硬件进行定制优化。\n\n### 步骤一：克隆代码\n建议使用 Gitee 镜像加速下载（国内开发者推荐）：\n```bash\ngit clone https:\u002F\u002Fgitee.com\u002FOAID\u002FTengine.git\n# 或使用 GitHub 源\n# git clone https:\u002F\u002Fgithub.com\u002FOAID\u002FTengine.git\ncd Tengine\n```\n\n### 步骤二：创建构建目录并配置\n```bash\nmkdir build && cd build\ncmake .. \n# 如需开启模型转换工具，添加参数：-DTENGINE_BUILD_CONVERT_TOOL=ON\n# 如需关闭在线上报功能，添加参数：-DTENGINE_ONLINE_REPORT=OFF\n```\n\n### 步骤三：编译与安装\n```bash\nmake -j$(nproc)\nsudo make install\n```\n编译完成后，头文件通常位于 `\u002Fusr\u002Flocal\u002Finclude\u002Ftengine`，库文件位于 `\u002Fusr\u002Flocal\u002Flib`。\n\n> **替代方案**：Ubuntu x86 或 A311D 用户可直接通过 apt 安装试用版：\n> ```bash\n> sudo apt-get install tengine-lite\n> ```\n\n## 3. 基本使用\n\n以下是一个最简单的 C++ 示例，展示如何加载模型并进行推理。\n\n### 3.1 准备模型\nTengine 原生支持 `.tmfile` 格式。如果您拥有 Caffe、ONNX、TensorFlow 等模型，需先使用转换工具转为 tmfile。\n\n**转换示例（将 ONNX 转为 tmfile）：**\n```bash\n.\u002Fconvert_tool -f onnx -m your_model.onnx -o your_model.tmfile\n```\n*注：预编译转换工具可从 Release 页面下载，或使用在线转换网站 convertmodel.com。*\n\n### 3.2 代码示例\n创建一个 `test_tengine.cpp` 文件：\n\n```cpp\n#include \"tengine\u002Fc_api.h\"\n#include \u003Cstdio.h>\n\nint main() {\n    \u002F\u002F 1. 初始化 Tengine\n    if (init_tengine() != 0) {\n        fprintf(stderr, \"Init Tengine failed\\n\");\n        return -1;\n    }\n\n    \u002F\u002F 2. 创建图\n    graph_t graph = create_graph(nullptr, \"tengine\", nullptr);\n    if (graph == nullptr) {\n        fprintf(stderr, \"Create graph failed\\n\");\n        return -1;\n    }\n\n    \u002F\u002F 3. 加载模型 (请替换为您的实际模型路径)\n    const char* model_file = \".\u002Fmobilenet.tmfile\";\n    if (load_graph(graph, model_file) \u003C 0) {\n        fprintf(stderr, \"Load graph failed\\n\");\n        return -1;\n    }\n\n    \u002F\u002F 4. 运行推理\n    if (run_graph(graph, 1) \u003C 0) {\n        fprintf(stderr, \"Run graph failed\\n\");\n        return -1;\n    }\n\n    printf(\"Inference successful!\\n\");\n\n    \u002F\u002F 5. 释放资源\n    release_graph_tensor(graph);\n    destroy_graph(graph);\n    release_tengine();\n\n    return 0;\n}\n```\n\n### 3.3 编译并运行示例\n```bash\n# 编译\ng++ test_tengine.cpp -o test_tengine -ltengine\n\n# 运行\nexport LD_LIBRARY_PATH=\u002Fusr\u002Flocal\u002Flib:$LD_LIBRARY_PATH\n.\u002Ftest_tengine\n```\n\n### 3.4 运行官方 Benchmark\nTengine 内置了性能评估工具，可用于测试主流网络在您当前设备上的推理速度：\n```bash\ncd build\u002Fbenchmark\n.\u002Fbenchmarks\u002Fbench_mobilenet\n```","某智能安防团队需在资源受限的嵌入式摄像头端部署人脸识别算法，以实现实时门禁控制。\n\n### 没有 Tengine 时\n- **推理延迟高**：通用框架在 ARM 架构上运行笨重，人脸检测耗时超过 500ms，导致用户刷卡后需长时间等待开门。\n- **内存占用过大**：模型加载后占用数百兆内存，极易触发设备内存溢出（OOM），造成系统频繁崩溃重启。\n- **异构硬件适配难**：团队试图利用设备自带的 NPU 加速，但缺乏统一接口，需针对不同芯片手动重写底层算子，移植周期长达数周。\n- **功耗失控**：CPU 持续满载运行导致设备发热严重，电池供电场景下续航时间不足 4 小时。\n\n### 使用 Tengine 后\n- **毫秒级响应**：Tengine 针对嵌入式 CPU\u002FNPU 深度优化，将单帧推理时间压缩至 30ms 以内，实现“刷脸即开”的流畅体验。\n- **轻量化部署**：通过框架裁剪和静态内存管理，内存占用降低至 50MB 以下，系统在低配设备上也能稳定运行数月无故障。\n- **一键异构加速**：借助 Tengine 前后端分离架构，仅需修改少量配置即可调用 NPU 加速，同一套代码无缝迁移至不同芯片平台。\n- **能效比显著提升**：高效调度机制大幅降低 CPU 负载，设备温升可控，电池续航能力提升至 12 小时以上。\n\nTengine 通过极致的轻量化设计与异构计算支持，让复杂的深度学习模型在低端嵌入式设备上也能跑得又快又稳。","https:\u002F\u002Foss.gittoolsai.com\u002Fimages\u002FOAID_Tengine_481131bb.png","OAID","https:\u002F\u002Foss.gittoolsai.com\u002Favatars\u002FOAID_1f35339f.jpg","Open AID, created by OPEN AI LAB",null,"yhuang@openailab.com","https:\u002F\u002Fgithub.com\u002FOAID",[82,86,90,94,98,102,106,110],{"name":83,"color":84,"percentage":85},"C++","#f34b7d",49,{"name":87,"color":88,"percentage":89},"C","#555555",41.8,{"name":91,"color":92,"percentage":93},"Assembly","#6E4C13",5.3,{"name":95,"color":96,"percentage":97},"CMake","#DA3434",2.1,{"name":99,"color":100,"percentage":101},"Python","#3572A5",1.1,{"name":103,"color":104,"percentage":105},"Cuda","#3A4E3A",0.4,{"name":107,"color":108,"percentage":109},"Shell","#89e051",0.1,{"name":111,"color":112,"percentage":109},"Batchfile","#C1F12E",4513,977,"2026-04-02T08:36:29","Apache-2.0",4,"Linux","非必需。支持异构计算，可选配 CPU、GPU 或 NPU。若使用 GPU\u002FNPU，需对应后端插件（如 TIM-VX 用于 VeriSilicon NPU），README 未指定具体显卡型号、显存大小或 CUDA 版本。","未说明（针对嵌入式设备优化，资源占用低）",{"notes":122,"python":123,"dependencies":124},"1. 核心由 C 语言编写，专为嵌入式设备和 AIoT 应用设计，支持跨平台部署。\n2. 模型转换工具提供 Ubuntu 18.04 预编译版本，也可通过源码在服务器或 PC 上编译。\n3. 支持多种后端（CPU\u002FGPU\u002FNPU），采用前后端分离设计以便移植。\n4. 默认开启在线上报功能以收集使用信息，如需关闭需在 CMakeLists.txt 中设置 OPTION (TENGINE_ONLINE_REPORT \"online report\" OFF)。","未说明（核心模块由 C 语言开发）",[95,125,126,127],"GCC\u002FG++","TIM-VX (可选，用于 VeriSilicon NPU)","AutoKernel (可选，用于算子优化)",[14,13,15],[130,131,132,133,134,135,136,137,138,139,140,141,142,143,144,145,146],"arm","machine-learning","artificial-intelligence","cnn","tensorflow","pytorch","onnx","x86-64","mips","cuda","tensorrt","acl","npu","riscv","supperedge","container","nvdla","2026-03-27T02:49:30.150509","2026-04-06T05:15:28.811788",[150,155,160,165,170,175],{"id":151,"question_zh":152,"answer_zh":153,"source_url":154},18085,"运行 Tengine 时遇到 'no serializer found for tengine' 和 'Load model to graph failed' 错误怎么办？","这通常是因为编译配置问题。请尝试将 src\u002FCMakeLists.txt 文件中第 215 行附近的 SHARED 改为 STATIC，然后重新编译项目。此外，建议先尝试使用最新版本的代码。","https:\u002F\u002Fgithub.com\u002FOAID\u002FTengine\u002Fissues\u002F525",{"id":156,"question_zh":157,"answer_zh":158,"source_url":159},18086,"如何正确编译支持 ACL (ARM Compute Library) 的 Tengine？","如果遇到 ACL 编译错误或运行时崩溃，请按照以下步骤操作：\n1. 使用以下命令重新编译 Compute Library（注意 neon=0）：\nscons Werror=1 -j4 debug=0 asserts=1 neon=0 opencl=1 embed_kernels=1 os=linux arch=arm64-v8a\n2. 下载 libmali 库。\n3. 在 lib 文件夹中将 \u002Fusr\u002Flib\u002Faarch64-linux-gnu\u002FlibOpenCL.so.1.0.0 链接到 libmali 对应的 so 文件（例如 libmali-midgaurd-t86-r14p0-fbdev.so）。\n避免使用过时的 stubs 编译方法。","https:\u002F\u002Fgithub.com\u002FOAID\u002FTengine\u002Fissues\u002F58",{"id":161,"question_zh":162,"answer_zh":163,"source_url":164},18087,"编译 Tengine 时报错 '\u002Fusr\u002Fbin\u002Fld: cannot find -lopenblas' 或 'undefined symbol: cblas_sgemm' 如何解决？","这通常是因为链接器找不到 OpenBLAS 库。解决方法如下：\n1. 确保目标板子上安装了 libopenblas。\n2. 修改根目录下的 CMakeLists.txt，将 TARGET_LINK_LIBRARIES(hclcpu ${BLAS_LINKER_FLAGS}) 改为直接指定库路径，例如：TARGET_LINK_LIBRARIES(hclcpu ${OPENBLAS_LIB_PATH}\u002Flibopenblas.so)。\n3. 在配置文件（如 x86 config file）中正确赋值 OPENBLAS_LIB_PATH 和 OPENBLAS_INCLUDE_PATH。","https:\u002F\u002Fgithub.com\u002FOAID\u002FTengine\u002Fissues\u002F112",{"id":166,"question_zh":167,"answer_zh":168,"source_url":169},18088,"Tengine 在 A53 四核处理器上的推理性能远低于预期（如比 OpenCV-DNN 慢很多），可能是什么原因？","性能差异通常由编译配置不当引起。请确保使用正确的交叉编译工具链进行编译，例如：\ncmake -DCMAKE_TOOLCHAIN_FILE=..\u002Ftoolchains\u002Faarch64-linux-gnu.toolchain.cmake ..\n错误的编译选项可能导致无法启用硬件加速或多线程优化，从而造成性能大幅下降。","https:\u002F\u002Fgithub.com\u002FOAID\u002FTengine\u002Fissues\u002F323",{"id":171,"question_zh":172,"answer_zh":173,"source_url":174},18089,"预训练模型托管在百度网盘，没有中国手机号无法下载，有什么替代方案？","由于官方模型托管在需要中国手机号注册的百度网盘上，海外用户可以直接联系项目维护者或其他社区成员，请求通过电子邮件发送所需的模型文件（如 mobilenet_ssd 等）。","https:\u002F\u002Fgithub.com\u002FOAID\u002FTengine\u002Fissues\u002F99",{"id":176,"question_zh":177,"answer_zh":178,"source_url":169},18090,"如何在 Tengine 中调试并对比每一层的输出结果以定位精度问题？","可以启用宏 DUMP_NODE_OUTPUT(driver\u002Fcpu\u002Fcpu_runner.cpp) 来打印每一层的输出数据。通过使用相同的输入数据，对比不同实现（如 C 与 C++ 应用，或与 Darknet 结果）的每一层输出，可以找到出现差异的具体层级，从而定位问题原因。",[180,185,190,195,200,205,210,215,220,225,230,235,240,245,249,253,258,263,268,273],{"id":181,"version":182,"summary_zh":183,"released_at":184},108558,"lite-v1.5-nvdla","### NVDLA v1.5 版本发布\n\n#### 基线版本\n\n- lite-v1.5\n\n#### 硬件后端支持\n\n- Zynq UltraScale+ MPSoC ZCU102\n\n#### 软件依赖\n\n- Ubuntu 20.04\n- OpenCV 4.2\n- gcc 9.3.0\n- cmake 3.16.3\n\n#### NVDLA 类型支持\n\n- Small\n\n#### NVDLA 算子支持\n\n- Batchnorm\n- Concat\n- Convolution\n- Deconvolution\n- Eltwise\n- FC\n- Pooling\n- ReLU\n- Scale\n- Split\n\n#### NVDLA 网络支持\n\n| 模型           | 输入尺寸       | ZCU102+NVDLA 推理时间 (ms) |\n| --------------- | --------------- | ------------------ |\n| ResNet18                | 3×32×32          | 12.6 |\n| YOLOv3-Tiny-ReLU | 3×416×416      | 630.5 |\n| YOLOX-Nano-ReLU |  3×416×416     | 1138.8 |\n\n#### Tengine NVDLA 示例支持\n- [tm_classification_opendla.c](https:\u002F\u002Fgithub.com\u002FOAID\u002FTengine\u002Fblob\u002Ftengine-lite\u002Fexamples\u002Ftm_classification_opendla.c)\n- [tm_yolov3_tiny_opendla.cpp](https:\u002F\u002Fgithub.com\u002FOAID\u002FTengine\u002Fblob\u002Ftengine-lite\u002Fexamples\u002Ftm_yolov3_tiny_opendla.cpp)\n- [tm_yolox_opendla.cpp](https:\u002F\u002Fgithub.com\u002FOAID\u002FTengine\u002Fblob\u002Ftengine-lite\u002Fexamples\u002Ftm_yolox_opendla.cpp)\n\n#### 参考文档\n- [基于 Tengine 的开源加速器工具链](https:\u002F\u002Fzhuanlan.zhihu.com\u002Fp\u002F401943271)\n- [Tengine 开源说第七讲之 OpenDLA 后端](https:\u002F\u002Fwww.bilibili.com\u002Fvideo\u002FBV1z44y1478k?share_source=copy_web)\n\n#### ZCU102 的 Ubuntu 镜像\n- [zcu102OS.img](https:\u002F\u002Fpan.baidu.com\u002Fs\u002F1Z5_XrwHvH4rUJeij7us8tw), _密码 : adp8_","2021-10-08T07:22:53",{"id":186,"version":187,"summary_zh":188,"released_at":189},108559,"lite-v1.5","### 发布 v1.5\n\n#### 新增演示与示例\n\n- 流水线演示\n  - 人脸注册\n  - 行人距离估计\n  - ArcFace\n  - CenterFace\n  - SCRFD\n  - YOLO\n- 示例\n  - YOLOX\n  - SegFormer\n  - SeGHuman\n  - SCRFD\n\n#### 新增硬件后端支持\n\n- 通过 OpenDLA 支持 NVDLA\n\n#### 新增工具支持\n\n- 对齐工具\n  - ONNX 对齐工具，用于比较原始 ONNX 模型与 TMFile 模型\n- 转换工具\n  - ONNX\n  - Caffe\n  - MXNet\n  - Darknet\n  - TensorFlow（开发中）\n  - TFLite（开发中）\n- 优化工具\n  - segformer-opt\n- 量化工具\n  - ACIQ\n  - DFQ\n  - EasyQuant\n\n#### 新增在线文档\n\n- 将在线文档的 Markdown 文件移至主分支\n\n#### 新特性\n\n- 重构 Python API\n\n#### CI\u002FCD\n\n- 在 CI 流程中添加模型测试模块\n- 在 CI 流程中添加算子测试模块\n- 在 CI 流程中添加后端设备运行器\n  - Khadas VIM3\n  - Jetson AGX\n\n#### *附注*\n\n- *我们已使用以下设备测试过 NV GPU：*\n  - *GeForce RTX 3090*\n  - *GeForce GTX 1080Ti*\n  - *QUADRO RTX 8000*\n  - *Jetson AGX\u002FNX\u002FNANO*\n- *我们已使用以下设备测试过 VeriSilicon NPU：*\n  - *A311D*\n  - *S905D3*\n  - *RV1109*\n  - *RV1126*\n  - *i.MX 8M Plus*\n  - *JA310*\n- *我们已使用以下设备测试过 NVDLA：*\n  - *ZCU102*","2021-09-03T03:36:06",{"id":191,"version":192,"summary_zh":193,"released_at":194},108560,"latest","## 提交记录\n- 31903cf：TensorFlow 序列化器 (#1109) (bzhang5) [#1109](https:\u002F\u002Fgithub.com\u002FOAID\u002FTengine\u002Fpull\u002F1109)\n- b52c4b0：修复 bug：将字符 '\u002F' 转换为 '-' (#1110) (xiguadong) [#1110](https:\u002F\u002Fgithub.com\u002FOAID\u002FTengine\u002Fpull\u002F1110)\n- f676175：文档错误 (#1111) (sysgiven) [#1111](https:\u002F\u002Fgithub.com\u002FOAID\u002FTengine\u002Fpull\u002F1111)\n- 3e71f04：更新 DFQ\u002FEQ\u002F评估 int8 每通道量化工具 (#1112) (BowShotDS) [#1112](https:\u002F\u002Fgithub.com\u002FOAID\u002FTengine\u002Fpull\u002F1112)\n- 945a371：更新 convolution.c (#1113) (Thunder) [#1113](https:\u002F\u002Fgithub.com\u002FOAID\u002FTengine\u002Fpull\u002F1113)\n- 7bf86d1：TensorFlow 序列化器 (#1114) (bzhang5) [#1114](https:\u002F\u002Fgithub.com\u002FOAID\u002FTengine\u002Fpull\u002F1114)","2021-09-03T02:55:47",{"id":196,"version":197,"summary_zh":198,"released_at":199},108561,"lite-v1.4-superedge","### SuperEdge v1.4 版本发布\n\n#### 基线版本\n\n- lite-v1.4\n\n#### 硬件后端支持\n\n- Khadas VIM3 (A311D)\n\n#### 软件依赖\n\n- Ubuntu 20.04\n- OpenCV 4.2\n- gcc 9.3.0\n- cmake 3.16.3\n\n#### NPU 网络支持\n\n| 模型          | A311D 推理时间 (ms) |\n| --------------- | ------------------ |\n| MobileNet v1    | 4.3                |\n| MobileNet v2    | 5.2                |\n| ResNet18        | 5.5                |\n| ResNet50        | 14.6               |\n| SqueezeNet v1.1 | 2.6                |\n| VGG16           | 18.7               |\n| YOLOv3          | 78.6               |\n| YOLOv5s         | 68.9               |\n| YOLOX-S         | 55.2               |\n","2021-07-28T09:19:59",{"id":201,"version":202,"summary_zh":203,"released_at":204},108562,"lite-v1.4-amlogic","### Amlogic 平台 v1.4 版本发布\n\n#### 基线版本\n\n- lite-v1.4\n\n#### 硬件后端支持\n\n- A311D\n- S905D3\n\n#### NPU 支持的网络模型\n\n| 模型            | A311D 上的推理时间 (ms) |\n| --------------- | ------------------ |\n| MobileNet v1    | 4.3                |\n| MobileNet v2    | 5.2                |\n| ResNet18        | 5.5                |\n| ResNet50        | 14.6               |\n| SqueezeNet v1.1 | 2.6                |\n| VGG16           | 18.7               |\n| YOLOv3          | 78.6               |\n| YOLOv5s         | 68.9               |","2021-06-22T07:48:28",{"id":206,"version":207,"summary_zh":208,"released_at":209},108563,"lite-v1.4-allwinner","### 全志平台 v1.4 版本发布\n\n#### 基线版本\n\n- lite-v1.4\n\n#### 硬件后端支持\n\n- D1（RISC-V C906）\n\n#### CPU 网络支持\n\n| 模型           |\n| --------------- |\n| MobileNet v1 |\n| MobileNet v2 |\n| ResNet18       |\n| SqueezeNet v1.1|\n| YOLO-Fastest |","2021-05-15T02:55:24",{"id":211,"version":212,"summary_zh":213,"released_at":214},108564,"lite-v1.4-nxp","### NXP 平台 v1.4 版本发布\n\n#### 基线版本\n\n- lite-v1.4\n\n#### 硬件后端支持\n\n- i.MX 8M Plus\n\n#### NPU 支持的网络模型\n\n| 模型            | 推理时间 (ms) |\n| --------------- | ------------- |\n| MobileNet v1    | 2.3           |\n| MobileNet v2    | 5.1           |\n| ResNet18        | 4.5           |\n| ResNet50        | 11.7          |\n| SqueezeNet v1.1 | 2.5           |\n| VGG16           | 22.8          |\n| YOLOv3          | 78.2          |","2021-04-30T05:08:08",{"id":216,"version":217,"summary_zh":218,"released_at":219},108565,"lite-v1.4","### 发布 v1.4\n\n#### 新的硬件后端支持\n\n- 支持 C906\u002FC910 的 RISC-V CPU\n- 通过 OpenCL 支持 NV\u002FAMD\u002FMali GPU\n\n#### 新训练框架的模型支持\n\n- tengine-convert-tool 现在支持 PaddlePaddle 2.0 格式的模型，并将根据用户需求继续推进相关工作。（请在我们的 Github Issues 中留下您的需求）\n\n#### 错误修复\n\n- 重构注册模块代码\n- 重构编译模块代码，以支持 Visual Studio\n\n#### CI\u002FCD\n\n- 在 CI 流程中添加代码质量检查模块\n\n#### *附注*\n\n- *我们已使用以下设备测试过 NV GPU*：\n  - GeForce RTX 3090\n  - GeForce GTX 1080Ti\n  - QUADRO RTX 8000\n  - Jetson AGX\u002FNX\u002FNANO\n- *我们已使用以下设备测试过 VeriSilicon NPU*：\n  - A311D\n  - S905D3\n  - i.MX 8M Plus\n  - JA310","2021-04-29T08:25:28",{"id":221,"version":222,"summary_zh":223,"released_at":224},108566,"lite-v1.3","### 发布 v1.3\n\n#### 新增硬件后端支持\n\n- 通过 CUDA 和 cuDNN 支持 NVIDIA GPU\n- 通过 TensorRT 插件支持 NVIDIA GPU\n- 通过 TIM-VX 插件支持 VeriSilicon NPU\n\n#### 新训练框架的模型支持\n\n- tengine-convert-tool 尝试支持 OneFlow 模型\n\n#### 错误修复\n\n- 重构 ACL 插件代码，修复在 Mali GPU 上编译或推理时的 bug\n\n#### CI\u002FCD\n\n- 在 CI 流程中新增代码覆盖率模式\n- 在 CI 流程中增加模型测试，包括分类、检测、识别和分割等任务\n\n#### *附注*\n\n- *我们已使用以下设备测试过 NVIDIA GPU*：\n  - GeForce RTX 3090\n  - GeForce GTX 1080Ti\n  - QUADRO RTX 8000\n  - Jetson AGX\u002FNX\u002FNANO\n- *我们已使用以下设备测试过 VeriSilicon NPU*：\n  - Khadas VIM3","2021-02-17T05:50:41",{"id":226,"version":227,"summary_zh":228,"released_at":229},108567,"lite-v1.2","### 发布 v1.2\n\n#### 新特性\n\n- CPU 亲和性 API\n- CPU 性能剖析工具\n- 推理模式支持 Int8（对称、按通道）\n- 发布量化工具（Int8、UInt8）\n- 支持基于 HarmonyOS 编译\n- 支持使用 Visual Studio 2019 编译\n\n#### 新增网络支持\n\n- AlphaPose\n- CRNN\n- YOLOv4_tiny\n\n#### 新增算子支持\n\n- Int8 参考算子（实验）\n\n#### 性能优化\n\n- 在 ARMv7\u002Fv8 架构上进行 Int8 性能算子优化（实验）\n- 在 x86-64 架构上进行 Int8 性能算子优化（实验）","2020-12-25T05:29:47",{"id":231,"version":232,"summary_zh":233,"released_at":234},108568,"lite-v1.2-pre","- Tengine-Lite 将开放第一个 NPU 版本给到广大的开发者试用\r\n  - 目前我们 Pre-Release 的是 Amlogic 的一颗带 NPU 的芯片 A311D，合作方式是在 Single Board Computer(SBC)-Khadas vim3上预装此试用版本-传送门；\r\n  - 为了配合预装版本的发布，需要在开源社区开放相应的模型转换工具和模型量化工具；\r\n  - 由于涉及第三方知识产权的问题，暂时还无法开源相关源代码；\r\n  - 欢迎大家尝试在 Khadas VIM3（311D） 上试用 Tengine Lite 所支持的 NPU 最新特性；\r\n  - 闲来大佬打造的真-异构计算（闲来大佬甚至还自己做了个3D打印外壳-传送门)；\r\n  - 欢迎大家提出宝贵的建议，可以来我们 QQ 群交流！\r\n- 我们也在和更多的开源开发板、SBC 公司合作，会有其他开发板，敬请期待；\r\n- 我们也在同更多的 NPU 厂商合作，欢迎感兴趣的小伙伴咨询或加入我们共建 Tengine 开源生态！\r\n","2020-12-10T11:56:03",{"id":236,"version":237,"summary_zh":238,"released_at":239},108569,"lite-v1.0","### Release v1.0\r\n\r\n#### New feature\r\n\r\n- Dynamic graph segmentation\r\n\r\n- C++ API (experiment)\r\n- Python API (experiment)\r\n\r\n- support ARM-Mali GPU with ACL\r\n- support others GPU with Vulkan (experiment)\r\n- support fp16 inference with armv8.2 (experiment)\r\n\r\n#### New network support\r\n\r\n- landmark\r\n- yolact\r\n- openpose\r\n- yolov4\r\n\r\n#### New operator support\r\n\r\n- uint8 reference op (experiment)\r\n\r\n- mish activation op\r\n\r\n#### Performance\r\n\r\n- update the performance of openmp\r\n\r\n\r\n\r\n","2020-10-06T03:13:21",{"id":241,"version":242,"summary_zh":243,"released_at":244},108570,"lite-v0.1","Initial Tengine Lite release v0.1","2020-07-06T12:33:05",{"id":246,"version":247,"summary_zh":78,"released_at":248},108571,"v1.12.0","2020-03-03T02:37:28",{"id":250,"version":251,"summary_zh":78,"released_at":252},108572,"v1.9.0","2019-11-27T08:25:17",{"id":254,"version":255,"summary_zh":256,"released_at":257},108573,"v1.3.2","Separate cpu operator implementation and the framework into two so.\r\nAdd serializer for TFLite, and reference implementation on TFLite op.\r\nAdd RNN\u002FGRU\u002FLSTM reference implementation","2019-05-04T01:50:17",{"id":259,"version":260,"summary_zh":261,"released_at":262},108574,"v1.0.0","With the new API 2.0 and a few new features and bug fixes. ","2018-12-31T05:43:14",{"id":264,"version":265,"summary_zh":266,"released_at":267},108575,"v0.8.0","Android build to run ACL \r\nMSSD can use GPU to accelerate \r\nAndroid build with c++_shared instead of gnustl_shared\r\n","2018-11-22T05:49:50",{"id":269,"version":270,"summary_zh":271,"released_at":272},108576,"v0.7.2","Support GPU fp16. Only works with ACL 18.05\r\nMore tensorflow model and onnx model support","2018-10-26T06:25:50",{"id":274,"version":275,"summary_zh":276,"released_at":277},108577,"v0.5.0","This is a first version which  implements many basic features for an inference engine","2018-06-27T10:55:46"]