Adlik
Adlik 是一个专为加速深度学习推理而打造的全流程优化框架,旨在让模型在云端、边缘端及嵌入式设备上都能高效运行。它主要解决了深度学习模型在实际部署中面临的性能瓶颈和环境适配难题,帮助开发者轻松将训练好的模型转化为高性能的生产应用。
无论是需要高并发处理的云服务,还是资源受限的边缘设备,Adlik 都能提供灵活的部署方案:在云端支持容器化部署,在边缘端实现模型自动更新与加载,而在终端设备上则可直接编译为二进制文件嵌入应用。其核心技术亮点在于集成了模型优化器与编译器,支持剪枝、量化及结构压缩等先进算法,兼容 TensorFlow、PyTorch、Keras 等多种主流框架开发的模型。
这款工具非常适合人工智能开发者、算法工程师及研究人员使用。如果你正致力于将实验阶段的模型落地到真实场景,或希望在不更换硬件的前提下显著提升推理速度,Adlik 将是一个实用且强大的助手,助你以更低的成本实现更流畅的智能体验。
使用场景
某智慧零售团队正在将基于 ResNet50 的商品识别模型从云端下沉到边缘网关,以实现在线下的实时客流分析与货架监控。
没有 Adlik 时
- 推理延迟高:原始模型在边缘设备的 CPU 上运行缓慢,单张图片识别耗时超过 200ms,无法满足实时视频流处理需求。
- 部署流程繁琐:针对不同硬件架构(如 ARM vs x86)需手动重写底层推理代码,维护多套二进制文件,极易出错。
- 资源占用过大:未优化的模型显存和内存占用过高,导致边缘设备频繁出现内存溢出(OOM),系统稳定性差。
- 框架迁移困难:训练使用的 PyTorch 模型难以直接在生产环境的 C++ 服务中高效加载,转换过程损耗大且兼容性差。
使用 Adlik 后
- 推理速度倍增:利用 Adlik Model Compiler 的量化与剪枝技术,模型在同等硬件上推理延迟降至 40ms 以内,吞吐量提升 5 倍。
- 一次编译多处运行:通过 Adlik Serving Engine 将模型打包为统一容器或二进制库,自动适配云、边、端不同环境,部署效率提升 80%。
- 极致资源优化:经过结构压缩后的模型体积缩小 70%,内存占用大幅降低,使低配边缘网关也能稳定运行复杂算法。
- 无缝框架支持:直接支持 TensorFlow、PyTorch 等主流框架模型的导入与优化,无需修改原有训练代码即可生成高性能推理引擎。
Adlik 通过端到端的模型编译与优化能力,让深度学习模型在资源受限的边缘设备上也能实现云端般的高效推理。
运行环境要求
- Linux (Ubuntu)
- 可选
- 若使用 GPU 推理或编译 TensorRT 模型,需要 NVIDIA GPU 及 CUDA 支持
- 文档示例提及 CUDA 11.0 和 11.6 版本,需安装对应的 cuDNN 和 TensorRT 库
未说明

快速开始
Adlik
Adlik [ædlik] 是一个用于深度学习模型的端到端优化框架。Adlik 的目标是在云端和嵌入式环境中加速深度学习推理过程。

借助 Adlik 框架,不同的深度学习模型可以以高性能、灵活且简便的方式部署到不同平台上。

- 在云环境中,编译后的模型和 Adlik 推理引擎应被打包成 Docker 镜像,并作为容器部署。
- 在边缘环境中,Adlik 推理引擎应以容器形式部署。编译后的模型需传输到边缘环境,Adlik 推理引擎会自动更新并加载该模型。
- 在设备环境中,Adlik 推理引擎和编译后的模型应被编译为二进制文件(so 或 lib)。希望在设备上运行模型推理的用户,只需将自定义的 AI 函数与 Adlik 二进制文件链接到可执行文件中,即可直接运行。
Adlik 的推理性能
我们使用简单的 CNN 模型(MNIST 模型)、ResNet50 模型和 InceptionV3 模型,在相同的 CPU 或 GPU 上,结合不同的推理引擎,测试了 Adlik 的推理性能。Adlik 在不同模型上的测试数据如下:
目录
模型优化器
模型优化器 专注于特定硬件,并在其上运行以实现加速。该框架主要包括两类算法组件:剪枝器和量化器。
模型编译器
模型编译器 支持多种优化技术,如剪枝、量化和结构化压缩,这些技术可以轻松应用于使用 TensorFlow、Keras、PyTorch 等开发的模型。
推理引擎
推理引擎 根据部署环境为深度学习模型提供优化的运行时。简单来说,基于一个深度学习模型,Adlik 用户可以通过模型编译器对其进行优化,然后利用 Adlik 推理平台将其部署到特定平台上。
开始使用
Docker 镜像
所有 Adlik 编译器镜像和推理镜像都存储在 阿里云 上。这些镜像可以直接下载使用,用户无需在 Ubuntu 上构建 Adlik。用户可以使用编译器镜像将 H5、CheckPoint、FrozenGraph、ONNX 和 SavedModel 格式的模型编译为 Openvino、TensorFlow、TensorFlow Lite 和 TensorRT 格式。同时,用户也可以使用推理镜像进行模型推理。
Docker 拉取命令:
docker pull docker_image_name:tag
编译器 Docker 镜像
编译器 Docker 镜像可用于 CPU 和 GPU 环境。在 CPU 环境下,您可以将源格式的模型编译为 TensorFlow 模型、OpenVino 模型和 TensorFlow Lite 模型。而在 GPU 环境下,则可以将源格式的模型编译为 TensorFlow 模型和 TensorRT 模型。编译器镜像的名称和标签如下所示,其中标签的前半部分表示 TensorRT 的版本,后半部分表示 CUDA 的版本:
registry.cn-beijing.aliyuncs.com/adlik/model-compiler:v1.0
使用模型编译器镜像编译模型
运行镜像。
docker run -it --rm -v source_model:/mnt/model registry.cn-beijing.aliyuncs.com/adlik/model-compiler:v1.0 bash配置编译模型所需的 JSON 文件或环境变量。
config_schema.json 描述了 JSON 文件中的字段信息,示例可参考 compiler_json_example.json。关于环境变量字段的说明,请参阅 env_field.txt,示例可参考 compiler_env_example.txt。
注意:检查点模型在编译时必须提供输入和输出操作符名称,而其他类型的模型则无需提供这些名称。
编译模型。
编译说明(JSON 文件模式):
python3 "-c" "import json; import model_compiler as compiler; file=open('/mnt/model/serving_model.json','r'); request = json.load(file);compiler.compile_model(request); file.close()"编译说明(环境变量模式):
python3 "-c" "import model_compiler.compiler as compiler;compiler.compile_from_env()"
提供推理服务的 Docker 镜像
提供的推理服务 Docker 镜像包含 CPU 和 GPU 版本。OpenVINO 镜像的标签表示 OpenVINO 的版本号。对于 TensorRT 镜像,标签的前半部分表示 TensorRT 的版本号,后半部分表示 CUDA 的版本号。以下是各推理镜像的名称及标签:
CPU 版本:
- registry.cn-beijing.aliyuncs.com/adlik/serving-tflite-cpu:v1.0
- registry.cn-beijing.aliyuncs.com/adlik/serving-tensorflow-cpu:v1.0
- registry.cn-beijing.aliyuncs.com/adlik/serving-openvino:v1.0
- registry.cn-beijing.aliyuncs.com/adlik/serving-libtorch-cpu:v1.0
GPU 版本:
- registry.cn-beijing.aliyuncs.com/adlik/serving-tftrt-gpu:v1.0
- registry.cn-beijing.aliyuncs.com/adlik/serving-tensorrt:v1.0
- registry.cn-beijing.aliyuncs.com/adlik/serving-libtorch-gpu:v1.0
使用推理服务镜像进行模型推理
运行镜像,并注意映射服务端口。
docker run -it --rm -p 8500:8500 -v compiled_model:/model registry.cn-beijing.aliyuncs.com/adlik/serving-openvino:v1.0 bash在容器中加载编译好的模型并启动服务。
adlik-serving --grpc_port=8500 --http_port=8501 --model_base_path=/model在本地安装客户端 wheel 包 adlik serving package 或 adlik serving gpu package, 执行推理代码并完成推理。
注意: 如果运行镜像时未映射服务端口,则需要在容器内安装 adlik serving package 或 adlik serving gpu package, 然后再执行推理代码并在容器中完成推理。
构建说明
本指南适用于在 Ubuntu 系统上构建 Adlik。
然后,克隆 Adlik 仓库并将工作目录切换到源码目录:
git clone https://github.com/Adlik/Adlik.git
cd Adlik
构建客户端
安装以下软件包:
python3-setuptoolspython3-wheel
构建客户端:
bazel build //adlik_serving/clients/python:build_pip_package -c opt构建 pip 包:
mkdir /tmp/pip-packages && bazel-bin/adlik_serving/clients/python/build_pip_package /tmp/pip-packages
构建推理服务
首先,安装以下软件包:
automakelibtbb2libtoolmakepython3-six
使用 OpenVINO 运行时构建推理服务
从 OpenVINO 安装
openvino-<VERSION>软件包。假设 OpenVINO 的安装路径为
/opt/intel/openvino_VERSION,运行以下命令:export INTEL_CVSDK_DIR=/opt/intel/openvino_2022 export InferenceEngine_DIR=$INTEL_CVSDK_DIR/runtime/cmake bazel build //adlik_serving \ --config=openvino \ -c opt
使用 TensorFlow CPU 运行时构建推理服务
运行以下命令:
bazel build //adlik_serving \ --config=tensorflow-cpu \ -c opt
使用 TensorFlow GPU 运行时构建推理服务
假设使用 CUDA 11.6 版本进行构建。
-
cuda-nvprune-11-6cuda-nvtx-11-6cuda-cupti-dev-11-6libcublas-dev-11-6libcudnn8=*+cuda11.6libcudnn8-dev=*+cuda11.6libcufft-dev-11-6libcurand-dev-11-6libcusolver-dev-11-6libcusparse-dev-11-6libnvinfer8=8.4.*+cuda11.6libnvinfer-dev=8.4.*+cuda11.6libnvinfer-plugin7=8.4.*+cuda11.6libnvinfer-plugin-dev=8.4.*+cuda11.6
运行以下命令:
env TF_CUDA_VERSION=11.6 TF_NEED_TENSORRT=1 \ bazel build //adlik_serving \ --config=tensorflow-gpu \ -c opt \ --incompatible_use_specific_tool_files=false
使用 TensorFlow Lite CPU 运行时构建推理服务
运行以下命令:
bazel build //adlik_serving \ --config=tensorflow-lite-cpu \ -c opt
使用 TensorRT 运行时构建推理服务
假设使用 CUDA 11.0 版本进行构建。
-
cuda-cupti-dev-11-6cuda-nvml-dev-11-6cuda-nvrtc-11-6libcublas-dev-11-6libcudnn8=*+cuda11.6libcudnn8-dev=*+cuda11.6libcufft-dev-11-0libcurand-dev-11-0libcusolver-dev-11-6libcusparse-dev-11-6libnvinfer8=8.4.*+cuda11.6libnvinfer-dev=8.4.*+cuda11.6libnvonnxparsers8=8.4.*+cuda11.6libnvonnxparsers-dev=8.4.*+cuda11.6
运行以下命令:
env TF_CUDA_VERSION=11.6 \ bazel build //adlik_serving \ --config=TensorRT \ -c opt \ --action_env=LIBRARY_PATH=/usr/local/cuda-11.0/lib64/stubs \ --incompatible_use_specific_tool_files=false
使用 TF-TRT 运行时构建推理服务
假设使用 CUDA 11.0 版本进行构建。
-
cuda-cupti-dev-11-6libcublas-dev-11-6libcudnn8=*+cuda11.6libcudnn8-dev=*+cuda11.6libcufft-dev-11-6libcurand-dev-11-6libcusolver-dev-11-6libcusparse-dev-11-6libnvinfer8=8.4.*+cuda11.6libnvinfer-dev=8.4.*+cuda11.6libnvinfer-plugin8=8.4.*+cuda11.6libnvinfer-plugin-dev=8.4.*+cuda11.6
运行以下命令:
env TF_CUDA_VERSION=11.6 TF_NEED_TENSORRT=1 \ bazel build //adlik_serving \ --config=tensorflow-tensorrt \ -c opt \ --incompatible_use_specific_tool_files=false
使用 TVM 运行时构建推理服务
安装以下软件包:
build-essentialcmaketvm
运行以下命令:
bazel build //adlik_serving \ --config=tvm \ -c opt
在 Docker 中构建
可以使用 ci/docker/build.sh 文件构建一个包含所有 Adlik 构建所需依赖的 Docker 镜像。然后可以使用该 Docker 镜像来构建 Adlik。
注意:如果在 Docker 镜像中使用 GPU 构建运行时,需要在 Dockerfile 中添加 CUDA 环境变量,例如:
ENV NVIDIA_VISIBLE_DEVICES all ENV NVIDIA_DRIVER_CAPABILITIES compute, utility
发布版本
Adlik 支持的服务引擎版本如下:
| Enflame 2.0 | TensorFlow 2.10.1 | OpenVINO 2022.3.0 | TensorRT 8.4.3.1 | PaddlePaddle 2.4.0 | |
|---|---|---|---|---|---|
| Keras | ✓ | ✓ | ✓ | ✓ | ✗ |
| TensorFlow | ✓ | ✓ | ✓ | ✓ | ✗ |
| PyTorch | ✓ | ✗ | ✓ | ✓ | ✗ |
| PaddlePaddle | ✓ | ✗ | ✓ | ✓ | ✓ |
| OneFLow | ✓ | ✓ | ✓ | ✓ | ✗ |
| OpenVINO | ✗ | ✗ | ✓ | ✗ | ✗ |
许可证
Apache License 2.0
版本历史
v1.2.02023/12/27v1.1.02023/06/29v1.0.02022/12/20v0.5.02022/06/21v0.4.02021/12/02v0.3.02021/06/21v0.2.02020/11/20v0.1.02020/06/15相似工具推荐
openclaw
OpenClaw 是一款专为个人打造的本地化 AI 助手,旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚,能够直接接入你日常使用的各类通讯渠道,包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息,OpenClaw 都能即时响应,甚至支持在 macOS、iOS 和 Android 设备上进行语音交互,并提供实时的画布渲染功能供你操控。 这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地,用户无需依赖云端服务即可享受快速、私密的智能辅助,真正实现了“你的数据,你做主”。其独特的技术亮点在于强大的网关架构,将控制平面与核心助手分离,确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者,以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力(支持 macOS、Linux 及 Windows WSL2),即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你
stable-diffusion-webui
stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。
everything-claude-code
everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上
ComfyUI
ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。
markitdown
MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具,专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片(含 OCR)、音频(含语音转录)、HTML 乃至 YouTube 链接等多种格式的解析,能够精准提取文档中的标题、列表、表格和链接等关键结构信息。 在人工智能应用日益普及的今天,大语言模型(LLM)虽擅长处理文本,却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点,它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式,成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外,它还提供了 MCP(模型上下文协议)服务器,可无缝集成到 Claude Desktop 等 LLM 应用中。 这款工具特别适合开发者、数据科学家及 AI 研究人员使用,尤其是那些需要构建文档检索增强生成(RAG)系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性,但其核心优势在于为机器
LLMs-from-scratch
LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目,旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型(LLM)。它不仅是同名技术著作的官方代码库,更提供了一套完整的实践方案,涵盖模型开发、预训练及微调的全过程。 该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型,却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码,用户能够透彻掌握 Transformer 架构、注意力机制等关键原理,从而真正理解大模型是如何“思考”的。此外,项目还包含了加载大型预训练权重进行微调的代码,帮助用户将理论知识延伸至实际应用。 LLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API,而是渴望探究模型构建细节的技术人员而言,这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计:将复杂的系统工程拆解为清晰的步骤,配合详细的图表与示例,让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础,还是为未来研发更大规模的模型做准备

