ai-hub-models

969 166 简单 1 次阅读 3天前BSD-3-Clause插件开发框架

AI 解读由 AI 自动生成，仅供参考

ai-hub-models 是高通官方提供的一个开源模型库，汇集了各类前沿机器学习模型。这些模型经过专门优化，在延迟、内存占用等性能指标上表现卓越，旨在帮助开发者轻松将 AI 应用部署到高通芯片设备（如骁龙系列）上。

对于希望在移动端或边缘设备运行高性能 AI 的开发者而言，该工具解决了模型适配难、优化复杂以及跨平台部署门槛高的问题。用户无需从零开始调整模型结构，即可直接获取针对特定硬件优化的现成方案。

它特别适合嵌入式工程师、移动应用开发者以及 AI 研究人员使用。其核心亮点在于与"Qualcomm AI Hub Workbench"的深度集成：用户不仅能下载模型，还能通过云端服务直接在真实的高通设备上完成模型编译、量化、性能剖析及推理验证。这种“云 - 端”协同的工作流，让开发者在无需物理连接设备的情况下，也能高效完成从模型导出到端到端演示的全过程，极大提升了开发效率。

使用场景

某智能安防团队正致力于将最新的 YOLOv7 目标检测算法部署到基于高通芯片的无人机边缘设备上，以实现实时入侵检测。

没有 ai-hub-models 时

模型适配困难：开发者需手动修改开源 PyTorch 模型结构以兼容高通 NPU 架构，耗时数周且极易引入错误。
性能优化黑盒：缺乏针对特定芯片组（如 Snapdragon）的预调优参数，导致推理延迟高、内存占用大，难以满足实时性要求。
量化流程繁琐：自行实施模型量化（Quantization）需要深厚的专业知识，稍有不慎就会导致检测精度大幅下降。
真机验证门槛高：团队必须购买昂贵的开发板并进行复杂的本地环境配置，才能进行初步的性能剖析和测试。
端到端落地慢：从算法训练到最终在设备上画出检测框，需要自行编写大量前后处理代码，开发周期漫长。

使用 ai-hub-models 后

开箱即用：直接通过 pip 安装预优化的 YOLOv7 模型，自动适配高通硬件架构，无需手动修改网络结构。
极致性能释放：直接获取针对延迟和内存深度优化的模型版本，在无人机端实现流畅的高帧率推理。
自动化量化：利用内置工具一键完成模型量化，在显著减小模型体积的同时，自动平衡精度损失。
云端真机调试：借助 Qualcomm AI Hub Workbench，直接在云端连接真实高通设备进行编译、剖析和推理验证，零成本启动。
全流程演示闭环：调用自带的 CLI 演示脚本，自动完成图像预处理、推理及后处理绘图，几分钟内即可验证端到端效果。

ai-hub-models 通过将复杂的底层硬件适配与优化工作封装为简单的 API 调用，让开发者能专注于业务逻辑，将边缘 AI 应用的落地周期从数周缩短至数小时。

运行环境要求

操作系统

Linux
Windows
Android

GPU

非必需
支持在 CPU、GPU (FP32, FP16) 或 NPU/DSP 上运行
若使用本地 GPU 推理，需依赖 PyTorch 环境
若使用 Qualcomm AI Hub Workbench，则在云端设备运行，无需本地 GPU

内存

未说明

依赖

notes1. Windows 用户注意：Snapdragon X Elite/X2 Elite 平台仅支持 AMDx64 (64-bit) Python，使用 Windows ARM64 Python 会导致安装失败。 2. 核心功能（如模型编译、真机性能分析）需要配置 Qualcomm AI Hub Workbench API Token。 3. 部分模型（如 YOLOv7）需要额外安装特定依赖。 4. 该工具主要针对高通芯片（Snapdragon 系列、QCS 系列等）优化，支持通过云端连接真实高通设备进行测试。

python3.10 (推荐), 3.11, 3.12, 3.13

qai-hub-models

torch

numpy

qai-hub

快速开始

Qualcomm® AI Hub 模型

Qualcomm® AI Hub 模型是一系列针对 Qualcomm® 设备优化的最先进机器学习模型。

支持的内容请参见：设备端运行时、硬件目标与精度、芯片组、设备

设置

1. 安装 Python 包

该包可通过 pip 安装：

# 注意：对于 Snapdragon X Elite 和 Snapdragon X2 Elite 用户：
# Windows 上仅支持 AMDx64（64位）Python。
# 使用 Windows ARM64 Python 时安装将失败。

pip install qai_hub_models

部分模型（例如 YOLOv7）需要额外的依赖项。请查看模型的 README 文件（位于 qai_hub_models/models/model_id），以获取安装说明。

2. 配置 AI Hub Workbench 访问权限

AI Hub 模型的许多功能（如模型编译、设备端性能分析等）都需要访问 Qualcomm® AI Hub Workbench：

创建 Qualcomm® ID，并使用它登录 Qualcomm® AI Hub Workbench。
配置您的 API 令牌：qai-hub configure --api_token API_TOKEN

入门

导出并在物理设备上运行模型

我们目录中的所有模型（见 #model-directory）都可以在托管的 Qualcomm® 设备上进行编译和性能分析：

pip install "qai_hub_models[yolov7]"

python -m qai_hub_models.models.yolov7.export [--target-runtime ...] [--device ...] [--help]

通过 Qualcomm® AI Hub Workbench，导出脚本将执行以下操作：

编译模型，以适配所选设备和目标运行时（详情请参阅：在 AI Hub Workbench 上编译模型）。
如适用，量化模型（详情请参阅：在 AI Hub Workbench 上量化模型）。
在云端的真实设备上对编译后的模型进行性能分析（详情请参阅：在 AI Hub Workbench 上分析模型性能）。
使用示例输入数据在云端的真实设备上运行推理，并将设备端模型输出与 PyTorch 输出进行比较（详情请参阅：在 AI Hub Workbench 上运行推理）。
将编译后的模型下载到本地磁盘。

端到端模型演示

我们目录中的大多数模型都包含 CLI 演示，可完整运行模型：

pip install "qai_hub_models[yolov7]"
# 对提供的图像进行预测并绘制边界框
python -m qai_hub_models.models.yolov7.demo [--image ...] [--eval-mode {fp,on-device}] [--help]

端到端演示包括：

将人类可读的输入 预处理 为模型输入。
运行 模型推理。
将模型输出 后处理 为人类可读的格式。

许多端到端演示会使用 AI Hub Workbench 在真实的云端设备上运行推理（通过 --eval-mode on-device）。所有端到端演示也可以通过 PyTorch 在本地运行（通过 --eval-mode fp）。

示例应用

可在物理设备上运行我们模型（并进行预处理和后处理）的原生应用程序已发布在 AI Hub Apps 仓库中。

针对所有模型定义了 Python 应用程序（从 qai_hub_models.models.<model_name> 导入 App）（参见：qai_hub_models/models/yolov7/app.py）。这些应用程序将模型推理封装在使用 torch 和 numpy 编写的预处理和后处理步骤中。这些应用程序旨在作为易于理解的示例，而非追求最小化推理时间。

模型支持数据

设备端运行时

运行时	支持的操作系统
Qualcomm AI Engine Direct	Android、Linux、Windows
LiteRT (TensorFlow Lite)	Android、Linux
ONNX	Android、Linux、Windows

设备硬件与精度

设备计算单元	支持的精度
CPU	FP32、INT16、INT8
GPU	FP32、FP16
NPU（包括 Hexagon DSP、HTP）	FP16*、INT16、INT8

*部分较旧的芯片组不支持在其 NPU 上进行 fp16 推理。

芯片组

Snapdragon 8 Elite Gen 5、8 Elite、8 Gen 3、8 Gen 2 以及 8 Gen 1 移动平台
Snapdragon X2 Elite、Snapdragon X Elite 计算平台
SA7255P、SA8295P 和 SA8775P 汽车平台
QCS 6490、QCS 8250、QCS 9075 以及 QCS 8550 物联网平台
QCS8450 XR 平台

以及其他更多型号。

设备

三星 Galaxy S21、S22、S23、S24 和 S25 系列
小米 12、13、15 和 17
骁龙 X Elite CRD 和骁龙 X2 Elite CRD（计算参考设备）
高通 RB3 第二代、RB5 第二代、IQ-8、IQ-9

以及更多。

模型目录

计算机视觉

模型	说明文档

图像分类
Beit	qai_hub_models.models.beit
ConvNext-Base	qai_hub_models.models.convnext_base
ConvNext-Tiny	qai_hub_models.models.convnext_tiny
DLA-102-X	qai_hub_models.models.dla102x
DenseNet-121	qai_hub_models.models.densenet121
EfficientFormer	qai_hub_models.models.efficientformer
EfficientNet-B0	qai_hub_models.models.efficientnet_b0
EfficientNet-B4	qai_hub_models.models.efficientnet_b4
EfficientNet-V2-s	qai_hub_models.models.efficientnet_v2_s
EfficientViT-b2-cls	qai_hub_models.models.efficientvit_b2_cls
EfficientViT-l2-cls	qai_hub_models.models.efficientvit_l2_cls
GPUNet	qai_hub_models.models.gpunet
GoogLeNet	qai_hub_models.models.googlenet
Inception-v3	qai_hub_models.models.inception_v3
InternImage	qai_hub_models.models.internimage
LeViT	qai_hub_models.models.levit
MNASNet05	qai_hub_models.models.mnasnet05
Mobile-VIT	qai_hub_models.models.mobile_vit
MobileNet-v2	qai_hub_models.models.mobilenet_v2
MobileNet-v3-Large	qai_hub_models.models.mobilenet_v3_large
MobileNet-v3-Small	qai_hub_models.models.mobilenet_v3_small
NASNet	qai_hub_models.models.nasnet
RegNet	qai_hub_models.models.regnet
RegNet-Y-800MF	qai_hub_models.models.regnet_y_800mf
ResNeXt101	qai_hub_models.models.resnext101
ResNeXt50	qai_hub_models.models.resnext50
ResNet101	qai_hub_models.models.resnet101
ResNet18	qai_hub_models.models.resnet18
ResNet50	qai_hub_models.models.resnet50
Sequencer2D	qai_hub_models.models.sequencer2d
Shufflenet-v2	qai_hub_models.models.shufflenet_v2
SqueezeNet-1.1	qai_hub_models.models.squeezenet1_1
VIT	qai_hub_models.models.vit
WideResNet50	qai_hub_models.models.wideresnet50

图像编辑
AOT-GAN	qai_hub_models.models.aotgan
DDColor	qai_hub_models.models.ddcolor
LaMa-Dilated	qai_hub_models.models.lama_dilated

超分辨率
ESRGAN	qai_hub_models.models.esrgan
QuickSRNetLarge	qai_hub_models.models.quicksrnetlarge
QuickSRNetMedium	qai_hub_models.models.quicksrnetmedium
QuickSRNetSmall	qai_hub_models.models.quicksrnetsmall
Real-ESRGAN-General-x4v3	qai_hub_models.models.real_esrgan_general_x4v3
Real-ESRGAN-x4plus	qai_hub_models.models.real_esrgan_x4plus
SESR-M5	qai_hub_models.models.sesr_m5
XLSR	qai_hub_models.models.xlsr

语义分割
DDRNet23-Slim	qai_hub_models.models.ddrnet23_slim
DeepLabV3-Plus-MobileNet	qai_hub_models.models.deeplabv3_plus_mobilenet
DeepLabXception	qai_hub_models.models.deeplab_xception
EdgeTAM	qai_hub_models.models.edgetam
FCN-ResNet50	qai_hub_models.models.fcn_resnet50
FFNet-122NS-LowRes	qai_hub_models.models.ffnet_122ns_lowres
FFNet-40S	qai_hub_models.models.ffnet_40s
FFNet-54S	qai_hub_models.models.ffnet_54s
FFNet-78S	qai_hub_models.models.ffnet_78s
FFNet-78S-LowRes	qai_hub_models.models.ffnet_78s_lowres
FastSam-S	qai_hub_models.models.fastsam_s
FastSam-X	qai_hub_models.models.fastsam_x
HRNet-W48-OCR	qai_hub_models.models.hrnet_w48_ocr
MaskRCNN	qai_hub_models.models.maskrcnn
MediaPipe-Selfie-Segmentation	qai_hub_models.models.mediapipe_selfie
MobileSam	qai_hub_models.models.mobilesam
PSPNet	qai_hub_models.models.pspnet
PidNet	qai_hub_models.models.pidnet
PointNet	qai_hub_models.models.pointnet
SINet	qai_hub_models.models.sinet
SalsaNext	qai_hub_models.models.salsanext
Segformer-Base	qai_hub_models.models.segformer_base
Segment-Anything-Model-2	qai_hub_models.models.sam2
Unet-Segmentation	qai_hub_models.models.unet_segmentation
YOLOv11-Segmentation	qai_hub_models.models.yolov11_seg
YOLOv8-Segmentation	qai_hub_models.models.yolov8_seg

视频分类
ResNet-2Plus1D	qai_hub_models.models.resnet_2plus1d
ResNet-3D	qai_hub_models.models.resnet_3d
ResNet-Mixed-Convolution	qai_hub_models.models.resnet_mixed
Video-MAE	qai_hub_models.models.video_mae

视频生成
First-Order-Motion-Model	qai_hub_models.models.fomm

视频目标跟踪
Track-Anything	qai_hub_models.models.track_anything

目标检测
3D-Deep-BOX	qai_hub_models.models.deepbox
CavaFace	qai_hub_models.models.cavaface
CenterNet-2D	qai_hub_models.models.centernet_2d
Conditional-DETR-ResNet50	qai_hub_models.models.conditional_detr_resnet50
DETR-ResNet101	qai_hub_models.models.detr_resnet101
DETR-ResNet101-DC5	qai_hub_models.models.detr_resnet101_dc5
DETR-ResNet50	qai_hub_models.models.detr_resnet50
DETR-ResNet50-DC5	qai_hub_models.models.detr_resnet50_dc5
Detectron2-Detection	qai_hub_models.models.detectron2_detection
Facial-Attribute-Detection	qai_hub_models.models.face_attrib_net
HRNetFace	qai_hub_models.models.hrnet_face
Lightweight-Face-Detection	qai_hub_models.models.face_det_lite
MediaPipe-Face-Detection	qai_hub_models.models.mediapipe_face
MediaPipe-Hand-Detection	qai_hub_models.models.mediapipe_hand
MediaPipe-Hand-Gesture-Recognition	qai_hub_models.models.mediapipe_hand_gesture
PPE-Detection	qai_hub_models.models.gear_guard_net
Person-Foot-Detection	qai_hub_models.models.foot_track_net
RTMDet	qai_hub_models.models.rtmdet
YOLOv10-Detection	qai_hub_models.models.yolov10_det
YOLOv11-Detection	qai_hub_models.models.yolov11_det
YOLOv8-Detection	qai_hub_models.models.yolov8_det
Yolo-R	qai_hub_models.models.yolor
Yolo-X	qai_hub_models.models.yolox
Yolo-v3	qai_hub_models.models.yolov3
Yolo-v5	qai_hub_models.models.yolov5
Yolo-v6	qai_hub_models.models.yolov6
Yolo-v7	qai_hub_models.models.yolov7

姿态估计
CenterNet-Pose	qai_hub_models.models.centernet_pose
Facial-Landmark-Detection	qai_hub_models.models.facemap_3dmm
HRNetPose	qai_hub_models.models.hrnet_pose
LiteHRNet	qai_hub_models.models.litehrnet
MediaPipe-Pose-Estimation	qai_hub_models.models.mediapipe_pose
Posenet-Mobilenet	qai_hub_models.models.posenet_mobilenet
RTMPose-Body2d	qai_hub_models.models.rtmpose_body2d

视线估计
EyeGaze	qai_hub_models.models.eyegaze

深度估计
Depth-Anything	qai_hub_models.models.depth_anything
Depth-Anything-V2	qai_hub_models.models.depth_anything_v2
Depth-Anything-V3	qai_hub_models.models.depth_anything_v3
Midas-V2	qai_hub_models.models.midas
StereoNet	qai_hub_models.models.stereonet

驾驶辅助
BEVDet	qai_hub_models.models.bevdet
BEVFusion	qai_hub_models.models.bevfusion_det
CVT	qai_hub_models.models.cvt
CenterNet-3D	qai_hub_models.models.centernet_3d
CenterPoint	qai_hub_models.models.centerpoint
GKT	qai_hub_models.models.gkt
StateTransformer	qai_hub_models.models.statetransformer

机器人技术
ACT	qai_hub_models.models.act

多模态

模型	说明文档

EasyOCR	qai_hub_models.models.easyocr
Nomic-Embed-Text	qai_hub_models.models.nomic_embed_text
OpenAI-Clip	qai_hub_models.models.openai_clip
OpusMT-En-Es	qai_hub_models.models.opus_mt_en_es
OpusMT-En-Zh	qai_hub_models.models.opus_mt_en_zh
OpusMT-Es-En	qai_hub_models.models.opus_mt_es_en
OpusMT-Zh-En	qai_hub_models.models.opus_mt_zh_en
TrOCR	qai_hub_models.models.trocr

音频

模型	说明文档

语音识别
HuggingFace-WavLM-Base-Plus	qai_hub_models.models.huggingface_wavlm_base_plus
Whisper-Base	qai_hub_models.models.whisper_base
Whisper-Large-V3-Turbo	qai_hub_models.models.whisper_large_v3_turbo
Whisper-Small	qai_hub_models.models.whisper_small
Whisper-Small-Quantized	qai_hub_models.models.whisper_small_quantized
Whisper-Tiny	qai_hub_models.models.whisper_tiny
Zipformer	qai_hub_models.models.zipformer

音频分类
YamNet	qai_hub_models.models.yamnet

音频生成
MeloTTS-EN	qai_hub_models.models.melotts_en
MeloTTS-ES	qai_hub_models.models.melotts_es
MeloTTS-ZH	qai_hub_models.models.melotts_zh

生成式人工智能

模型	说明文档

图像生成
ControlNet-Canny	qai_hub_models.models.controlnet_canny
Stable-Diffusion-v1.5	qai_hub_models.models.stable_diffusion_v1_5
Stable-Diffusion-v2.1	qai_hub_models.models.stable_diffusion_v2_1

文本生成
Albert-Base-V2-Hf	qai_hub_models.models.albert_base_v2_hf
Baichuan2-7B	qai_hub_models.models.baichuan2_7b
Bert-Base-Uncased-Hf	qai_hub_models.models.bert_base_uncased_hf
Distil-Bert-Base-Uncased-Hf	qai_hub_models.models.distil_bert_base_uncased_hf
Electra-Bert-Base-Discrim-Google	qai_hub_models.models.electra_bert_base_discrim_google
Falcon3-7B-Instruct	qai_hub_models.models.falcon_v3_7b_instruct
IBM-Granite-v3.1-8B-Instruct	qai_hub_models.models.ibm_granite_v3_1_8b_instruct
IndusQ-1.1B	qai_hub_models.models.indus_1b
JAIS-6p7b-Chat	qai_hub_models.models.jais_6p7b_chat
Llama-SEA-LION-v3.5-8B-R	qai_hub_models.models.llama_v3_1_sea_lion_3_5_8b_r
Llama-v2-7B-Chat	qai_hub_models.models.llama_v2_7b_chat
Llama-v3-8B-Instruct	qai_hub_models.models.llama_v3_8b_instruct
Llama-v3-ELYZA-JP-8B	qai_hub_models.models.llama_v3_elyza_jp_8b
Llama-v3.1-8B-Instruct	qai_hub_models.models.llama_v3_1_8b_instruct
Llama-v3.2-1B-Instruct	qai_hub_models.models.llama_v3_2_1b_instruct
Llama-v3.2-3B-Instruct	qai_hub_models.models.llama_v3_2_3b_instruct
Llama-v3.2-3B-Instruct-SSD	qai_hub_models.models.llama_v3_2_3b_instruct_ssd
Llama3-TAIDE-LX-8B-Chat-Alpha1	qai_hub_models.models.llama_v3_taide_8b_chat
Mistral-7B-Instruct-v0.3	qai_hub_models.models.mistral_7b_instruct_v0_3
Mobile-Bert-Uncased-Google	qai_hub_models.models.mobile_bert_uncased_google
PLaMo-1B	qai_hub_models.models.plamo_1b
Phi-3.5-Mini-Instruct	qai_hub_models.models.phi_3_5_mini_instruct
Qwen2-7B-Instruct	qai_hub_models.models.qwen2_7b_instruct
Qwen2.5-7B-Instruct	qai_hub_models.models.qwen2_5_7b_instruct
Qwen3-4B	qai_hub_models.models.qwen3_4b

需要帮助吗？

Slack：https://aihub.qualcomm.com/community/slack

GitHub Issues：https://github.com/qualcomm/ai-hub-models/issues

电子邮件：ai-hub-support@qti.qualcomm.com。

许可证

Qualcomm® AI Hub Models 根据 BSD-3 许可证授权。请参阅 LICENSE 文件。

Qualcomm AI Hub Models 快速上手指南

Qualcomm® AI Hub Models 是一套专为高通设备优化的最先进机器学习模型集合。本指南将帮助开发者快速完成环境配置、安装及模型部署。

1. 环境准备

在开始之前，请确保您的开发环境满足以下要求：

操作系统：Windows (AMD64), Linux, 或 macOS。
- ⚠️ 注意：Snapdragon X Elite/X2 Elite 用户在 Windows 上仅支持 AMD64 (64 位) Python。使用 Windows ARM64 Python 会导致安装失败。
Python 版本：推荐 Python 3.10，同时也支持 3.11, 3.12, 3.13。
高通账号：部分高级功能（如模型编译、真机性能分析）需要访问 Qualcomm® AI Hub Workbench。
- 需注册 Qualcomm® ID。
- 需登录 AI Hub Workbench 获取 API Token。

2. 安装步骤

安装核心包

使用 pip 安装基础库：

pip install qai_hub_models

💡 国内加速建议：如果遇到下载速度慢的问题，建议使用国内镜像源：
pip install qai_hub_models -i https://pypi.tuna.tsinghua.edu.cn/simple

安装特定模型依赖

部分模型（如 YOLOv7）需要额外的依赖项。请使用以下格式安装：

pip install "qai_hub_models[yolov7]"

(将 yolov7 替换为您所需的具体模型名称)

配置 AI Hub 访问权限

若需使用云端编译或真机分析功能，请配置 API Token：

登录 AI Hub Workbench Account 页面复制您的 Token。
在终端执行：

qai-hub configure --api_token YOUR_API_TOKEN_HERE

3. 基本使用

场景一：导出并分析模型（云端真机）

此命令会将模型编译、量化（如适用），并在云端的高通设备上运行性能分析和推理测试。

以 YOLOv7 为例：

python -m qai_hub_models.models.yolov7.export [--target-runtime ...] [--device ...] [--help]

执行流程：

编译：针对指定设备和运行时进行编译。
量化：自动应用量化策略（如适用）。
分析 (Profile)：在云端真实设备上测量性能数据。
推理验证：使用样本数据运行推理，并对比 PyTorch 输出与端侧输出。
下载：将编译好的模型文件保存到本地磁盘。

场景二：端到端演示 (Demo)

运行完整的演示脚本，包含预处理、推理和后处理。支持本地 PyTorch 运行或云端真机运行。

# 预测并在图片上绘制边界框
python -m qai_hub_models.models.yolov7.demo [--image path/to/image.jpg] [--eval-mode {fp,on-device}] [--help]

参数说明：

--eval-mode fp：在本地使用 PyTorch 浮点运算运行（无需云端连接）。
--eval-mode on-device：通过 AI Hub Workbench 在云端真实高通设备上运行推理。

场景三：在代码中调用

您可以直接在 Python 代码中导入模型应用逻辑（包含预处理和后处理）：

from qai_hub_models.models.yolov7.app import App

# 初始化应用
app = App()

# 运行推理 (具体方法请参考各模型对应的 app.py 实现)
# 注意：示例应用旨在展示流程，而非极致优化推理速度

更多模型列表及详细文档请访问 Qualcomm AI Hub Models 仓库或 AI Hub 官网。

版本历史

v0.49.12026/03/24

v0.48.02026/03/12

v0.47.02026/02/25

v0.46.12026/02/13

v0.45.02026/01/28

v0.44.02026/01/13

v0.43.02025/12/16

v0.42.02025/12/02

v0.41.22025/11/22

v0.41.12025/11/17

v0.41.02025/11/12

v0.40.12025/10/30

v0.39.12025/10/15

v0.38.02025/10/01

v0.37.12025/09/17

v0.37.02025/09/16

v0.36.02025/08/28

v0.35.02025/08/26

v0.34.12025/08/15

v0.33.02025/08/01

常见问题

如何在 Android 或 Windows 设备上运行导出的 Llama 模型文件（如 .onnx, .bin）？

在 Ubuntu 上运行时遇到 'ModuleNotFoundError: No module named libPyIrGraph' 错误怎么办？

在 Windows 上运行 Llama 3 模型时命令执行无输出或无响应，如何解决？

如何将 YOLO 模型转换用于 Rubik Pi 3 时遇到的报错？

如何在 Galaxy S24 等 Android 手机上运行 Llama 模型的 QNN Context Binary？

在哪里可以找到更多资源或社区支持以构建基于 Genie API 的 Android LLM 应用？

相似工具推荐

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|今天

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 139k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 107.7k|★★☆☆☆|2天前

开发框架图像Agent

NextChat

NextChat 是一款轻量且极速的 AI 助手，旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性，以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发，NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言，它也提供了便捷的自托管方案，支持一键部署到 Vercel 或 Zeabur 等平台。 NextChat 的核心亮点在于其广泛的模型兼容性，原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型，让用户在一个界面即可自由切换不同 AI 能力。此外，它还率先支持 MCP（Model Context Protocol）协议，增强了上下文处理能力。针对企业用户，NextChat 提供专业版解决方案，具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能，满足公司对数据隐私和个性化管理的高标准要求。

★ 87.6k|★★☆☆☆|今天

开发框架语言模型

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。

★ 85k|★★☆☆☆|今天

图像数据工具视频

ragflow

RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。

★ 77.1k|★★★☆☆|昨天

Agent图像开发框架