RTNeural

805 83 中等 3 次阅读 3天前BSD-3-Clause开发框架音频

AI 解读由 AI 自动生成，仅供参考

RTNeural 是一个专为实时系统设计的轻量级神经网络推理引擎，采用 C++ 编写，特别优化了音频处理等对延迟敏感的场景。它允许开发者将训练好的神经网络模型（如 TensorFlow 或 PyTorch 训练的模型）快速转换为高效的 C++ 代码，直接部署到资源受限的嵌入式设备或实时应用中。

传统深度学习框架在部署到边缘设备时常面临计算资源占用高、延迟大等问题，而 RTNeural 通过精简计算流程和内存管理，显著降低了推理开销。其支持常见网络结构（如 LSTM、GRU、卷积层）和主流激活函数（如 ReLU、SoftMax），并提供从 Python 框架导出模型权重的工具链，使模型迁移更便捷。对于需要毫秒级响应的音频处理、机器人控制或物联网设备，RTNeural 提供了高效的解决方案。

开发者（尤其是嵌入式系统工程师）和研究人员（如实时信号处理领域）是其主要适用人群。其技术亮点包括：跨平台兼容性（支持多种编译器）、低内存占用（部分模型仅需几 KB 内存），以及通过 SIMD 指令加速计算的能力。开源社区提供详细文档和示例代码，用户可通过 JSON 格式导入模型参数，快速构建推理流程。对于学术研究，项目还提供基准测试对比和扩展实验模块，方便性能验证与功能迭代。

使用场景

音频插件开发团队正在为数字音频工作站（DAW）开发一款基于深度学习的实时语音变声插件，要求处理延迟低于5ms并适配Windows/Linux/macOS三平台。

没有 RTNeural 时

模型移植困难：PyTorch训练的GRU模型需手动转换为C++代码，参数初始化和张量运算需重复实现，耗时2周且易出错
性能瓶颈明显：使用通用推理框架（如TensorFlow Lite）时，单次推理耗时达12ms，无法满足实时音频处理需求
内存占用过高：在嵌入式音频接口设备上运行时，内存峰值超过128MB，超出硬件限制
跨平台调试复杂：不同操作系统下的浮点数精度差异导致音频输出出现可闻的爆裂声

使用 RTNeural 后

自动模型转换：通过Python工具链一键导出JSON权重文件，C++端自动解析生成优化后的计算图，开发周期缩短至2天
延迟显著降低：经SIMD指令优化的GRU层实现3.2ms/帧推理速度，满足5ms硬实时要求
内存占用优化：静态内存分配策略将峰值内存控制在18MB，适配USB音频接口的嵌入式环境
跨平台一致性：内置的数值稳定性处理消除系统差异，确保Mac和Linux设备输出音频波形完全一致

核心价值：RTNeural通过专为实时系统设计的轻量化C++引擎，解决了深度学习音频处理中模型移植效率低、推理延迟高、资源占用大等关键痛点，使开发者能将训练好的模型快速部署到对时延敏感的实时音频场景。

运行环境要求

操作系统

未说明

GPU

未说明

内存

未说明

依赖

notes需通过CMake构建项目，支持Eigen/xsimd后端加速；导出模型权重需Python环境并安装TensorFlow或PyTorch

python未说明

Eigen

xsimd

CMake

快速开始

RTNeural

一个用 C++ 编写的轻量级神经网络推理引擎（neural network inferencing engine）。该库专为实时系统（real-time systems）设计，特别适用于实时音频处理（real-time audio processing）。

当前支持的网络层（layers）：

Dense（全连接层）
GRU（门控循环单元）
LSTM（长短期记忆网络）
Conv1D（一维卷积层）
Conv2D（二维卷积层）
MaxPooling（最大池化层）
BatchNorm1D（一维批量归一化）
BatchNorm2D（二维批量归一化）

当前支持的激活函数（activations）：

tanh
ReLU
Sigmoid
SoftMax
ELu
PReLU

附加资源：

引用

如果您在学术工作中使用 RTNeural，请按以下方式引用：

@article{chowdhury2021rtneural,
        title={RTNeural: Fast Neural Inferencing for Real-Time Systems},
        author={Jatin Chowdhury},
        year={2021},
        journal={arXiv preprint arXiv:2106.03037}
}

使用方法

RTNeural 可以加载已训练好的神经网络权重并运行推理。简单示例请参见 examples/ 目录。

从训练好的网络导出权重

神经网络通常使用 Python 库（如 Tensorflow 或 PyTorch）进行训练。训练完成后，可以将网络权重导出为 json 文件供 RTNeural 读取。Tensorflow 顺序模型的导出示例在 python/model_utils.py 中实现，使用方法如下：

# 导入依赖
import tensorflow as tf
from tensorflow import keras
from model_utils import save_model

# 创建 Tensorflow 模型
model = keras.Sequential()
...

# 训练模型
model.train()

# 导出模型权重
save_model(model, 'model_weights.json')

PyTorch 模型导出示例请参见此示例脚本。

创建模型

接下来，可以从导出的 json 文件中创建 C++ 推理引擎：

#include <RTNeural.h>
...
std::ifstream jsonStream("model_weights.json", std::ifstream::binary);
auto model = RTNeural::json_parser::parseJson<double>(jsonStream);

运行推理

运行推理前建议重置模型状态（如果模型有状态）：

model->reset();

然后运行推理：

double input[] = { 1.0, 0.5, -0.1 }; // 设置输入向量
double output = model->forward(input); // 计算输出

编译时 API

上述代码会在运行时动态创建推理引擎。如果模型架构在编译时固定，可以使用 RTNeural 的编译时 API 定义推理引擎类型，这能显著提升性能：

// 定义模型类型
RTNeural::ModelT<double, 8, 1,
    RTNeural::DenseT<double, 8, 8>,
    RTNeural::TanhActivationT<double, 8>,
    RTNeural::DenseT<double, 8, 1>
> modelT;

// 从 json 加载模型权重
std::ifstream jsonStream("model_weights.json", std::ifstream::binary);
modelT.parseJson(jsonStream);

modelT.reset(); // 重置状态

double input[] = { 1.0, 0.5, -0.1, 0.0, 0.4, 0.9, -0.2, -0.3 }; // 设置输入向量
double output = modelT.forward(input); // 计算输出

从 PyTorch 加载层

上述示例假设模型已从 TensorFlow 导出。对于 PyTorch 模型，RTNeural 的命名空间 RTNeural::torch_helpers 提供了加载 PyTorch 导出层的辅助函数。

// 从 json 加载模型权重
std::ifstream jsonStream("model_weights.json", std::ifstream::binary);
nlohmann::json modelJson;
jsonStream >> modelJson;

// 从静态模型加载层
RTNeural::ModelT<float, 1, 1, RTNeural::DenseT<float, 1, 1>> model;
RTNeural::torch_helpers::loadDense(modelJson, "name_of_layer.", model.get<0>());

更多示例请参见 examples/torch 目录。

使用 CMake 构建

RTNeural 使用 CMake 构建，最简单的链接方式是将其作为子模块包含：

...
add_subdirectory(RTNeural)
target_link_libraries(MyCMakeProject LINK_PUBLIC RTNeural)

如果项目未使用 CMake，请参见下方的非 CMake 构建说明。

选择后端（Backend）

RTNeural 支持三种后端：

Eigen（一个 C++ 线性代数库）
xsimd（SIMD 向量化库）
C++ STL

通过传递 -DRTNEURAL_EIGEN=ON、-DRTNEURAL_XSIMD=ON 或 -DRTNEURAL_STL=ON 到 CMake 配置中选择后端。默认使用 Eigen 后端。也可以在 CMake 配置中这样选择：

set(RTNEURAL_XSIMD ON CACHE BOOL "Use RTNeural with this backend" FORCE)
add_subdirectory(modules/RTNeural)

一般来说，Eigen 后端在大型网络中性能最佳，小型网络可能 XSIMD 表现更好。建议在目标平台上测试所有可用后端以获得最佳性能。更多信息请参见基准测试结果。

请注意您选择的后端库的许可协议要求。

其他配置选项

如果你希望使用 AVX SIMD 扩展（Advanced Vector Extensions 单指令多数据扩展）构建 RTNeural，
可以通过 -DRTNEURAL_USE_AVX=ON 参数运行 CMake。请注意，
当编译目标平台不支持 AVX 指令时，此选项将无效。

构建测试套件

要构建 RTNeural 的测试套件，请运行 cmake -Bbuild -DBUILD_TESTS=ON，然后
执行 cmake --build build。要在 build 文件夹中运行完整测试套件，请运行 ctest。
更多信息请参见 tests/README.md。

构建性能基准测试

要构建性能基准测试，请运行
cmake -Bbuild -DBUILD_BENCH=ON，然后
执行 cmake --build build --config Release。要运行图层基准测试，请运行
./build/rtneural_layer_bench <layer> <length> <in_size> <out_size>。要
运行模型基准测试，请运行 ./build/rtneural_model_bench。

构建示例

要构建 RTNeural 示例，请运行：

cmake -Bbuild -DBUILD_EXAMPLES=ON
cmake --build build --config Release

示例程序将位于 build/examples_out/ 目录中，可从此处运行。

一个在实时音频插件中使用 RTNeural 的示例可在 GitHub
此处找到。

不使用 CMake 构建

如果希望在非 CMake 项目中使用 RTNeural，
可以将其作为头文件库包含，并配合以下步骤：

添加编译时定义以设置 RTNeural 的默认字节对齐方式。
大多数情况下，定义应为以下之一：
- RTNEURAL_DEFAULT_ALIGNMENT=16
- RTNEURAL_DEFAULT_ALIGNMENT=32
添加编译时定义以选择后端。
如果使用 STL 后端，则无需定义。定义应为以下之一：
- RTNEURAL_USE_EIGEN=1
- RTNEURAL_USE_XSIMD=1
添加所选后端的必要包含路径。路径应为以下之一：
- <repo>/modules/Eigen
- <repo>/modules/xsimd/include/xsimd

也可以参考
示例 Makefile。

贡献

欢迎为本项目做出贡献！
当前需要以下改进：

改进对二维输入/输出数据的支持。
改进无状态 Conv1D（一维卷积层）的支持。
更健壮的模型导出/加载支持。
增加更多激活层支持。
任何提升整体性能的修改。

代码维护和文档完善同样重要！请注意，如果实现新图层类型，
无需为所有后端提供支持，但建议至少提供一个使用 STL
后端的"回退"实现。

贡献者

感谢以下人员的重要贡献：

wayne-chen: Softmax 激活层和通用 API 改进。
hollance: RTNeural 标志。
stepanmk: Eigen Conv1D 层优化。
DamRsn: Conv2D 和 BatchNorm2D 层的 Eigen 实现。
lHorvalds: Eigen 后端优化。
davidtrevelyan: 测试框架升级。
purefunctor: Conv1D 的 Groups 功能。

使用 RTNeural 的项目

RTNeural 目前被多个音频插件和其他项目使用：

4000DB-NeuralAmp: 对 Akai 4000DB 磁带机前置放大器部分的神经模拟。
AIDA-X: 支持 AU/CLAP/LV2/VST2/VST3 的音频插件，可加载 RTNeural 模型和音箱 IR。
BYOD: 含多个机器学习效果的吉他失真插件。
Chow Centaur: 使用实时循环神经网络的吉他效果器模拟插件。
Chow Tape Model: 使用实时密集神经网络的模拟磁带模拟。
cppTimbreID: 音频特征提取库。
guitarix: 包含神经网络放大器模型的吉他效果套件。
GuitarML: 使用机器学习模拟吉他放大器和效果的插件。
MLTerror15: 使用循环神经网络深度学习的 Orange Tiny Terror 模拟器。
neural-amp-modeler-lv2: 用于神经网络机器学习放大器模型的 LV2 插件。
NeuralNote: 使用 Spotify 的 basic-pitch 模型的音频转 MIDI 插件。
rt-neural-lv2: 使用 RTNeural 模拟吉他效果器和放大器的无界面 LV2 插件。
stompbox: 吉他放大和效果踏板模拟。
Tone Empire 插件:
- LVL - 01: 基于 AI/ML 的压缩效果器。
- TM700: 机器学习磁带模拟效果。
- Neural Q: 使用循环神经网络的模拟双频段均衡器。
ToobAmp: 适用于 Raspberry Pi 的吉他效果插件。

如果你的项目使用了 RTNeural，请告知我们，我们将将其添加到此列表！

许可证

RTNeural 是开源软件，采用
三条款 BSD 许可证（BSD 3-clause license）。

祝使用愉快！

RTNeural 快速上手指南

环境准备

系统要求：Linux/macOS/Windows（支持C++17编译器）
前置依赖：
- CMake 3.14+
- C++编译器（推荐GCC 9+/Clang 10+/MSVC 2019）
- 可选依赖（根据后端选择）：
  - Eigen 3.4+（默认后端）
  - xsimd 8.0+（SIMD加速后端）

安装步骤

克隆项目仓库

git clone https://github.com/jatinchowdhury18/RTNeural.git
cd RTNeural

构建项目（推荐使用CMake）

mkdir build && cd build
cmake .. -DRTNEURAL_EIGEN=ON  # 使用Eigen后端（默认）
cmake --build . --config Release

作为子模块集成到项目

# CMakeLists.txt配置示例
add_subdirectory(RTNeural)
target_link_libraries(your_project PRIVATE RTNeural)

基本使用

1. 导出模型权重（Python）

# 示例：TensorFlow模型导出
from model_utils import save_model

model = keras.Sequential([
    keras.layers.Dense(8, input_shape=(3,)),
    keras.layers.Tanh(),
    keras.layers.Dense(1)
])
model.train()  # 训练模型
save_model(model, 'model_weights.json')  # 导出权重

2. C++推理实现

#include <RTNeural.h>

int main() {
    // 动态加载模型
    std::ifstream jsonStream("model_weights.json", std::ifstream::binary);
    auto model = RTNeural::json_parser::parseJson<double>(jsonStream);
    
    model->reset();  // 重置状态
    
    double input[] = {1.0, 0.5, -0.1};
    double output = model->forward(input);  // 执行推理
    
    return 0;
}

3. 编译时优化（固定模型结构）

// 定义固定结构模型
RTNeural::ModelT<double, 8, 1,
    RTNeural::DenseT<double, 8, 8>,
    RTNeural::TanhActivationT<double, 8>,
    RTNeural::DenseT<double, 8, 1>
> modelT;

// 加载权重
std::ifstream jsonStream("model_weights.json", std::ifstream::binary);
modelT.parseJson(jsonStream);
modelT.reset();

double input[] = { /* 8个输入值 */ };
double output = modelT.forward(input);

4. 后端选择建议

Eigen：适合大网络（默认）
xsimd：适合小网络（SIMD加速）
STL：通用兼容模式

# 示例：强制使用xsimd后端
set(RTNEURAL_XSIMD ON CACHE BOOL "Use XSIMD backend" FORCE)
add_subdirectory(RTNeural)

⚠️ 注意：使用AVX指令集需添加 -DRTNEURAL_USE_AVX=ON（仅限支持AVX的平台）

常见问题

如何获取模型的数组输出？

如何将 PyTorch 模型的 `state_dict` 转换为 RTNeural 支持的 JSON 格式？

如何为 RTNeural 的 Conv1D 层设置 strides 参数？

如何支持 NAM 文件格式的模型？

如何在 RTNeural 中实现非顺序结构的复杂模型（如 ResNet/DenseNet）？

RTNeural 与 NAM 在性能上的差异如何？

相似工具推荐

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|今天

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 139k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 107.7k|★★☆☆☆|2天前

开发框架图像Agent

NextChat

NextChat 是一款轻量且极速的 AI 助手，旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性，以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发，NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言，它也提供了便捷的自托管方案，支持一键部署到 Vercel 或 Zeabur 等平台。 NextChat 的核心亮点在于其广泛的模型兼容性，原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型，让用户在一个界面即可自由切换不同 AI 能力。此外，它还率先支持 MCP（Model Context Protocol）协议，增强了上下文处理能力。针对企业用户，NextChat 提供专业版解决方案，具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能，满足公司对数据隐私和个性化管理的高标准要求。

★ 87.6k|★★☆☆☆|今天

开发框架语言模型

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。

★ 85k|★★☆☆☆|今天

图像数据工具视频

ragflow

RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。

★ 77.1k|★★★☆☆|昨天

Agent图像开发框架