Bender

1.8k 89 较难 1 次阅读 2周前MIT开发框架

AI 解读由 AI 自动生成，仅供参考

Bender 是一款专为 iOS 开发者打造的开源框架，旨在让在苹果移动设备上运行神经网络变得简单高效。它基于 Apple 的 MetalPerformanceShaders 构建了一层优雅的抽象接口，底层直接利用 GPU 加速，确保模型推理速度快且流畅。

在 Bender 出现之前，开发者若想在 iOS 上部署机器学习模型，往往需要面对底层 API 的复杂性，编写大量重复代码来处理权重转换和参数映射，或者直接引入庞大的 TensorFlow 静态库却无法享受 GPU 加速。Bender 完美解决了这些痛点：它不仅支持通过简洁的代码快速定义卷积、池化等常见网络层，更提供了强大的适配器，能够直接加载并“翻译”由 TensorFlow 训练好的预训练模型，自动完成格式转换与参数对齐。

这款工具非常适合需要在 iPhone 或 iPad 上集成人工智能功能的 iOS 应用开发者，以及希望将实验室模型落地到移动端的算法研究人员。借助 Bender，你可以轻松绕过繁琐的底层优化工作，专注于业务逻辑与创新，让高性能的 AI 功能无缝融入你的 App 之中。

使用场景

某医疗科技团队正在开发一款 iOS 端皮肤癌筛查应用，需要在手机上实时运行深度学习模型以分析用户拍摄的皮肤照片。

没有 Bender 时

开发门槛极高：直接调用 Apple 底层的 MetalPerformanceShaders (MPS) 需要编写大量繁琐的底层代码，开发者需手动管理复杂的内存和图形管线。
模型迁移困难：训练好的 TensorFlow 模型无法直接在 iOS GPU 上运行，团队必须编写自定义脚本手动转换权重格式并映射层参数，极易出错。
性能与体积失衡：若强行集成完整的 TensorFlow 静态库以支持推理，会导致应用安装包体积剧增，且无法利用 iOS 设备的 GPU 加速，推理延迟高。
维护成本高昂：每次更新神经网络结构都需要重复修改底层 MPS 调用代码，缺乏灵活的抽象层来快速迭代实验。

使用 Bender 后

开发效率飞跃：Bender 提供了简洁的 Swift 接口封装 MPS，开发者只需几行代码即可定义卷积、池化等常见网络层，无需关注底层细节。
无缝模型导入：利用内置的 TensorFlow 适配器，可直接加载训练好的模型文件，自动完成权重转置和算子映射，实现了从训练到部署的平滑过渡。
极致性能表现：Bender 底层完全基于 Metal 优化，既避免了引入庞大的 TensorFlow 库，又充分激发了 iPhone GPU 的算力，实现毫秒级实时推理。
灵活迭代升级：支持通过代码动态构建网络或加载外部模型，团队可以快速调整网络结构进行 A/B 测试，大幅缩短研发周期。

Bender 让 iOS 开发者能像搭积木一样轻松部署高性能神经网络，真正实现了“云端训练，端侧智能”的落地闭环。

运行环境要求

操作系统

macOS

GPU

需要支持 Metal 的 iOS GPU (通过 MetalPerformanceShaders)，无需 NVIDIA GPU 或 CUDA

内存

未说明

依赖

notes该工具是专为 iOS 开发的神经网络抽象层，使用 Swift 语言。开发环境需 macOS 和 Xcode 9+，运行目标为 iOS 10.0 及以上（推荐 iOS 11.0+）。不支持 Linux 或 Windows。依赖管理可通过 CocoaPods 或 Carthage 进行。

python不适用 (基于 Swift)

Xcode 9+

iOS 10.0+

MetalPerformanceShaders

SwiftProtobuf

快速开始

Bender

Bender 是一个基于 MetalPerformanceShaders 的抽象层，可用于处理神经网络。

简介

Bender 是一个基于 MetalPerformanceShaders 的抽象层，用于处理神经网络。在人工智能领域，即使训练过程已在其他设备上完成，人们也越来越关注在移动设备上运行神经网络。我们希望让每个人都能更轻松地在 iOS 上运行预训练的网络。

Bender 允许您使用最常见的层（如卷积、池化、全连接层以及一些归一化层等）轻松定义和运行神经网络。它在接收这些层的参数方面也非常灵活。

我们还希望支持加载在 TensorFlow 或 Caffe2 等其他框架上训练的模型。目前，Bender 包含一个 TensorFlow 适配器，可以加载带有变量的图，并将其“转换”为 Bender 层。此功能支持 TensorFlow 的一部分操作，但我们计划进一步扩展以覆盖更多情况。

为什么我们需要 Bender？

在 Xmartlabs，我们正准备启动一个机器学习项目，并研究在 iOS 上可用的框架。我们发现 MetalPerformanceShaders 非常有用，但不太易于使用，而且我们发现自己需要重复很多代码和信息。因此，我们开始构建一个框架来处理这类问题。

此外，我们还编写脚本来将我们在 TensorFlow 中训练的模型转换为可在 iOS 上使用的格式。这意味着要将权重转置为 MPSCNN 格式，并将 TensorFlow 中不同层的参数映射到 MPSCNN 内核所使用的参数。虽然 TensorFlow 可以编译为 iOS 版本，但它目前不支持在 GPU 上运行，而我们正是希望这样做。同时，我们也并不想将 TensorFlow 的静态库引入到我们的项目中。这就是为什么我们开始开发一个适配器，用于解析 TF 图并将其转换为我们的 Bender 层。

使用方法

您可以在 Bender 中使用我们自定义的操作符定义自己的网络，也可以加载从 TensorFlow 导出的模型。定义网络和加载模型的方式如下：

import MetalBender

let url = Bundle.main.url(forResource: "myModel", withExtension: "pb")! // 一个 TensorFlow 模型。
let network = Network.load(url: url, inputSize: LayerSize(h: 256, w: 256, f: 3))

network.run(input: /* ... */) { output in
    // ...
}

有关更多信息，请参阅导入。

如果您想自己定义网络，可以这样操作：

let network = Network(inputSize: LayerSize(h: 256, w: 256, f: 3))

network.start
    ->> Convolution(convSize: ConvSize(outputChannels: 16, kernelSize: 3, stride: 2))
    ->> InstanceNorm()
    ->> Convolution(convSize: ConvSize(outputChannels: 32, kernelSize: 3, stride: 2), neuronType: .relu)
    ->> InstanceNorm()
    ->> FullyConnected(neurons: 128)
    ->> Neuron(type: .tanh)
    ->> FullyConnected(neurons: 10)
    ->> Softmax()
// ...

完成所有层的定义后：

network.initialize()

有关更多信息，请参阅 API。

要求

Xcode 9
iOS 11.0 及以上版本（但部署目标为 iOS 10.0，因此也支持 iOS 10）

参与方式

如果您 想贡献代码，请随时 提交拉取请求。
如果您 有功能需求，请 新建议题。
如果您 发现了 bug 或者需要帮助，请在提交议题之前先查看 旧的议题、常见问题解答 (FAQ) 以及 StackOverflow 上的相关讨论。

在贡献之前，请查阅 [CONTRIBUTING] 文件以获取更多信息。

如果您在应用中使用了 Bender，我们非常希望能听到您的反馈！请通过 Twitter 与我们联系。

示例

按照以下步骤运行示例：

克隆 Bender 仓库（或下载）。
在下载的文件夹中运行 carthage update --platform iOS。
打开 Bender 工作区并运行 Example 项目。

其中有一个图像识别示例，包含 Bender 和 CoreML 中的 MobileNet 模型。它还设置了一个 Inception 模型的运行环境，但您需要单独下载该模型，因为它接近 100 MB。您可以从 http://download.tensorflow.org/models/inception_v3_2016_08_28.tar.gz 下载，然后将其冻结并添加到“Example”Xcode 项目中，命名为 ‘inception_v3.pb’。

安装

CocoaPods

要安装 Bender，只需在您的 Podfile 中添加以下行：

pod 'MetalBender', '~> 0.5'

请注意，Bender 编译的目标是 iOS 10。因此，您必须在 Podfile 中添加 platform :ios, '10.0'。

Carthage

Carthage 是一个简单且去中心化的 Cocoa 依赖管理工具。

要安装 Bender，只需在您的 Cartfile 中添加以下行：

github "xmartlabs/Bender" ~> 0.5

然后运行：

carthage update --platform iOS

最后，将构建好的 .framework 二进制文件——MetalBender、MetalPerformanceShadersProxy 和 SwiftProtobuf——拖放到您的应用程序 Xcode 项目中。

作者

Xmartlabs SRL (@xmartlabs)

更改日志

详情请参阅 CHANGELOG.md 文件。

许可证

引用

如果您在研究中使用此代码，请引用我们：

@misc{xmartlabs-2017-bender,
  author = {Mathias Claassen 和 Santiago Castro},
  title = {Bender：轻松构建高效的 iOS 神经网络！},
  year = {2017},
  publisher = {GitHub},
  journal = {GitHub 仓库},
  howpublished = {\url{https://xmartlabs.github.io/Bender/}}
}

Bender 快速上手指南

Bender 是一个构建在 MetalPerformanceShaders 之上的抽象层，旨在让开发者能够轻松地在 iOS 设备上定义和运行神经网络。它支持从 TensorFlow 导入模型，也允许使用 Swift 代码原生构建网络。

环境准备

在开始之前，请确保您的开发环境满足以下要求：

操作系统: macOS
开发工具: Xcode 9 或更高版本
目标平台: iOS 11.0+ (部署目标可低至 iOS 10.0)
语言支持: Swift 4+
依赖管理: CocoaPods 或 Carthage (二选一)

注意：由于底层依赖 MetalPerformanceShaders，该库仅适用于具备 GPU 加速能力的 iOS 设备或模拟器。

安装步骤

您可以选择 CocoaPods 或 Carthage 进行安装。

方式一：使用 CocoaPods (推荐)

打开项目的 Podfile 文件。

确保平台版本设置为 10.0 或以上，并添加 MetalBender 依赖：

platform :ios, '10.0'
target 'YourAppTargetName' do
  pod 'MetalBender', '~> 0.5'
end

在终端执行安装命令：
```
pod install
```

方式二：使用 Carthage

打开项目根目录下的 Cartfile 文件。
添加以下内容：
```
github "xmartlabs/Bender" ~> 0.5
```
在终端执行更新命令：
```
carthage update --platform iOS
```
将生成的 MetalBender.framework、MetalPerformanceShadersProxy.framework 和 SwiftProtobuf.framework 拖入 Xcode 项目的 "Frameworks, Libraries, and Embedded Content" 中，并确保设置为 "Embed & Sign"。

基本使用

Bender 支持两种主要的使用方式：加载预训练的 TensorFlow 模型或使用 Swift 链式调用原生构建网络。

场景一：加载 TensorFlow 模型

如果您已经有一个训练好的 .pb 格式 TensorFlow 模型，可以直接加载并运行：

import MetalBender

// 加载 bundled 中的模型文件
let url = Bundle.main.url(forResource: "myModel", withExtension: "pb")! 
let network = Network.load(url: url, inputSize: LayerSize(h: 256, w: 256, f: 3))

// 运行网络
network.run(input: /* 输入数据 */) { output in
    // 处理输出结果
    print("Inference completed")
}

场景二：原生定义网络结构

您也可以使用 Bender 提供的操作符直接在代码中构建神经网络：

import MetalBender

// 初始化网络，定义输入尺寸 (高 256, 宽 256, 通道 3)
let network = Network(inputSize: LayerSize(h: 256, w: 256, f: 3))

// 使用链式语法构建层
network.start
    ->> Convolution(convSize: ConvSize(outputChannels: 16, kernelSize: 3, stride: 2))
    ->> InstanceNorm()
    ->> Convolution(convSize: ConvSize(outputChannels: 32, kernelSize: 3, stride: 2), neuronType: .relu)
    ->> InstanceNorm()
    ->> FullyConnected(neurons: 128)
    ->> Neuron(type: .tanh)
    ->> FullyConnected(neurons: 10)
    ->> Softmax()

// 初始化网络以准备运行
network.initialize()

// 运行网络
network.run(input: /* 输入数据 */) { output in
    // 处理输出结果
}

完成上述步骤后，即可在 iOS 应用中利用 GPU 加速执行推理任务。更多高级用法（如自定义层映射、权重导入细节）请参考项目文档中的 API.md 和 Importing.md。

版本历史

0.5.02018/05/22

0.4.12017/11/14

0.4.02017/11/01

0.3.02017/08/17

0.2.02017/08/09

0.1.02017/06/05

常见问题

风格迁移示例模型（q_and_w.pb 等）是从哪里获取的？如何自己训练类似的模型？

为什么量化后的图（Quantized graph）无法在 Bender 中工作？输入尺寸会有影响吗？

风格迁移示例在 iOS 11 上无法运行或报错怎么办？

使用大于 256x256 的图片时，风格化图像为什么会重复显示（如出现 4 列）？

运行 Example.ConcatTest 时报错"Unable to create pipeline state, check metal shaders"如何解决？

Bender 是否支持 TensorFlow Magenta 的 .mag 文件或 RNN/LSTM 模型？

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

★ 349.3k|★★★☆☆|1周前

Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|1周前

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 158.1k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 108.3k|★★☆☆☆|6天前

开发框架图像Agent

gemini-cli

gemini-cli 是一款由谷歌推出的开源 AI 命令行工具，它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言，它提供了一条从输入提示词到获取模型响应的最短路径，无需切换窗口即可享受智能辅助。这款工具主要解决了开发过程中频繁上下文切换的痛点，让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用，还是执行复杂的 Git 操作，gemini-cli 都能通过自然语言指令高效处理。它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口，具备出色的逻辑推理能力；内置 Google 搜索、文件操作及 Shell 命令执行等实用工具；更独特的是，它支持 MCP（模型上下文协议），允许用户灵活扩展自定义集成，连接如图像生成等外部能力。此外，个人谷歌账号即可享受免费的额度支持，且项目基于 Apache 2.0 协议完全开源，是提升终端工作效率的理想助手。

★ 100.8k|★★☆☆☆|1周前

插件Agent图像

markitdown

MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器

★ 93.4k|★★☆☆☆|1周前

插件开发框架

使用场景

没有 Bender 时

使用 Bender 后

运行环境要求

快速开始

Bender

目录

简介

为什么我们需要 Bender？

使用方法

要求

参与方式

示例

安装

CocoaPods

Carthage

作者

更改日志

许可证

引用

Bender 快速上手指南

环境准备

安装步骤

方式一：使用 CocoaPods (推荐)

方式二：使用 Carthage

基本使用

场景一：加载 TensorFlow 模型

场景二：原生定义网络结构

版本历史

常见问题

相似工具推荐

openclaw

stable-diffusion-webui

everything-claude-code

ComfyUI

gemini-cli

markitdown