awesome-machine-learning
awesome-machine-learning 是一个精心整理的机器学习资源清单,特别聚焦于苹果生态下的 Core ML 框架与 Swift 语言。它旨在解决开发者在尝试机器学习时,无需深入 Python 或 JavaScript 等其他平台即可快速上手的痛点。通过汇集预训练模型、转换工具及教程,它让使用者能先直观感受技术成果,再逐步探索底层机制。
这份资源非常适合 iOS 和 macOS 应用开发者,尤其是那些希望利用 Apple 原生技术(如 Vision、ARKit)在移动端集成智能功能,但不想被复杂跨平台环境困扰的人群。同时,对希望将现有 TensorFlow、Keras 或 Caffe 模型迁移至苹果设备的算法工程师也极具参考价值。
其独特亮点在于提供了丰富的模型转换工具链(如 tf-coreml、torch2coreml),支持将主流深度学习框架模型无缝转为 Core ML 格式,并收录了专为 iOS 优化的模型库(如 Awesome-CoreML-Models)。此外,清单还涵盖了从模型可视化查看器 Netron 到风格迁移实战项目 StyleArt 等实用内容,帮助用户高效构建具备图像识别、自然语言处理等能力的原生智能应用。
使用场景
一位专注于 iOS 开发的独立开发者,希望在不深入 Python 或 TensorFlow 底层细节的前提下,快速为自家应用集成图像风格迁移功能。
没有 awesome-machine-learning 时
- 跨平台门槛高:被迫花费数周学习 Python 环境和 TensorFlow 框架,偏离了 Swift 原生开发的主航道。
- 模型寻找困难:在海量开源项目中盲目搜索适配 Core ML 的预训练模型,难以验证其兼容性与效果。
- 转换流程复杂:缺乏明确的工具指引,不知道如何将现有的 Caffe 或 Keras 模型高效转换为 .mlmodel 格式。
- 调试无从下手:面对模型集成后的黑盒运行状态,缺少可视化工具来诊断神经网络结构或性能瓶颈。
使用 awesome-machine-learning 后
- 聚焦原生技术:直接获取基于 Core ML 和 Swift 的精选资源清单,无需涉足其他编程语言即可上手。
- 模型即取即用:通过列表中推荐的 Awesome-CoreML-Models 和 ModelZoo,迅速找到并下载成熟的风格迁移模型。
- 转换工具现成:利用收录的 coremltools、tf-coreml 等转换利器,一键将主流框架模型转为苹果生态专用格式。
- 可视化辅助:借助 Netron 等工具直观查看模型层级结构,快速定位集成问题并优化应用表现。
awesome-machine-learning 让 iOS 开发者能够跳过繁琐的跨平台学习曲线,直接站在巨人的肩膀上构建高质量的智能应用。
运行环境要求
- macOS
- iOS
未说明
未说明

快速开始
令人惊叹的机器学习 
❤️ 支持我的应用 ❤️
- Push Hero - 纯 Swift 原生 macOS 应用,用于测试推送通知
- PastePal - 剪贴板、笔记和快捷方式管理器
- Quick Check - 智能待办事项管理器
- Alias - 应用和文件快捷方式管理器
- 我的其他应用
❤️❤️😇😍🤘❤️❤️
我喜欢探索机器学习,但不想为了理解某些框架或 TensorFlow 而深入到 Python 或 JavaScript 等其他平台。幸运的是,在 WWDC 2017 上,苹果推出了 Core ML、Vision 和 ARKit,这让使用机器学习变得容易得多。借助所有预训练模型,我们可以构建出很棒的应用。先感受成果,再尝试探索更高级的主题和底层机制,这感觉真好 🤖
本项目主要整理与 Core ML 和 Swift 相关的内容。如果你需要参考其他平台的相关资料,这里也有涉及。
目录
Core ML
模型 :rocket:
- Awesome-CoreML-Models 最大的 Core ML 模型列表(适用于 iOS 11 及以上版本)
- caffe Caffe:一个快速的开源深度学习框架。http://caffe.berkeleyvision.org/
- deep-learning-models Keras 中用于流行深度学习模型的代码和权重文件。
- tensorflow models 使用 TensorFlow 构建的模型
- libSVM 支持向量机库
- scikit-learn Python 中的机器学习工具
- xgboost 一个可扩展、可移植且分布式的梯度提升库(GBDT、GBRT 或 GBM),支持 Python、R、Java、Scala、C++ 等语言。可在单机、Hadoop、Spark、Flink 和 DataFlow 等环境中运行。
- Keras-Classification-Models 用于分类任务的 Keras 模型集合
- MobileNet-Caffe Google MobileNets 的 Caffe 实现
- ModelZoo 一个用于共享 Core ML 模型的中央 GitHub 仓库
- StyleArt Style Art 库利用一组预训练的机器学习模型处理图像,并将其转换为艺术风格
- models 使用 TensorFlow 构建的模型和示例
- Core ML Store
工具
- coremltools 一个用于创建、检查和测试 .mlmodel 格式模型的 Python 包
- torch2coreml 此工具可帮助将 Torch7 模型转换为 Apple CoreML 格式
- turicreate Turi Create 简化了自定义机器学习模型的开发过程。
- Netron 神经网络和机器学习模型查看器
- onnx-coreml ONNX 到 CoreML 转换器
- tf-coreml TensorFlow 到 CoreML 转换器
- tensorwatch 用于机器学习和数据科学的调试与可视化工具
文章
- Swift 教程:iOS 11 中的原生机器学习与机器视觉
- 如何为 CoreML 训练自己的模型
- 使用 CoreML 和 TensorFlow 在 iOS 11 中实现智能手势识别
- 用 CoreML 打造 DIY Prisma 应用 :rocket:
- 使用 scikit-learn 和 CoreML 构建音乐推荐引擎
- 用 Turi Create 和 Core ML 一 afternoon 搭建“不是热狗”应用
- 利用 TensorFlow 对象检测 API、ML Engine 和 Swift 构建泰勒·斯威夫特识别器
- 在 iOS 中利用机器学习提升无障碍体验
- IBM Watson 服务与 CoreML 教程
- 从 Keras 和 CoreML 开始机器学习
- 使用 CoreML 和 IBM Watson 服务检测威士忌品牌
- 在你的 iOS 应用中使用 IBM Watson 和 CoreML 检测复仇者联盟超级英雄
- 机器学习 使用机器学习打造更智能的应用。
- 苹果机器学习期刊
- CoreML 介绍
- 深入解析 CoreML
- CoreML 和 Vision:iOS 11 中的机器学习教程
- iOS 11:让每个人都能享受机器学习
- Swift 开发者想知道的关于机器学习的一切
- 将机器学习引入你的 iOS 应用
- iOS 机器学习 API 的优缺点 :rocket:
- CoreML:面向 iOS 的机器学习 :rocket:
- 机器学习训练流程的快速启动
- 使用 Create ML 在 iOS 应用中检测肺炎
- 如何在 Keras 中微调 ResNet,并通过 CoreML 在 iOS 应用中使用
- 机器学习中常见的五大数据质量问题及快速检测方法
仓库
- Core-ML-Sample 使用 CoreML 框架的演示
- UnsplashExplorer-CoreML 结合 Unsplash API 的 CoreML 演示应用
- MNIST_DRAW 这是一个示例项目,展示了如何使用 Keras(TensorFlow)训练 MNIST 手写数字识别模型,并在 iOS 11 上通过 CoreML 进行推理。
- CocoaAI Cocoa 人工智能实验室 :rocket:
- complex-gestures-demo 展示如何在 iOS 应用中使用机器学习识别 13 种复杂手势
- Core-ML-Car-Recognition 面向 CoreML 的汽车识别框架
- CoreML-in-ARKit 简单项目,用于在 AR 中检测物体并在其上方显示 3D 标签。这是一个使用 CoreML 的 ARKit 项目的基础模板
- trainer-mac 训练一个模型,然后生成一个完整的 Xcode 项目来使用该模型——无需编写任何代码
- GestureAI-CoreML-iOS 使用 CoreML 在 iOS 应用中实现手势识别
- visual-recognition-coreml 使用 Watson Visual Recognition 和 CoreML 离线分类图像
TensorFlow
文章
- 开源 TensorFlow 模型(Google I/O '17)
- Swift for TensorFlow
- 开始使用 TensorFlow 高级 API(Google I/O '18)
- 在 iOS 上开始使用 TensorFlow
- 介绍 TensorFlow.js:JavaScript 中的机器学习
- TensorFlow for JavaScript(Google I/O '18)
- Colab Colaboratory 是谷歌的一个研究项目,旨在促进机器学习教育和研究的传播
- 使用 TensorFlow 和 BNNS 将机器学习添加到你的 Mac 或 iOS 应用中
仓库
- workshops 几个练习,可用于 Google IO 2018 的活动中
课程
Keras
文章
- 在 iOS 上使用 CoreML 运行 Keras 模型
- Keras 与卷积神经网络 (CNN)
- Keras 教程:使用预训练模型进行迁移学习https://www.learnopencv.com/keras-tutorial-transfer-learning-using-pre-trained-models/
Turi Create
文章
- 用 Turi Create 和 Core ML 在一个下午构建“不是热狗”应用
- 使用 Turi Create 在 iOS 上进行自然语言处理
- iOS 中的机器学习:Turi Create 和 CoreML
- Turi Create 使用指南
机器学习
入门
文章
- 机器学习的可视化入门
- 机器学习真有趣!
- 用简单英语解释的 10 个机器学习术语
- 一年学会机器学习
- 机器学习自学资源
- 如何学习机器学习
- 机器学习入门
- 面向非技术人员的机器学习与人工智能指南
- 机器学习深度指南:概述、目标、学习类型和算法
- 机器学习算法概览
- 黑客的机器学习
- 面向开发人员的机器学习:适合绝对新手和五年级学生
- 深入机器学习:使用 Python Jupyter Notebook 和 scikit-learn 深入学习机器学习
- 使用 scikit-learn 学习机器学习的入门教程
- 使用极少数据构建强大的图像分类模型
- HBO《硅谷》如何用移动 TensorFlow、Keras 和 React Native 构建“不是热狗”
- Hello World - 机器学习食谱 #1
- 卷积神经网络的直观解释 :rocket:
- 神经网络快速入门
- 使用神经网络和遗传算法实现 Flappy Bird 的机器学习算法
- 通过原型设计理解机器如何学习 :rocket:
- 设备端训练
- iOS 中的机器学习
- 神经网络的“Hello World” 👶
- EmojiIntelligence:使用 Swift 在 Apple Playground 中构建的神经网络 👶
- 机器学习:端到端分类
- 机器学习从零到英雄(Google I/O'19) :rocket:
卷积神经网络
- CS231n 2016 冬季第 7 讲:卷积神经网络
- 如何用 Python 从头开始构建自己的神经网络 :star:
- 卷积神经网络的工作原理 :star:
杂项
博客
- Fritz Heartbeat :star:
Create ML
ML Kit
Vision
- Vision:应用高性能图像分析和计算机视觉技术,以识别面部、检测特征并分类图像和视频中的场景。
- Vision 入门博客
- Swift World:iOS 11 新功能——Vision
自然語言處理
- NSLinguisticTagger 分析自然語言,標記詞性與詞類、識別專有名詞、進行詞形還原,並判斷文本的語言及書寫系統(正字法)。
- 語言標記
- NSLinguisticTagger 在 NSHipster 上
- CoreLinguistics 此倉庫包含一些用於自然語言處理的基本數據結構。
- SwiftVerbalExpressions VerbalExpressions 的 Swift 版本
Metal
- Metal
- MPSCNNHelloWorld:簡單的數字檢測卷積神經網絡 (CNN)
- MetalImageRecognition:執行圖像識別
- Apple 的深度學習框架:BNNS 對比 Metal CNN
- Forge 一個用於 Metal 的神經網絡工具包
GamePlayKit
- GamePlayKit
- 專案 34:四子連線
- GKMinmaxStrategist:打造井字遊戲 AI 需要什麼?
- GameplayKit 教程:人工智能
- GameplayKit 精華
- GameplayKit:超越遊戲
課程
- 6.S191:深度學習入門
- 機器學習
- 導論——Udacity 機器學習入門
- deeplizard 的機器學習與深度學習基礎 :star: :star:
面試
其他 ML 框架
- TensorSwift 一個輕量級的 Swift 庫,用於計算張量,其 API 與 TensorFlow 相似。
- Swift-AI Swift 機器學習庫。
- Swift-Brain 用於未來 iOS 開發的人工智能/機器學習數據結構及 Swift 算法。包括貝葉斯定理、神經網絡等 AI 技術。
- Bender 在 iOS 上輕鬆構建快速神經網絡!使用 TensorFlow 模型,底層採用 Metal。
- BrainCore iOS 和 OS X 平台上的神經網絡框架。
- AIToolbox 一個用 Swift 寫成的 AI 模塊工具箱:圖/樹、支持向量機、神經網絡、主成分分析、K-均值聚類、遺傳算法等。
- brain JavaScript 中的神經網絡。
- TensorFlow 一個用於機器智慧的開源軟體庫。
- incubator-predictionio PredictionIO 是一款面向開發者和機器學習工程師的機器學習伺服器,基於 Apache Spark、HBase 和 Spray 構建。
- Caffe BAIR 發布的深度學習框架。
- Torch 一個用於 LuaJIT 的科學計算框架。
- Theano Theano 是一個 Python 庫,可高效地定義、優化和評估涉及多維陣列的數學表達式。
- CNTK Microsoft Cognitive Toolkit (CNTK),一個開源深度學習工具包。
- MXNet 輕量級、可移植、靈活的分布式/移動端深度學習框架。
Accelerate
- Accelerate-in-Swift Accelerate.framework 的 Swift 示例代碼。
- Surge 一個使用 Accelerate 框架的 Swift 庫,提供高效的矩陣運算、數位信號處理和圖像操作功能。
統計學
- SigmaSwiftStatistics 一個用 Swift 寫成的統計計算函數集合。
服務
- Watson 使用 IBM Watson 的語言、視覺、語音和數據 API,在您的應用中實現認知計算功能。
- wit.ai 面向開發者的自然語言處理平台。
- Cloud Machine Learning Engine 可在任何規模的數據上進行機器學習。
- Cloud Vision API 利用我們強大的 Cloud Vision API 從圖像中獲取洞見。
- Amazon Machine Learning Amazon Machine Learning 讓開發者能夠輕鬆構建智能應用程序,包括欺詐檢測、需求預測、目標行銷和點擊預測等功能。
- api.ai 為機器人、應用程序、服務和設備構建獨特的品牌化自然語言交互。
- clarifai 使用全球最佳的圖像和視頻識別 API 打造令人驚嘆的應用程序。
- openml 一起探索機器學習。
- Lobe 讓深度學習變得簡單。
- 比較各雲端 ML 服務提供商的機器學習 (ML) 服務
文字識別
- Tesseract OCR 教程
- Tesseract-OCR-iOS Tesseract OCR iOS 是一個適用於 iOS7+ 的框架,同時針對 armv7s 和 arm64 架構編譯。
- tesseract.js 純 JavaScript OCR,支援 62 種語言。
语音识别
- Speech
- 在 iOS 10 中使用语音识别 API
- iOS 语音识别教程
- CeedVocal 适用于 iOS 的语音识别库
- FluidAudio 面向 Apple 平台的本地音频 AI SDK,支持自动语音识别、说话人分离、语音活动检测和文本转语音功能,并针对 Apple 神经引擎进行了优化
语音合成器
- AVSpeechSynthesizer 用于将文本转换为合成语音的对象,并提供用于监控或控制正在进行的语音输出的控件。
人工智能
Google Cloud Platform 机器学习服务
其他
- NotHotdog 分类器 如果我告诉你市面上有一款应用可以判断你拿的是热狗还是非热狗,你会作何感想?
- HBO《硅谷》如何利用移动 TensorFlow、Keras 和 React Native 构建“Not Hotdog”
相似工具推荐
openclaw
OpenClaw 是一款专为个人打造的本地化 AI 助手,旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚,能够直接接入你日常使用的各类通讯渠道,包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息,OpenClaw 都能即时响应,甚至支持在 macOS、iOS 和 Android 设备上进行语音交互,并提供实时的画布渲染功能供你操控。 这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地,用户无需依赖云端服务即可享受快速、私密的智能辅助,真正实现了“你的数据,你做主”。其独特的技术亮点在于强大的网关架构,将控制平面与核心助手分离,确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者,以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力(支持 macOS、Linux 及 Windows WSL2),即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你
stable-diffusion-webui
stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。
everything-claude-code
everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上
ComfyUI
ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。
gemini-cli
gemini-cli 是一款由谷歌推出的开源 AI 命令行工具,它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言,它提供了一条从输入提示词到获取模型响应的最短路径,无需切换窗口即可享受智能辅助。 这款工具主要解决了开发过程中频繁上下文切换的痛点,让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用,还是执行复杂的 Git 操作,gemini-cli 都能通过自然语言指令高效处理。 它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口,具备出色的逻辑推理能力;内置 Google 搜索、文件操作及 Shell 命令执行等实用工具;更独特的是,它支持 MCP(模型上下文协议),允许用户灵活扩展自定义集成,连接如图像生成等外部能力。此外,个人谷歌账号即可享受免费的额度支持,且项目基于 Apache 2.0 协议完全开源,是提升终端工作效率的理想助手。
markitdown
MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具,专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片(含 OCR)、音频(含语音转录)、HTML 乃至 YouTube 链接等多种格式的解析,能够精准提取文档中的标题、列表、表格和链接等关键结构信息。 在人工智能应用日益普及的今天,大语言模型(LLM)虽擅长处理文本,却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点,它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式,成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外,它还提供了 MCP(模型上下文协议)服务器,可无缝集成到 Claude Desktop 等 LLM 应用中。 这款工具特别适合开发者、数据科学家及 AI 研究人员使用,尤其是那些需要构建文档检索增强生成(RAG)系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性,但其核心优势在于为机器