Category_Theory_Machine_Learning
Category_Theory_Machine_Learning 是一个专注于整理“范畴论与机器学习交叉领域”研究论文的开源知识库。它旨在解决该前沿方向文献分散、难以系统追踪的问题,将大量探讨如何利用范畴论这一高度抽象的数学语言来重新审视和构建机器学习理论的学术成果,按主题进行了清晰分类。
这份清单涵盖了从深度学习基础组件、梯度下降的函子解释,到注意力机制的拓扑空间分析等广泛议题。其独特的技术亮点在于揭示了神经网络架构背后的代数结构与组合性原理,例如通过“反向导数上升”或“透镜(Lenses)”等概念,为理解模型内部运作提供了全新的数学视角。
该资源主要适合人工智能研究人员、理论计算机科学家以及对数学基础有浓厚兴趣的高级开发者使用。对于希望突破传统工程视角,从更本质的数学层面探索下一代机器学习架构的学者而言,Category_Theory_Machine_Learning 提供了一份极具价值的入门指南与研究地图,帮助用户高效定位关键文献,把握学科融合的最新动态。
使用场景
某生物科技公司算法团队正试图为复杂的基因调控网络设计一种新型注意力机制,以突破传统模型在捕捉长程依赖关系上的瓶颈。
没有 Category_Theory_Machine_Learning 时
- 理论检索如大海捞针:团队需在 arXiv 海量论文中手动筛选,难以发现“球面注意力”或“拓扑神经网络”等跨学科前沿成果,导致研发方向局限。
- 架构创新缺乏数学根基:尝试修改网络结构时仅凭经验试错,缺乏范畴论中“函子”或“参量跨度”等形式化工具指导,新架构的可解释性与收敛性无法保证。
- 复现与迁移成本高昂:由于缺少统一的代数理论框架,不同论文间的概念(如反向传播作为函子)难以互通,导致代码复用率低,重复造轮子现象严重。
使用 Category_Theory_Machine_Learning 后
- 精准定位交叉领域文献:通过该工具分类索引,团队迅速锁定了《Accelerating Machine Learning Systems via Category Theory》等关键论文,直接获取了针对基因网络的球面注意力方案。
- 基于代数形式化设计架构:借鉴列表中关于“微分多项式电路”和“余层拓扑神经网络”的理论,团队用严谨的数学语言构建了新模型,显著提升了训练稳定性和泛化能力。
- 统一视角加速系统迭代:利用工具提供的统一范畴论视角,团队将梯度下降、反向传播等模块抽象为标准“学习器”,实现了模块化开发,大幅缩短了从理论到原型的周期。
Category_Theory_Machine_Learning 通过将深奥的范畴论论文系统化整理,为开发者架起了一座连接抽象数学理论与落地 AI 架构创新的坚实桥梁。
运行环境要求
未说明
未说明

快速开始
范畴论 ∩ 机器学习
范畴论在机器学习中的应用日益广泛。本仓库旨在按领域分类列出所有相关论文。
如需了解范畴论的基本思想,请参阅此链接。

可能仍有遗漏的论文,且部分论文可能同时属于多个领域。欢迎通过创建拉取请求或提交议题来为本列表贡献内容或提出改进建议。
学位论文
通用深度学习
- 基于梯度学习的范畴论基础
- 观点:范畴论深度学习是所有架构的代数理论
- 用于范畴论深度学习的余代数:可表示性与通用逼近
- 观点:拓扑深度学习是关系学习的新前沿
- 作为函子的反向传播
- 透镜与学习者
- 逆导数上升法
- 双目透镜
- 使用梯度下降学习函子(更长版本见这里)
- 递归神经网络的组合性
- 深度神经网络作为嵌套的动力系统
- 机器学习中的范畴论
- 神经网络层作为参数化跨度
- 用于机器学习的可微多项式电路范畴
- 学习者几乎是自由紧闭的
- 超越神经网络特征相似性:网络特征复杂度及其范畴论解释
- 关注拓扑空间:细胞变换器
- 关于注意力机制的解剖学研究
- 机器学习中的代数动力系统
- 神经算子是否总是可以连续离散化?
- 机器学习背景下的序理论:一项应用
- 神经代数几何邀请
- 代数位置编码
- 学习依赖类型的结构感知表示
- 通过范畴论加速机器学习系统:应用于基因调控网络的球面注意力
- 上层集拓扑神经网络:一种广义深度学习框架
- 学习动态的范畴不变量
- 乘积交互:深度学习架构的代数形式化
等变性
- 等变神经网络与分段线性表示理论
- 图神经网络的局部置换等变性
- 马尔可夫范畴中的随机神经网络对称化
- 面向克利福德群等变神经网络的度量学习
- 群等变神经网络的范畴化
- 通过诱导和限制表示进行等变单视图姿态预测
- 利用范畴论刻画学习算法的不变性
- 可解释等变代理模型的数学基础
- 滤波等变函数:关于列表长度泛化外推的对称性解释
- 注意力机制上的关系归纳偏置
- 可识别等变网络是逐层等变的
图神经网络
- 图神经网络是动态编程者
- 自然图网络
- 层析表示学习
- 层析神经网络
- 带有连接拉普拉斯算子的层析神经网络
- 神经层析扩散:从拓扑视角看图神经网络中的异质性和过度平滑问题
- 图神经网络中的非线性层析扩散
- 图卷积神经网络作为参数化柯莱斯里态射
- 图神经网络的可学习交换幺半群
- 基于图的推荐系统的层析神经网络
- 层析理论:从深度几何到深度学习
- 利用上循环进行异步算法对齐
- 用于形状判别的拓扑赋值图
- 格罗滕迪克图神经网络框架:构建拓扑感知图神经网络的代数平台
- 别害怕细胞复形!从应用角度的介绍
- 图谱系与骨架图乘积
- 关于高阶消息传递的层析化
- 通过范畴论的视角解开超边
- 魏斯费勒—莱曼方法进入范畴论
- 建模赋值图中拓扑对节点属性分布的影响
可微编程 / 自动微分
- CHAD:组合同态自动微分
- 适用于表达性全函数语言的CHAD
- 可微的Curry语言
- 用于反向模式自动微分的函子型字符串图
- 通过延迟迹实现可微的因果计算
- 自动微分的简单本质
- 反向导数范畴
- 笛卡尔反向微分范畴中的反向Faà di Bruno公式
- 利用切触范畴形式化并扩展微分编程
- 基于微分流形与范畴粘合的自动微分正确性
- 语义正确、纯函数式、高效的反向模式自动微分
- 高阶函数的高阶自动微分
- 通过高阶范畴论探讨透镜与光学的空间—时间权衡
- 利用重写策略实现高效的函数式自动微分
CuTe 布局
概率论
- 马尔可夫范畴
- 马尔可夫范畴与熵
- 范畴概率中的无穷乘积与零一律
- 高阶概率论的便利范畴
- 概率单子的双幺半群结构
- 可表的马尔可夫范畴及范畴概率中统计实验的比较
- 德芬内蒂构造作为范畴极限
- 作为有限样本空间余极限的概率单子
- 基于非确定性β约简的概率依赖类型系统
- 概率、赋值、超空间:Top上的三个单子以及支集作为态射
- 范畴概率论
- 信息结构及其上同调
- 可计算的随机过程
- 具有精确条件化的概率程序的组合语义
- 带因式分解密度的字符串图
- 部分马尔可夫范畴
- 随机变量、条件独立性与抽象样本空间范畴
- 梅特罗波利斯—哈斯廷斯算法的范畴论解释
贝叶斯/因果推断
- 贝叶斯推断的组合结构
- 贝叶斯网络与因果关系的组合推理
- 依赖性贝叶斯透镜:带有规范贝叶斯逆的双向马尔可夫核范畴
- 贝叶斯学习的范畴论框架
- 因果理论:贝叶斯网络的范畴视角
- 基于范畴论的贝叶斯机器学习
- 贝叶斯概率的范畴论基础
- 贝叶斯开放博弈
- 通过字符串图手术进行因果推断
- 基于字符串图的分解与贝叶斯逆
- 范畴随机过程与似然度
- 贝叶斯更新以光学方式组合
- 马尔可夫过程与图模型的自动后向滤波—前向引导
- 平滑算法中的组合性
- 共轭先验的信道视角
- 用于概率与贝叶斯推理的类型论
- 高阶贝叶斯推断的指称验证
- 贝叶斯编程的几何学
- 在概率守卫型λ演算中对马尔可夫链的关系推理
- 内部模型原理的贝叶斯解释
- 信念传播算法在有限偏序集上的函子性研究
- 贝叶斯网络、马尔可夫网络、道德化、三角化:范畴视角
拓扑数据分析
度量空间数量
- 通过度量空间数量近似凸包
- 度量空间数量与加权向量的实际应用
- 用于机器学习的加权向量:数值谐波分析在边界检测中的应用
- 图像的数量向量
- 算术标量与矩阵范畴的数量
- 度量空间数量用于评估无监督表征学习
- 经语言模型增强的文本范畴的数量
博文
自动机学习
其他
- 广义卷积与高效语言识别
- 广义监督学习视为使用 delta 透镜进行变化传播
- 从开放学习者到开放博弈
- 学习者语言
- 基于全局优化的构造性类型论回归方法
- 函子式的流形学习
- 开放博弈中反馈的叙事性表示
- 评估单位 RNN 作为句法的端到端组合模型
- 聚类方案的分类
- 范畴论霍普菲尔德网络
- 去耦合定义的范畴论元分析
- 同构、归一化流与密度估计:保持数据间的关系
- 代数结构向潜在嵌入的传输
- 面向数学协作助手的数据:为机器学习更好地呈现证明的方式
- 加权格的范畴论扩散
- 时间序列与图像数据的聚合:函子与双函子
- 通过范畴解释函子对 AI 分类器的逻辑解释
- 在 2-范畴中对张量微积分进行类型标注
- 范畴论一致预测的乐趣
- 高斯–马尔可夫伴随:监督学习中残差的范畴语义
- 利用整数集关系建模布局抽象
相似工具推荐
openclaw
OpenClaw 是一款专为个人打造的本地化 AI 助手,旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚,能够直接接入你日常使用的各类通讯渠道,包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息,OpenClaw 都能即时响应,甚至支持在 macOS、iOS 和 Android 设备上进行语音交互,并提供实时的画布渲染功能供你操控。 这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地,用户无需依赖云端服务即可享受快速、私密的智能辅助,真正实现了“你的数据,你做主”。其独特的技术亮点在于强大的网关架构,将控制平面与核心助手分离,确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者,以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力(支持 macOS、Linux 及 Windows WSL2),即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你
stable-diffusion-webui
stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。
everything-claude-code
everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上
ComfyUI
ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。
gemini-cli
gemini-cli 是一款由谷歌推出的开源 AI 命令行工具,它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言,它提供了一条从输入提示词到获取模型响应的最短路径,无需切换窗口即可享受智能辅助。 这款工具主要解决了开发过程中频繁上下文切换的痛点,让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用,还是执行复杂的 Git 操作,gemini-cli 都能通过自然语言指令高效处理。 它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口,具备出色的逻辑推理能力;内置 Google 搜索、文件操作及 Shell 命令执行等实用工具;更独特的是,它支持 MCP(模型上下文协议),允许用户灵活扩展自定义集成,连接如图像生成等外部能力。此外,个人谷歌账号即可享受免费的额度支持,且项目基于 Apache 2.0 协议完全开源,是提升终端工作效率的理想助手。
markitdown
MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具,专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片(含 OCR)、音频(含语音转录)、HTML 乃至 YouTube 链接等多种格式的解析,能够精准提取文档中的标题、列表、表格和链接等关键结构信息。 在人工智能应用日益普及的今天,大语言模型(LLM)虽擅长处理文本,却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点,它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式,成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外,它还提供了 MCP(模型上下文协议)服务器,可无缝集成到 Claude Desktop 等 LLM 应用中。 这款工具特别适合开发者、数据科学家及 AI 研究人员使用,尤其是那些需要构建文档检索增强生成(RAG)系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性,但其核心优势在于为机器