llm-app-stack

GitHub
1.3k 147 非常简单 1 次阅读 5天前开发框架数据工具
AI 解读 由 AI 自动生成,仅供参考

llm-app-stack 是一份由知名投资机构 a16z 维护的开源清单,旨在全面梳理构建大语言模型(LLM)应用所需的技术栈。随着 AI 开发生态迅速膨胀,开发者往往面临工具选型困难、架构设计迷茫的挑战。llm-app-stack 通过将复杂的开发生态划分为数据管道、向量数据库、编排器、监控评估等十四个关键层级,为每个环节提供了详尽的工具、项目及供应商列表。

这份资源不仅涵盖了从数据处理到应用托管的全流程选项,还区分了专有 API 与开源方案,并附带了实用的搜索提示模板,极大地降低了技术调研的成本。它特别适合正在规划或开发 LLM 应用的工程师、技术负责人及研究人员使用,能帮助大家快速对比不同方案的优劣,避免重复造轮子。其核心亮点在于“全景式”的分类视角和持续的社区更新机制,让使用者能够一目了然地掌握当前最前沿的架构趋势与可用工具,从而更高效地搭建稳健的 AI 应用系统。

使用场景

某初创团队正急于构建一款基于企业内部文档的智能客服系统,需要在短时间内完成从数据清洗到模型部署的全流程搭建。

没有 llm-app-stack 时

  • 选型迷茫耗时久:面对市面上数百个向量数据库和 Embedding 模型,团队花费两周时间调研仍难以确定最佳组合,严重拖慢项目启动进度。
  • 架构设计碎片化:缺乏统一参考,开发人员各自为战,导致数据管道(如 Airflow)与编排层(Orchestrators)对接困难,系统耦合度高且不稳定。
  • 关键组件易遗漏:初期架构未考虑 LLM 缓存和监控评估环节,上线后因响应延迟高且无法追踪坏案,被迫停机重构。
  • 重复造轮子:团队需手动搜集各层级工具的 GitHub 仓库和安装数据,甚至自行编写脚本验证工具活跃度,浪费大量工程资源。

使用 llm-app-stack 后

  • 一键锁定技术栈:直接参考 llm-app-stack 中按层级分类的清单,迅速选定 Unstructured 处理文档、Chroma 存储向量、LangChain 进行编排,将选型周期缩短至 2 天。
  • 架构蓝图清晰化:依据其提供的“新兴架构图”,团队一次性规划好包含数据管道、API 插件及日志监控的完整闭环,确保各模块无缝集成。
  • 规避生产陷阱:通过清单中推荐的 Logging/Monitoring 和 Validator 类工具,在开发阶段即植入评估体系,有效预防了上线后的性能瓶颈与幻觉问题。
  • 决策数据透明:利用列表中集成的 GitHub 星标数和 Pip 下载量指标,快速筛选出社区活跃、维护良好的开源项目,降低技术债务风险。

llm-app-stack 不仅是一张工具清单,更是大模型应用开发的“导航图”,帮助团队从混乱的生态中快速构建出稳健、可扩展的生产级架构。

运行环境要求

GPU

未说明

内存

未说明

依赖
notes该仓库(llm-app-stack)并非一个可直接运行的单一软件工具,而是一份关于构建 LLM 应用程序所需各类工具、项目和供应商的综合列表(涵盖数据管道、嵌入模型、向量数据库等类别)。因此,README 中未提供具体的操作系统、GPU、内存、Python 版本或依赖库的安装需求。用户需根据列表中选择的具体子项目(如 ChromaDB, Ray, Sentence Transformers 等)查阅其各自的文档以获取运行环境要求。
python未说明
llm-app-stack hero image

快速开始

LLM 应用栈

又称 LLM 应用的新兴架构

2657 Emerging LLM App Stack R2 Clean

这是 LLM 应用栈各层中可用工具、项目和供应商的列表。

我们之前的文章仅列出了基于用户访谈的最受欢迎选项。而这个仓库旨在更加全面,涵盖每个类别中的所有可用选项。我们可能仍然遗漏了一些重要项目,因此如果您发现有遗漏,请提交 PR。

我们还包含了Perplexity 和 Cursor.sh 的提示模板,以方便搜索和 Markdown 表格格式化。

目录

  1. 数据管道
  2. 嵌入模型
  3. 向量数据库
  4. 游乐场
  5. 编排器
  6. API / 插件
  7. LLM 缓存
  8. 日志记录 / 监控 / 评估
  9. 验证器
  10. LLM API(专有)
  11. LLM API(开源)
  12. 应用托管平台
  13. 云服务商
  14. 特定场景云

项目列表

数据管道

名称(网站) 描述 Github Pip 安装数
Databricks 一个统一的数据平台,用于构建、部署和维护企业级数据解决方案,包括专为 AI 打造的产品(如 MosaicML 和 MLflow)
Airflow 一个数据管道框架,用于以编程方式编写、调度和监控数据管道及工作流,包括针对 LLM 的管道
Unstructured.io 开源组件,用于预处理 PDF、HTML 和 Word 文档等文件,以便在 LLM 应用中使用
Fivetran 一个从各种来源提取、加载和转换数据的平台,用于分析、AI 和运营
Airbyte 一个开源的数据集成引擎,帮助将数据整合到数据仓库、数据湖和数据库中
Anyscale 一个 AI 计算平台,允许开发者使用 Ray 扩展数据摄取、预处理、嵌入和推理计算
Alluxio 一个位于计算与存储交汇处的开源数据平台,使数据更接近计算资源,从而加速模型训练和推理,提高 GPU 利用率,并降低 AI 工作负载的成本 GitHub Repo stars PyPI - Downloads

^ 返回目录 ^

嵌入模型

名称(网站) 描述 Github Pip 安装数
OpenAI Ada Embedding 2 OpenAI 最流行的嵌入模型,用于捕捉文本中的语义关系
Cohere AI 一家独立的商业 LLM 提供商,特别专注于用于语义搜索、主题聚类和垂直应用的嵌入
Sentence Transformers 一个开源的 Python 框架,用于句子、文本和图像的嵌入

^ 返回目录 ^

向量数据库

名称(网站) 描述 Github Pip 安装
Pinecone 一款托管的云原生向量数据库,提供简洁的 API,适用于高性能 AI 应用 n/a
Weaviate 一个开源的向量数据库,可同时存储对象和向量
ChromaDB 面向开发者的、原生支持 AI 的开源嵌入式数据库平台
Pgvector 一个用于 Postgres 的开源向量相似度搜索工具,支持精确和近似最近邻搜索
Zilliz (Milvus) 一个开源的向量数据库,专为开发和维护 AI 应用而设计
Qdrant 一个向量数据库及向量相似度搜索引擎
Metal io 为开发者提供构建使用机器学习嵌入的应用程序的托管服务 N/A
LanceDB 一款面向 AI 应用的无服务器向量数据库

^ 返回目录 ^

Playground 平台

名称(网站) 描述 Github Pip 安装
OpenAI Playground 一个基于网页的平台,用于试验 OpenAI 开发的各种机器学习模型 N/A N/A
nat.dev 一个允许用户测试多种语言模型的提示并比较其性能的平台
Humanloop 一个帮助开发者在 LLM 基础上构建应用的平台
Parea AI 一个为 AI 工程师提供的平台和 SDK,包含 LLM 评估、可观性以及版本控制增强型提示 Playground 等工具。

^ 返回目录 ^

编排工具

名称(站点) 描述 Github Pip 安装
Langchain 一个开源库,为开发者提供构建由大语言模型驱动的应用程序所需的工具
LlamaIndex 面向大语言模型应用的数据框架,用于摄取、结构化和访问私有或领域特定数据
Autogen 一个框架,用于通过可定制、可对话的代理来自动化和简化复杂 AI 应用中的大语言模型工作流
Microsoft Semantic Kernel 一个轻量级的开源编排 SDK
Haystack 大语言模型编排框架,用于构建可定制、生产就绪的大语言模型应用
Vercel AI SDK 一个开源库,供开发者使用 JavaScript 和 TypeScript 构建流式 UI (node/npm)
Vectara AI 一个利用您自有数据进行 AI 对话的搜索与发现平台
ChatGPT 一个使用自然语言处理技术生成类人对话的 AI 聊天机器人

^ 返回目录 ^

API / 插件

名称(站点) 描述 Github Pip 安装
Serp API 一个实时 API,用于访问 Google 搜索结果,并处理代理、解决验证码以及解析结构化数据
Wolfram Alpha API 一个基于 Web 的 API,提供计算和展示功能,可用于集成到各种应用程序中
Zapier API AI 插件 一个插件,允许您连接 5,000 多个应用,并在 ChatGPT 内部直接与它们交互

^ 返回目录 ^

LLM 缓存

名称(站点) 描述 Github Pip 安装
Redis 一个内存中的数据结构存储,可用作数据库、缓存、消息代理和流媒体引擎
SQLite 一个自包含、无服务器、零配置的事务性 SQL 数据库引擎
GPTCache 一个开源工具,通过实现缓存来存储响应,从而提高基于 GPT 的应用程序的效率和速度

^ 返回目录 ^

日志记录 / 监控 / 评估

名称(站点) 描述 Github Pip 安装
Braintrust Data 一个 AI 产品栈,提供评估、提示词游乐场、持续集成、数据集管理等功能,并通过单一 API 访问多种 AI 模型
Arize AI 面向 LLM 和监督式机器学习的可观测性平台
Weights & Biases 用于简化机器学习工作流的 MLOps 平台
MLflow 简化机器学习开发的平台
PromptLayer 用于跟踪、管理和共享 LLM 提示工程的平台
Helicone 开源的 LLM 可观测性平台
Quotient AI Quotient AI 是一个在研究、开发和生产过程中,基于真实用例评估 AI 产品的平台
Portkey AI 用于开发、上线、维护和迭代生成式 AI 应用及功能的平台
Freeplay AI 为客户原型设计、测试和优化 LLM 功能的平台
Gentrace 用于评估和观测生成式数据的 API 和 SDK,具备 AI、启发式及人工评分等评估功能,以及生产数据观测能力
Patronus AI 面向 LLM 的自动化评估与基准测试平台,提供在真实场景中测试、打分和评估 LLM 的工具
Autoblocks AI 专为 GenAI 产品快速迭代设计的协作式云工作空间,提供提示词管理、可观测性、持续评估、微调、原型设计、调试以及可扩展的数据摄取与搜索等功能,且不依赖特定提供商
Context AI 用于 LLM 上线前评估和上线后分析的工具,包括测试、性能监控、用户对话分析等功能,并支持多种模型和库
E2b dev 提供部署、测试和监控 AI 代理的服务,包含一个安全、持久运行的云端沙盒环境,适用于多种 LLM,并具备访问互联网等功能
Agentops 用于评估和开发 AI 代理的工具包,提供代理开发工具、监控功能和回放分析
Zenoml AI 评估平台,支持数据可视化、模型性能分析以及针对不同类型数据创建交互式报告
Baserun 提供模型配置、提示词游乐场、监控和原型工作流等工具,同时具备对 LLM 工作流的全面可见性和端到端测试功能
WhyLabs 面向 ML 和 GenAI 的 AI 可观测性平台,包括 LLM 监控、护栏和安全性
Log10 基于 AI 的 LLMOps 平台,可自动优化提示词和模型,并内置日志记录、调试、指标、反馈、评估和微调功能

promptfoo 开源的 LLM 评估框架,支持模型/提示词/RAG 评估、数据集生成、本地模型和自托管。 (node/npm)
Parea AI 为 AI 工程师提供的平台和 SDK,包含 LLM 评估、可观测性以及版本控制增强版提示词游乐场等工具。
Galileo Galileo 是一个基于高精度幻觉防护机制的评估、微调和实时可观测性平台。

^ 返回目录 ^

验证工具

名称(站点) 描述 Github Pip 安装
Guardrails AI 一个开源的 Python 包,用于指定结构和类型、验证并纠正大语言模型的输出
Rebuff 一个开源框架,旨在检测并防御大语言模型应用中的提示注入攻击
Microsoft Guidance 一种用于控制大语言模型的指导语言,提供了一种用于构建大语言模型工作流的语法
LMQL 一个开源的编程语言和平台,用于与语言模型交互
Outlines 一个工具,帮助开发者引导文本生成,以构建与外部系统的健壮接口,并确保输出符合正则表达式或 JSON 模式
LLM Guard 一个开源的综合性工具,旨在加强大型语言模型(LLMs)的安全性。

^ 返回目录 ^

大语言模型 API(专有)

名称(站点) 描述 Github Pip 安装
OpenAI 一家提供众多领先大语言模型的公司,包括 GPT-3.5 和 GPT-4 系列 不适用
Anthropic Claude 的开发者,Claude 是基于 Anthropic 研究成果的人工智能助手 不适用
Cohere AI 一家专注于语义搜索、主题聚类和垂直应用嵌入的大语言模型供应商
LLM 一个 CLI 工具和 Python 库,用于通过远程 API 或可在本地安装运行的模型与大语言模型进行交互。

^ 返回目录 ^

大语言模型 API(开源)

名称(站点) 描述 Github Pip 安装
Hugging Face 一个开源人工智能模型和推理端点的枢纽,包括领先的基座大语言模型以及 LoRA 微调模型
Replicate 一个 AI 托管平台和模型推理枢纽,允许软件开发者将 AI 模型集成到他们的应用程序中
Anyscale 一个 AI API 和计算平台,允许开发者使用 Ray 将任何模型的推理、训练和嵌入计算进行扩展
Ollama 在本地快速启动和运行大型语言模型
GPT4ALL 一个开源的边缘计算大型语言模型生态系统。

^ 返回目录 ^

应用托管平台

名称(网站) 描述
Vercel 一个专为前端工程师设计的云平台,提供对大型语言模型应用的一流支持
Netlify 一家企业级云计算公司,提供用于构建 Web 应用和动态网站的开发平台
Steamship 一个用于 AI 代理和工具的 SDK 及托管平台,既是包管理器,也是 AI 相关包的托管服务
Streamlit 一个开源 Python 库,旨在创建和分享面向机器学习与数据科学的自定义 Web 应用
Modal 一个平台,允许使用 Modal Python 包运行分布式应用程序

^ 返回目录 ^

云服务提供商

名称(网站) 描述
亚马逊网络服务 一个云计算平台,通过全球数据中心提供各类服务
谷歌云平台 一个云计算平台,通过全球数据中心提供各类服务
微软 Azure 一个云计算平台,通过全球数据中心提供各类服务
CoreWeave 一家专注于提供 GPU 资源的云服务商,基于灵活的部署基础设施

^ 返回目录 ^

特色云平台

名称(网站) 描述
Databricks (MosaicML) Databricks 于 2023 年收购了 Mosaic ML,及其用于高效预训练、微调和推理大型语言模型的工具与平台
Anyscale 一个 AI 计算平台,使开发者能够利用 Ray 框架扩展任何模型的推理、训练和嵌入计算
Modal 一个平台,允许使用 Modal Python 包运行分布式应用程序
Runpod 一个专为 AI 和机器学习应用设计的云计算平台
OctoML 一种计算服务,允许用户运行、调优并扩展生成式模型
Baseten 一个推理服务,允许用户部署、服务和扩展自定义及开源模型
E2B 专为 AI 代理和 AI 应用打造的安全沙箱云环境

^ 返回目录 ^




格式化提示模板

我们已经部分实现了自动化——尤其是查找 GitHub 和 PyPI 链接——借助这个 Perplexity 搜索提示。该方法大约 75% 的时间有效,每次可处理约 3 个项目,每次迭代从 20 到 30 个来源提取数据。

image

一旦你收集到想要添加的数据,如果不想手动处理 Markdown 格式,可以使用像 Cursor 这样的工具轻松完成格式化。

请参阅以下可在编辑时直接使用的提示:只需高亮显示 4–5 个之前的示例,Cursor 就能自动推断出正确的格式:

image

^ 返回目录 ^

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手,旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚,能够直接接入你日常使用的各类通讯渠道,包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息,OpenClaw 都能即时响应,甚至支持在 macOS、iOS 和 Android 设备上进行语音交互,并提供实时的画布渲染功能供你操控。 这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地,用户无需依赖云端服务即可享受快速、私密的智能辅助,真正实现了“你的数据,你做主”。其独特的技术亮点在于强大的网关架构,将控制平面与核心助手分离,确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者,以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力(支持 macOS、Linux 及 Windows WSL2),即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

349.3k|★★★☆☆|2周前
Agent开发框架图像

n8n

n8n 是一款面向技术团队的公平代码(fair-code)工作流自动化平台,旨在让用户在享受低代码快速构建便利的同时,保留编写自定义代码的灵活性。它主要解决了传统自动化工具要么过于封闭难以扩展、要么完全依赖手写代码效率低下的痛点,帮助用户轻松连接 400 多种应用与服务,实现复杂业务流程的自动化。 n8n 特别适合开发者、工程师以及具备一定技术背景的业务人员使用。其核心亮点在于“按需编码”:既可以通过直观的可视化界面拖拽节点搭建流程,也能随时插入 JavaScript 或 Python 代码、调用 npm 包来处理复杂逻辑。此外,n8n 原生集成了基于 LangChain 的 AI 能力,支持用户利用自有数据和模型构建智能体工作流。在部署方面,n8n 提供极高的自由度,支持完全自托管以保障数据隐私和控制权,也提供云端服务选项。凭借活跃的社区生态和数百个现成模板,n8n 让构建强大且可控的自动化系统变得简单高效。

184.7k|★★☆☆☆|今天
数据工具开发框架Agent

AutoGPT

AutoGPT 是一个旨在让每个人都能轻松使用和构建 AI 的强大平台,核心功能是帮助用户创建、部署和管理能够自动执行复杂任务的连续型 AI 智能体。它解决了传统 AI 应用中需要频繁人工干预、难以自动化长流程工作的痛点,让用户只需设定目标,AI 即可自主规划步骤、调用工具并持续运行直至完成任务。 无论是开发者、研究人员,还是希望提升工作效率的普通用户,都能从 AutoGPT 中受益。开发者可利用其低代码界面快速定制专属智能体;研究人员能基于开源架构探索多智能体协作机制;而非技术背景用户也可直接选用预置的智能体模板,立即投入实际工作场景。 AutoGPT 的技术亮点在于其模块化“积木式”工作流设计——用户通过连接功能块即可构建复杂逻辑,每个块负责单一动作,灵活且易于调试。同时,平台支持本地自托管与云端部署两种模式,兼顾数据隐私与使用便捷性。配合完善的文档和一键安装脚本,即使是初次接触的用户也能在几分钟内启动自己的第一个 AI 智能体。AutoGPT 正致力于降低 AI 应用门槛,让人人都能成为 AI 的创造者与受益者。

183.6k|★★★☆☆|今天
Agent语言模型插件

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。

162.1k|★★★☆☆|2周前
开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上

161.7k|★★☆☆☆|今天
开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。

109.2k|★★☆☆☆|2天前
开发框架图像Agent