llm-foundry

4.4k 587 中等 1 次阅读 2天前Apache-2.0语言模型开发框架

AI 解读由 AI 自动生成，仅供参考

llm-foundry 是 Databricks Mosaic 团队开源的一套大语言模型（LLM）训练与部署代码库，旨在帮助用户高效地从头训练、微调、评估及部署基础模型。它解决了大模型开发中流程复杂、资源利用率低以及难以复现前沿技术的痛点，让开发者能够快速验证最新的研究成果。

这套工具非常适合 AI 研究人员、算法工程师以及希望构建自定义大模型的企业开发团队使用。无论是想训练参数量从 1.25 亿到 700 亿不等的模型，还是进行推理优化，llm-foundry 都提供了完整的脚本和模块化支持。其核心技术亮点在于深度集成了 Composer 训练框架，支持 Flash Attention 以提升计算效率，利用 ALiBi 技术实现上下文长度的灵活扩展，并有效缓解训练过程中的损失尖峰问题。此外，它还孕育了著名的 MPT 系列模型和先进的 DBRX 混合专家（MoE）架构。通过 llm-foundry，用户不仅能轻松处理数据预处理和模型转换，还能在学术基准或自定义任务上进行严谨评估，是探索大模型技术不可或缺的实用利器。

使用场景

某金融科技公司的大模型团队需要在私有云环境中，基于海量内部合规文档训练一个具备长上下文理解能力的专属客服模型。

没有 llm-foundry 时

数据预处理繁琐：团队需手动编写复杂的 ETL 脚本将原始文本转换为模型可接受的格式，缺乏统一的 StreamingDataset 支持，导致数据加载成为训练瓶颈。
训练稳定性差：在尝试复现 Flash Attention 或 ALiBi 等先进架构时，常因代码兼容性问题遭遇损失值尖峰（loss spikes），甚至导致训练中途崩溃。
资源利用率低：缺乏专业的性能分析工具，难以定位多卡训练中的通信瓶颈，昂贵的 GPU 集群实际算力利用率（MFU）长期徘徊在低位。
评估流程割裂：模型训练完成后，需额外开发脚本才能进行学术基准测试或自定义任务评估，迭代反馈周期长达数天。

使用 llm-foundry 后

数据流水线标准化：直接利用内置的 data_prep 脚本，一键将异构文本数据高效转换为优化的 StreamingDataset 格式，大幅缩短数据准备时间。
训练高效且稳定：开箱即用地集成 Flash Attention 和 ALiBi 技术，配合内置的稳定性优化策略，轻松训练出支持 8k+ 上下文的 MPT 模型且无损失震荡。
极致性能调优：通过自带的基准测试脚本实时监控吞吐量与 MFU，快速识别并解决性能瓶颈，使集群算力利用率显著提升。
全流程闭环：在同一框架下完成从训练、微调到基于学术/自定义任务的自动化评估，将模型迭代周期从“天”级压缩至“小时”级。

llm-foundry 通过提供一站式、高稳定性的训练基础设施，让企业能够以最低的工程成本快速构建并部署生产级大语言模型。

运行环境要求

操作系统

Linux

GPU

训练必需 NVIDIA GPU (已测试 A100-40GB/80GB, H100-80GB)
推理可能支持消费级 NVIDIA 或 AMD 显卡但未积极测试
CUDA 版本需 12.8

内存

未说明

依赖

notes强烈建议使用官方提供的 Docker 镜像 (mosaicml/llm-foundry) 进行部署，镜像已预装大部分依赖但需单独 pip install llm-foundry。若不使用 Docker，需手动安装 Flash Attention 和 TransformerEngine 以支持 H100 的 FP8 特性。代码库主要基于 PyTorch 2.7.0 和 CUDA 12.8 在 A100/H100 上测试通过。

python3.12

torch==2.7.0

cmake

packaging

flash-attn

transformerengine

快速开始

LLM Foundry

本仓库包含使用 Composer 和 MosaicML 平台进行 LLM 训练、微调、评估及推理部署的相关代码。该代码库设计简洁易用、高效且灵活，可帮助用户快速尝试最新的技术方法。

在本仓库中，您将找到：

llmfoundry/ - 模型、数据集、回调函数、工具等源代码
scripts/ - 用于运行 LLM 工作负载的脚本
- data_prep/ - 将原始文本数据转换为 StreamingDataset 格式
- train/ - 训练或微调 HuggingFace 和 MPT 模型，参数规模从 1.25 亿到 700 亿不等
  - train/benchmarking - 用于性能分析训练吞吐量和 MFU
- inference/ - 将模型转换为 HuggingFace 或 ONNX 格式，并生成响应
  - inference/benchmarking - 用于评估推理延迟和吞吐量
- eval/ - 在学术（或自定义）上下文学习任务上评估 LLM
mcli/ - 使用 MCLI 和 MosaicML 平台启动上述各类工作负载
TUTORIAL.md - 对本仓库的深入介绍、示例工作流及常见问题解答

DBRX

DBRX 是由 Databricks Mosaic 团队训练的最先进开源 LLM。它采用专家混合（MoE）架构，并基于优化后的 Composer、LLM Foundry 和 MegaBlocks 进行训练。该模型总参数量为 1320 亿，活跃参数量为 360 亿。我们已发布了两款 DBRX 模型：

模型	上下文长度	下载
DBRX Base	32768	https://huggingface.co/databricks/dbrx-base
DBRX Instruct	32768	https://huggingface.co/databricks/dbrx-instruct

我们的模型权重和代码对研究人员及商业实体均开放许可。Databricks 开源许可证可在 LICENSE 中找到，其可接受使用政策则可在此处查阅：这里。

有关 DBRX 模型的更多信息，请参阅 https://github.com/databricks/dbrx。

MPT

Mosaic 预训练 Transformer（MPT）是一系列 GPT 风格的模型，具备多项特色功能——高效的 Flash Attention、支持长上下文外推的 ALiBi 机制，以及用于缓解损失骤增的稳定性改进。作为 MosaicML Foundation 系列的一部分，我们已开源了多款 MPT 模型：

模型	上下文长度	下载	是否可用于商业用途？
MPT-30B	8192	https://huggingface.co/mosaicml/mpt-30b	是
MPT-30B-Instruct	8192	https://huggingface.co/mosaicml/mpt-30b-instruct	是
MPT-30B-Chat	8192	https://huggingface.co/mosaicml/mpt-30b-chat	否
MPT-7b-8k	8192	https://huggingface.co/mosaicml/mpt-7b-8k	是
MPT-7b-8k-Chat	8192	https://huggingface.co/mosaicml/mpt-7b-8k-chat	否
MPT-7B	2048	https://huggingface.co/mosaicml/mpt-7b	是
MPT-7B-Instruct	2048	https://huggingface.co/mosaicml/mpt-7b-instruct	是
MPT-7B-Chat	2048	https://huggingface.co/mosaicml/mpt-7b-chat	否
MPT-7B-StoryWriter	65536	https://huggingface.co/mosaicml/mpt-7b-storywriter	是

如需在本地试用这些模型，请按照 scripts/inference/README.md 中的说明，使用我们的 hf_generate.py 或 hf_chat.py 脚本，通过 HF 模型进行交互式生成。

MPT 社区

社区为 MPT 所做的精彩工作让我们倍感振奋！以下是我们整理的一些相关链接：

ReplitLM：replit-code-v1-3b 是一款专注于代码补全的 27 亿参数因果语言模型。该模型基于 Stack Dedup v1.2 数据集的一个子集进行训练，涵盖 Java、Python、C++ 等 20 种编程语言。
LLaVa-MPT：通过视觉指令微调，使 MPT 具备多模态能力。
ggml：针对消费级硬件优化的 MPT 版本，可实现高效推理。
GPT4All：一款可在本地运行的聊天系统，现已支持 MPT！
Q8MPT-Chat：由英特尔团队开发的 8 位优化版 MPT，专为 CPU 设计。

社区分享的教学视频：

如果您发现遗漏的内容，欢迎提交 PR 参与贡献！

硬件与软件要求

该代码库已在配备NVIDIA A100和H100显卡的PyTorch 2.4环境中进行了测试。此代码库也可能在搭载其他设备的系统上运行，例如消费级NVIDIA显卡和AMD显卡，但我们目前并未积极测试这些系统。如果您在其他系统上成功或失败地使用LLM Foundry，请通过Github问题告知我们，我们将更新支持矩阵！

设备	Torch版本	CUDA版本	状态
A100-40GB/80GB	2.7.0	12.8	:white_check_mark: 支持
H100-80GB	2.7.0	12.8	:white_check_mark: 支持

MosaicML Docker镜像

我们强烈建议使用我们预构建的Docker镜像。您可以在以下地址找到它们：https://hub.docker.com/orgs/mosaicml/repositories。

mosaicml/pytorch镜像固定了特定的PyTorch和CUDA版本，稳定且很少更新。

mosaicml/llm-foundry镜像则会在每次向main分支提交时生成新的标签。您可以选择特定的提交哈希，如mosaicml/llm-foundry:2.7.0_cu128-9867a7b，也可以使用最新的版本mosaicml/llm-foundry:2.7.0_cu128-latest。

请注意： mosaicml/llm-foundry镜像并未预装llm-foundry包，仅安装了依赖项。您仍需从PyPi或源码中执行pip install llm-foundry。

Docker镜像	Torch版本	CUDA版本	是否已安装LLM Foundry依赖？
`mosaicml/pytorch:2.7.0_cu128-python3.12-ubuntu22.04`	2.7.0	12.8（Infiniband）	否
`mosaicml/llm-foundry:2.7.0_cu128-latest`	2.7.0	12.8（Infiniband）	是
`mosaicml/llm-foundry:2.7.0_cu128_aws-latest`	2.7.0	12.8（EFA）	是

安装

此处假设您已安装PyTorch、CMake和packaging。若未安装，可通过pip install cmake packaging torch进行安装。

要开始使用，首先克隆仓库并设置环境。具体步骤会因您是否使用Docker而略有不同。

使用Docker（推荐）

我们强烈建议在Docker容器内使用LLM Foundry（请参阅上方推荐的Docker镜像）。若您决定这样做，请按照以下步骤克隆仓库并安装所需依赖。

git clone https://github.com/mosaicml/llm-foundry.git
cd llm-foundry
pip install -e ".[gpu]"  # 或者如果无NVIDIA GPU，则使用`pip install -e .`

不使用Docker（不推荐）

如果您选择不使用Docker，则应创建并使用虚拟环境。

git clone https://github.com/mosaicml/llm-foundry.git
cd llm-foundry

# 创建并激活虚拟环境
python3 -m venv llmfoundry-venv
source llmfoundry-venv/bin/activate

pip install cmake packaging torch  # setup.py需要这些包

pip install -e ".[gpu]"  # 或者如果无NVIDIA GPU，则使用`pip install -e .`

TransformerEngine与amp_fp8支持

NVIDIA H100显卡支持FP8；我们在Docker镜像中已安装Flash Attention和Transformer（见上文）。若您未使用我们的Docker镜像，可按如下方式安装这些包：

pip install flash-attn --no-build-isolation
pip install git+https://github.com/NVIDIA/TransformerEngine.git@stable

有关启用TransformerEngine层和amp_fp8的更多详细信息，请参阅此处。

AMD（测试版支持）

根据我们对AMD GPU的测试结果（详见这里），环境设置包括：

git clone https://github.com/mosaicml/llm-foundry.git
cd llm-foundry

# 创建并激活虚拟环境
python3 -m venv llmfoundry-venv-amd
source llmfoundry-venv-amd/bin/activate

# 安装
pip install cmake packaging torch
pip install -e .  # 这会安装一些不必要的东西，但不会造成影响
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/rocm5.4.2

最后，还需安装支持ROCm的flash attention（安装说明在此）。

注意事项：

目前我们尚未有所有组件完美兼容的Docker镜像。您可能需要调整某些包的版本（例如，在我们的案例中，曾将numpy降级至1.23.5），才能确保一切正常运行。

Intel Gaudi

LLM Foundry对Intel Gaudi设备的支持尚处于实验阶段，请使用habana_alpha分支，并参考该分支的README文件，其中包含安装说明及已知问题。

关于Intel Gaudi2加速器在训练与推理方面的性能结果，请参阅我们的博客：https://www.databricks.com/blog/llm-training-and-inference-intel-gaudi2-ai-accelerators

快速入门

注意请务必先完成上述安装步骤，再尝试快速入门！

以下是准备 C4 数据集子集、训练一个 MPT-125M 模型 10 个批次、将模型转换为 HuggingFace 格式、在 Winograd 挑战上评估模型，并生成提示响应的端到端工作流。

(请记住，这只是用于演示工具的快速入门——要获得高质量的结果，LLM 至少需要训练超过 10 个批次 😄)

cd scripts

# 将 C4 数据集转换为 StreamingDataset 格式
python data_prep/convert_dataset_hf.py \
  --dataset allenai/c4 --data_subset en \
  --out_root my-copy-c4 --splits train_small val_small \
  --concat_tokens 2048 --tokenizer EleutherAI/gpt-neox-20b --eos_text '<|endoftext|>'

# 训练一个 MPT-125m 模型，共 10 个批次
composer train/train.py \
  train/yamls/pretrain/mpt-125m.yaml \
  variables.data_local=my-copy-c4 \
  train_loader.dataset.split=train_small \
  eval_loader.dataset.split=val_small \
  max_duration=10ba \
  eval_interval=0 \
  save_folder=mpt-125m

# 将模型转换为 HuggingFace 格式
python inference/convert_composer_to_hf.py \
  --composer_path mpt-125m/ep0-ba10-rank0.pt \
  --hf_output_path mpt-125m-hf \
  --output_precision bf16 \
  # --hf_repo_for_upload user-org/repo-name

# 在部分任务子集上评估模型
composer eval/eval.py \
  eval/yamls/hf_eval.yaml \
  icl_tasks=eval/yamls/copa.yaml \
  model_name_or_path=mpt-125m-hf

# 生成提示响应
python inference/hf_generate.py \
  --name_or_path mpt-125m-hf \
  --max_new_tokens 256 \
  --prompts \
    "生命、宇宙以及幸福的答案是" \
    "这里有一个快速烘焙巧克力曲奇饼干的食谱：首先"

注意：上述用于训练模型的 composer 命令指的是 Composer 库中的分布式启动器。

如果你拥有可写权限的 HuggingFace 认证令牌，你还可以选择将你的模型上传到 Hub！只需按如下方式导出你的令牌：

export HF_TOKEN=your-auth-token

然后取消注释上面调用 inference/convert_composer_to_hf.py 中包含 --hf_repo_for_upload ... 的那一行。

注册表

你可以使用注册表来自定义你的工作流程，而无需分叉该库。LLM Foundry 的一些组件是可以注册的，例如模型、日志记录器和回调函数。这意味着你可以为这些组件注册新的选项，然后在你的 YAML 配置中使用它们。

发现可注册的组件

为了帮助查找和理解可注册的组件，你可以使用 llmfoundry registry CLI 命令。

目前我们提供了两个命令：

llmfoundry registry get [--group]：列出所有注册表及其组件，也可以选择指定某个特定的注册表。示例用法：llmfoundry registry get --group loggers 或 llmfoundry registry get
llmfoundry registry find <group> <name>：获取关于特定已注册组件的信息。示例用法：llmfoundry registry find loggers wandb

对于这些命令中的任何一个，都可以使用 --help 查看更多信息。

这些命令还可以帮助你了解每个注册表的具体组成，因为每个注册表都包含一段文档字符串，会在打印时显示出来。其基本概念是，每个注册表定义了一个接口，而注册到该注册表的组件必须实现这个接口。如果当前库中存在某些无法扩展的部分，但你认为应该可以扩展，请提交一个问题！

如何注册

有几种方法可以注册一个新的组件：

Python 入口点

如果你正在构建一个包含注册组件的自有包，可以通过 Python 入口点来指定注册的组件。这通常是当你计划对 LLM Foundry 进行大规模扩展并覆盖许多组件时的预期用法。需要注意的是，通过入口点注册的内容会覆盖直接在代码中注册的组件。

例如，以下内容将在 llm_foundry.loggers 注册表中以 my_logger 为键注册 MyLogger 类：

[build-system]
requires = ["setuptools>=42", "wheel"]
build-backend = "setuptools.build_meta"

[project]
name = "foundry_registry"
version = "0.1.0"
dependencies = [
    "mosaicml",
    "llm-foundry",
]

# 注意：尽管在 Python 代码中应为 llmfoundry.registry.loggers，
# 但在 entry_points 中必须写成 "llmfoundry_loggers"。也就是说，
# 名称各部分之间需要用下划线连接，在 entry_points 部分也是如此。
[project.entry-points."llmfoundry_loggers"]
my_logger = "foundry_registry.loggers:MyLogger"

如果通过入口点开发新组件，需要注意的是，Python 入口点在整个 Python 环境中是全局的。这意味着，如果有多个包使用相同的键注册组件，最后安装的那个包所使用的组件将会生效。这在覆盖 LLM Foundry 中的组件时非常有用，但也可能因疏忽而导致意外行为。此外，如果你修改了 pyproject.toml 文件，就需要重新安装该包才能使更改生效。你可以通过运行 pip install -e . --no-deps 来快速完成这一操作，从而避免重新安装依赖项。

直接调用注册

你也可以直接在代码中注册一个组件：

from composer.loggers import LoggerDestination
from llmfoundry.registry import loggers

class MyLogger(LoggerDestination):
    pass

loggers.register("my_logger", func=MyLogger)

装饰器

你还可以使用装饰器直接从代码中注册组件：

from composer.loggers import LoggerDestination
from llmfoundry.registry import loggers

@loggers.register("my_logger")
class MyLogger(LoggerDestination):
    pass

无论是直接调用还是使用装饰器的方法，如果你使用 LLM Foundry 的训练/评估脚本，都需要提供 code_paths 参数，即一个列表，其中包含了执行以注册你的组件所需的文件路径。例如，你可能有一个名为 foundry_imports.py 的文件，内容如下：

from foundry_registry.loggers import MyLogger
from llmfoundry.registry import loggers

loggers.register("my_logger", func=MyLogger)

然后你需要在你的 YAML 配置中为训练/评估脚本提供 code_paths：

...
code_paths:
  - foundry_imports.py
...

以上方法之一通常适用于你只对 LLM Foundry 进行小规模扩展，仅覆盖少数几个组件，因此不想创建整个包的情况。

了解更多关于 LLM Foundry 的信息！

请查看 TUTORIAL.md，继续学习如何使用 LLM Foundry。该教程重点介绍了示例工作流，引导您找到仓库中的其他资源，并解答了常见问题！

联系我们

如果您在使用代码时遇到任何问题，请直接向本仓库提交 GitHub 问题。

如果您希望在 MosaicML 平台上训练大语言模型，请通过 demo@mosaicml.com 与我们联系！

LLM Foundry 快速上手指南

LLM Foundry 是一个用于训练、微调、评估和部署大语言模型（LLM）的开源代码库，基于 Composer 构建。它支持从 1.25 亿到 700 亿参数的 HuggingFace 和 MPT 模型，并提供了 DBRX 和 MPT 系列模型的官方支持。

环境准备

系统要求

硬件: 推荐使用 NVIDIA A100 (40GB/80GB) 或 H100 (80GB) GPU。虽然可能在消费级 NVIDIA 显卡或 AMD 显卡上运行，但未经过官方全面测试。
软件版本:
- PyTorch: 2.7.0 (推荐)
- CUDA: 12.8
前置依赖: 需预先安装 cmake, packaging, torch。

Docker 环境（强烈推荐）

为了简化环境配置，建议使用官方预建的 Docker 镜像。

基础镜像: mosaicml/pytorch:2.7.0_cu128-python3.12-ubuntu22.04 (仅含依赖)
完整镜像: mosaicml/llm-foundry:2.7.0_cu128-latest (含 LLM Foundry 依赖，但仍需安装包本身)

注意：国内用户若拉取 Docker Hub 较慢，可配置阿里云、腾讯云等国内容器镜像加速器。

安装步骤

方式一：使用 Docker（推荐）

启动容器并挂载代码目录（示例）：

docker run --gpus all -it --rm -v $(pwd):/workspace mosaicml/llm-foundry:2.7.0_cu128-latest bash

在容器内克隆仓库并安装：

git clone https://github.com/mosaicml/llm-foundry.git
cd llm-foundry
# 可选：配置 pip 国内源加速安装
# pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple
pip install -e ".[gpu]"

(若无 NVIDIA GPU，请使用 pip install -e .)

方式二：本地环境安装（不推荐）

若不使用 Docker，请创建虚拟环境进行安装：

# 1. 克隆仓库
git clone https://github.com/mosaicml/llm-foundry.git
cd llm-foundry

# 2. 创建并激活虚拟环境
python3 -m venv llmfoundry-venv
source llmfoundry-venv/bin/activate

# 3. 安装基础依赖
pip install cmake packaging torch

# 4. 安装 LLM Foundry (建议配置国内 pip 源)
# pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple
pip install -e ".[gpu]"

可选：启用 FP8 支持 (仅限 H100)

如果未使用官方 Docker 镜像且需要在 H100 上启用 FP8 加速，需额外安装：

pip install flash-attn --no-build-isolation
pip install git+https://github.com/NVIDIA/TransformerEngine.git@stable

基本使用

LLM Foundry 提供了多种脚本用于数据处理、训练和推理。以下是最基础的本地交互式推理示例。

运行交互式生成 (Inference)

使用提供的脚本加载 HuggingFace 格式的模型（如 MPT-7B）并进行对话或文本生成。

单轮生成示例:

python scripts/inference/hf_generate.py \
    --model mosaicml/mpt-7b \
    --prompt "Hello, how are you?" \
    --max_new_tokens 100

交互式聊天示例:

python scripts/inference/hf_chat.py \
    --model mosaicml/mpt-7b-instruct

主要功能模块说明

数据准备: scripts/data_prep/ - 将原始文本转换为 StreamingDataset 格式。
训练/微调: scripts/train/ - 支持训练或微调 125M 至 70B 参数量的模型。
评估: scripts/eval/ - 在学术基准或自定义任务上评估模型性能。
MCLI 集成: 通过 mcli/ 目录可直接在 MosaicML 平台上启动大规模训练任务。

更多详细工作流和高级用法请参考项目根目录下的 TUTORIAL.md 文件。

版本历史

v0.22.02025/07/29

v0.21.02025/05/31

v0.20.02025/04/29

v0.19.02025/04/07

v0.18.02025/03/18

v0.17.12025/02/21

v0.17.02025/01/30

v0.16.02025/01/17

v0.15.12024/12/05

v0.15.02024/11/23

v0.14.52024/11/18

v0.14.42024/11/07

v0.14.32024/11/05

v0.14.22024/11/04

v0.14.12024/11/01

v0.14.02024/10/28

v0.13.12024/10/18

v0.13.02024/10/15

v0.12.02024/09/26

v0.11.02024/08/13

常见问题

MPT 模型是否支持 FasterTransformer？是否有相关的转换脚本？

如何使用本地数据集对 MPT 模型进行微调？需要转换为 HuggingFace 数据集格式吗？

使用 LION 优化器时损失函数无法收敛怎么办？

如何在 MPT-30B 中实现函数调用（Function Calling）支持？

相似工具推荐

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|今天

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 139k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 107.7k|★★☆☆☆|2天前

开发框架图像Agent

NextChat

NextChat 是一款轻量且极速的 AI 助手，旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性，以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发，NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言，它也提供了便捷的自托管方案，支持一键部署到 Vercel 或 Zeabur 等平台。 NextChat 的核心亮点在于其广泛的模型兼容性，原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型，让用户在一个界面即可自由切换不同 AI 能力。此外，它还率先支持 MCP（Model Context Protocol）协议，增强了上下文处理能力。针对企业用户，NextChat 提供专业版解决方案，具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能，满足公司对数据隐私和个性化管理的高标准要求。

★ 87.6k|★★☆☆☆|今天

开发框架语言模型

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。

★ 85k|★★☆☆☆|今天

图像数据工具视频

ragflow

RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。

★ 77.1k|★★★☆☆|昨天

Agent图像开发框架

使用场景

没有 llm-foundry 时

使用 llm-foundry 后

运行环境要求

快速开始

LLM Foundry

DBRX

MPT

MPT 社区

最新消息

硬件与软件要求

MosaicML Docker镜像

安装

使用Docker（推荐）

不使用Docker（不推荐）

TransformerEngine与amp_fp8支持

AMD（测试版支持）

Intel Gaudi

快速入门

注册表

发现可注册的组件

如何注册

Python 入口点

直接调用注册

装饰器

了解更多关于 LLM Foundry 的信息！

联系我们

LLM Foundry 快速上手指南

环境准备

系统要求

Docker 环境（强烈推荐）

安装步骤

方式一：使用 Docker（推荐）

方式二：本地环境安装（不推荐）

可选：启用 FP8 支持 (仅限 H100)

基本使用

运行交互式生成 (Inference)

主要功能模块说明

版本历史

常见问题

相似工具推荐

stable-diffusion-webui

everything-claude-code

ComfyUI

NextChat

ML-For-Beginners

ragflow