ALMA

584 43 中等 1 次阅读 2天前MIT语言模型

AI 解读由 AI 自动生成，仅供参考

ALMA 是一款基于大语言模型（LLM）的先进机器翻译系统，由约翰霍普金斯大学与微软联合研发。它致力于解决传统翻译模型在多语言场景下性能不足、尤其是低资源语言翻译质量不佳的难题。通过独特的“两阶段微调”策略，ALMA 先在单语数据上学习语言规律，再利用高质量平行语料进行优化，从而实现了卓越的翻译效果。

该项目已迭代至第三代 X-ALMA，支持从 6 种扩展至 50 种语言的互译，并在各类资源水平的语言上均保持顶尖性能。其核心技术亮点包括创新的“对比偏好优化（CPO）”算法，该方法无需依赖参考译文即可提升模型表现，性能可比肩甚至超越 GPT-4；以及 X-ALMA 采用的即插即用式语言模块架构和自适应拒绝偏好优化技术。

ALMA 非常适合自然语言处理研究人员、AI 开发者以及需要高质量多语言翻译解决方案的企业团队使用。无论是希望探索大模型翻译新范式的研究者，还是寻求部署高性能翻译引擎的工程师，都能从中获得强大的技术支持。目前，其核心算法已被国际顶级学术会议收录，并整合进主流开源社区，是构建下一代翻译系统的理想选择。

使用场景

一家跨国电商企业的本地化团队正急需将数万条包含大量行业术语和用户评论的英文产品描述，高质量地翻译成日语、阿拉语等小语种以拓展新兴市场。

没有 ALMA 时

小语种翻译质量差：通用大模型在低资源语言（如阿拉伯语、泰语）上表现不佳，常出现语法错误或文化语境误读，导致本地用户阅读困难。
专业术语不一致：模型缺乏针对特定领域（如电商、法律）的微调，同一术语在不同段落翻译不统一，需人工反复校对修正。
依赖昂贵 API 成本：为追求质量不得不调用 GPT-4 等商业接口，处理海量数据时 API 费用高昂且存在数据隐私泄露风险。
长尾语言支持缺失：传统机器翻译引擎往往只覆盖主流语言，难以一次性满足企业拓展 50+ 种语言的全球化战略需求。

使用 ALMA 后

小语种性能跃升：利用 X-ALMA 的自适应模块，即使在低资源语言上也能达到媲美母语者的流畅度，准确捕捉文化细微差别。
领域术语精准统一：通过“单语预训练 + 平行数据微调”的两阶段策略，ALMA 能深度理解电商语境，确保核心术语在全站内容中高度一致。
私有化部署降本增效：团队可直接部署开源的 ALMA-R 模型，利用 CPO 偏好优化技术在不依赖外部 API 的情况下超越 GPT-4 效果，大幅降低运营成本。
一站式多语言覆盖：借助 X-ALMA 对 50 种语言的广泛支持，无需为不同语系切换多个模型，一套架构即可支撑全球业务快速上线。

ALMA 通过先进的偏好优化与多语言架构，让企业在私有化环境下以低成本实现了覆盖全球 50 种语言的顶级翻译质量。

运行环境要求

操作系统

Linux

GPU

必需
支持 NVIDIA 和 AMD GPU
若使用 AMD 需安装 ROCm 版 torch
显存需求取决于模型大小：运行 X-ALMA-13B 或加载多语言模块（MoE 模式）需要大显存（建议 24GB+ 以支持 BF16/FP16 推理），较小模型或 LoRA 模式可降低需求

内存

未说明（建议根据模型参数量配置，13B 模型推荐 32GB+）

依赖

notes1. 项目提供三种代际模型（ALMA, ALMA-R, X-ALMA），其中 X-ALMA 支持 50 种语言。2. 若使用 AMD 显卡，必须先安装支持 ROCm 的 PyTorch 版本。3. 推荐使用 conda 创建名为 'xalma' 的虚拟环境。4. 部分功能（如 X-ALMA 的多语言模块动态加载）对显存要求极高。5. 训练和评估脚本依赖 DeepSpeed 配置文件。

python3.11

torch

transformers

peft

accelerate

deepspeed

快速开始

ALMA

ALMA：基于先进语言模型的翻译器

ALMA共有三代：ALMA（第一代）、ALMA-R（第二代）以及X-ALMA（第三代，全新！）。

ALMA（Advanced Language Model-based TrAnslator）是一种多对多的基于大语言模型的翻译模型，它采用了一种全新的翻译模型范式：先在单语数据上进行微调，再利用高质量的平行数据进一步优化。这一两步微调流程确保了强大的翻译性能。

ALMA-R 在ALMA模型的基础上，使用我们提出的**对比偏好优化（CPO）**进行了进一步的LoRA微调，而ALMA则采用了监督微调。CPO微调需要我们的三元组偏好数据来进行偏好学习。ALMA-R如今的表现可以媲美甚至超越GPT-4或WMT竞赛的冠军！

X-ALMA（全新！）将ALMA(-R)的支持语言从6种扩展到了50种，并且无论资源丰富程度如何，都能在50种不同的语言中保持顶尖的翻译性能。这是通过即插即用的语言特定模块架构以及精心设计的5步训练方案，结合新颖的自适应拒绝偏好优化方法实现的。

旧版ALMA仓库：

原始的ALMA仓库可以在这里找到：这里。
原始的ALMA-R仓库可以在这里找到：这里。

新闻 🌟

⭐ 2025年1月22日 X-ALMA 已被ICLR 2025 接受！

⭐ 2024年10月6日 X-ALMA 正式发布！请在此处查看论文以及模型和数据集。

⭐ 2024年6月20日我们要特别感谢SimPO，它与CPO共享类似的无参考偏好学习框架，但由于其特殊的长度归一化和目标奖励间隔，表现更加稳定。最令人兴奋的是，CPO和SimPO有可能结合使用！更多关于CPO-SimPO的信息，请参阅相关资料！

⭐ 2024年5月1日 CPO论文已被ICML 2024 接受！

⭐ 2024年3月22日 CPO方法现已合并至huggingface trl！详情请见此处。

⭐ 2024年1月16日 ALMA-R 正式发布！请参阅我们的新论文以获取更多详细信息：对比偏好优化：推动机器翻译中大语言模型性能的边界。

⭐ 2024年1月16日 ALMA论文：机器翻译的范式转变：提升大语言模型的翻译性能已被ICLR 2024 接受！更多详情请见此处！

目录 📄

下载ALMA模型和数据集
快速入门
环境设置
评估
训练
常见问题解答

:star: 支持事项 :star:

AMD和Nvidia显卡
数据并行评估
同时支持LLaMA-1、LLaMA-2、OPT、Faclon、BLOOM、MPT
LoRA微调
单语数据微调、平行数据微调

下载 ALMA 模型和数据集 🚀

我们发布了 ALMA 系列的七种翻译模型：

模型检查点已在 Hugging Face 上发布：

模型	基础模型链接	LoRA 链接
ALMA-7B (第一代)	haoranxu/ALMA-7B	-
ALMA-7B-LoRA (第一代)	haoranxu/ALMA-7B-Pretrain	haoranxu/ALMA-7B-Pretrain-LoRA
ALMA-7B-R (第二代)	haoranxu/ALMA-7B-R (LoRA 合并)	-
ALMA-13B-LoRA (第一代)	haoranxu/ALMA-13B	-
ALMA-13B-LoRA	haoranxu/ALMA-13B-Pretrain	haoranxu/ALMA-13B-Pretrain-LoRA
ALMA-13B-R (第二代)	haoranxu/ALMA-13B-R (LoRA 合并)	-
X-ALMA (全新，第三代)	X-ALMA 模型	-

请注意，ALMA-7B-Pretrain 和 ALMA-13B-Pretrain 并非翻译模型。它们仅经历了第一阶段的单语微调（7B 模型为 200 亿 token，13B 模型为 120 亿 token），应与其对应的 LoRA 模型结合使用。

我们还在 outputs 目录中提供了 ALMA-13B-LoRA 和 ALMA-13B-R 在 WMT'22 和 WMT'23 上的翻译结果。这些输出还包括我们的基线结果，可以直接访问并用于后续评估。

ALMA 和 ALMA-R 使用的数据集现在也已在 Hugging Face 上发布（全新！）：

数据集	训练 / 验证	测试
ALMA 人工编写的平行数据	平行训练和验证	WMT'22
ALMA-R 三元组偏好数据	三元组偏好数据	WMT'22 和 WMT'23
X-ALMA 数据	50 种语言平行数据和偏好数据	WMT'23 和 FLORES-200

快速入门

X-ALMA 采用即插即用架构，由基础模型和特定语言模块组成，每个模块可在不同语言组之间共享。有三种方式加载 X-ALMA 进行翻译。以下示例将“我爱机器翻译。”翻译成英语（X-ALMA 也可以进行多语言开放式问答）。

第一种方法：加载已将特定语言模块合并到基础模型中的合并模型（推荐）：

import torch
from transformers import AutoModelForCausalLM
from transformers import AutoTokenizer
from peft import PeftModel

GROUP2LANG = {
    1: ["da", "nl", "de", "is", "no", "sv", "af"],
    2: ["ca", "ro", "gl", "it", "pt", "es"],
    3: ["bg", "mk", "sr", "uk", "ru"],
    4: ["id", "ms", "th", "vi", "mg", "fr"],
    5: ["hu", "el", "cs", "pl", "lt", "lv"],
    6: ["ka", "zh", "ja", "ko", "fi", "et"],
    7: ["gu", "hi", "mr", "ne", "ur"],
    8: ["az", "kk", "ky", "tr", "uz", "ar", "he", "fa"],
}
LANG2GROUP = {lang: str(group) for group, langs in GROUP2LANG.items() for lang in langs}
group_id = LANG2GROUP["zh"]

model = AutoModelForCausalLM.from_pretrained(f"haoranxu/X-ALMA-13B-Group{group_id}", torch_dtype=torch.float16, device_map="auto")
tokenizer = AutoTokenizer.from_pretrained(f"haoranxu/X-ALMA-13B-Group{group_id}", padding_side='left')

# 将源句加入提示模板
prompt="将这段中文翻译成英文：\n中文：我爱机器翻译。\n英文："

# X-ALMA 需要聊天模板，而 ALMA 和 ALMA-R 则不需要。
chat_style_prompt = [{"role": "user", "content": prompt}]
prompt = tokenizer.apply_chat_template(chat_style_prompt, tokenize=False, add_generation_prompt=True)

input_ids = tokenizer(prompt, return_tensors="pt", padding=True, max_length=40, truncation=True).input_ids.cuda()

# 翻译
with torch.no_grad():
    generated_ids = model.generate(input_ids=input_ids, num_beams=5, max_new_tokens=20, do_sample=True，temperature=0.6，top_p=0.9)
outputs = tokenizer.batch_decode(generated_ids，skip_special_tokens=True)
print(outputs)

第二种方法：加载基础模型和特定语言模块（推荐）：

model = AutoModelForCausalLM.from_pretrained("haoranxu/X-ALMA-13B-Pretrain", torch_dtype=torch.float16，device_map="auto")
model = PeftModel.from_pretrained(model，f"haoranxu/X-ALMA-13B-Group{group_id}")
tokenizer = AutoTokenizer.from_pretrained(f"haoranxu/X-ALMA-13B-Group{group_id}", padding_side='left')

第三种方法：加载带有所有特定语言模块的基础模型，类似于 MoE 架构：（需要较大的 GPU 内存）

from modeling_xalma import XALMAForCausalLM
model = XALMAForCausalLM.from_pretrained("haoranxu/X-ALMA", torch_dtype=torch.float16，device_map="auto")
tokenizer = AutoTokenizer.from_pretrained("haoranxu/X-ALMA", padding_side='left')

# 添加 `lang="zh"`：指定语言，以指示模型在生成时使用哪个语言组进行第三次加载。
generated_ids = model.generate(input_ids=input_ids，num_beams=5，max_new_tokens=20，do_sample=True，temperature=0.6，top_p=0.9，lang="zh")

ALMA 和 ALMA-R 的翻译提示是：

将这段 <源语言名称> 翻译成 <目标语言名称>：
<源语言名称>： <源语言句子>
<目标语言名称>：

X-ALMA 的翻译提示是：

<s>[INST] 将这段 <源语言名称> 翻译成 <目标语言名称>：
<源语言名称>： <源语言句子>
<目标语言名称>： [/INST]

环境设置 🔧

conda create -n xalma python=3.11
conda activate xalma

如果您使用 AMD 显卡，请先安装支持 ROCm 的 PyTorch。

然后安装其他依赖项：

bash install_alma.sh

评估 💻

X-ALMA 评估

这是评估我们 X-ALMA 模型的快速入门指南。要为 FLORES-200 数据集生成英→捷克语和捷克语→英语两个方向的翻译结果，（如果您想评估 WMT'23 而不是 FLORES-200，只需添加 --override_test_data_path haoranxu/WMT23-Test 即可。）请运行以下命令。请注意，ALMA 和 ALMA-R 不需要启用 --chat_style，此选项仅适用于 X-ALMA。

accelerate launch --config_file configs/deepspeed_eval_config_bf16.yaml \
    run_llmmt.py \
    --model_name_or_path haoranxu/X-ALMA-13B-Group5 \
    --do_predict \
    --low_cpu_mem_usage \
    --language_pairs en-cs,cs-en \
    --mmt_data_path placeholder \
    --override_test_data_path haoranxu/FLORES-200 \
    --per_device_eval_batch_size 1 \
    --output_dir ./your_output_dir/ \
    --predict_with_generate \
    --max_new_tokens 256 \
    --max_source_length 256 \
    --bf16 \
    --seed 42 \
    --num_beams 5 \
    --overwrite_cache \
    --overwrite_output_dir \
    --chat_style # `--chat_style` 仅用于 X-ALMA。ALMA 和 ALMA-R 不需要启用 `--chat_style`

生成的输出将保存在 your_output_dir 目录中。英→捷克语方向的翻译文件名为 test-en-cs，而捷克语→英语方向的文件名为 test-cs-en。变量 ${test_pairs} 表示您希望评估的翻译方向，支持同时测试多个方向。例如，您可以使用 de-en,en-de,en-cs,cs-en。

更多关于评估 ALMA(-R) 的示例，请参阅 ./evals 文件夹下的内容：

请注意，这将执行由 DeepSpeed 支持的数据并行评估：即在每张可用的 GPU 上放置模型的完整副本，并将批次拆分到各 GPU 上，从而实现 K 张 GPU 的速度是单张 GPU 的 K 倍。对于 GPU 显存有限的用户，我们还提供另一种方法。用户可以添加 --multi_gpu_one_model 参数，以在多张 GPU 上分布式运行单个模型。请参阅 evals/alma_13b_r.sh 或 evals/*no_parallel 文件中的评估示例。

训练 🔥

在这里，我们将展示如何：

在 ALMA 模型基础上进行对比偏好优化（ALMA→ALMA-R）。
使用单语 OSCAR 数据对 LLaMA-2-7B 进行微调（阶段 1）。
在阶段 1 完成后，对人工编写的平行数据进行全权重和 LoRA 微调（阶段 2）。

请注意，我们不会公开 X-ALMA 的具体训练流程，因为这将涉及发布大量中间检查点，使整个过程过于复杂。

CPO 微调

要使用我们的三元组偏好数据运行 CPO 微调，请执行以下命令：

bash runs/cpo_ft.sh ${your_output_dir}

OSCAR 单语微调

要执行 OSCAR 单语微调，请使用以下命令：

bash runs/mono_ft.sh ${your_output_dir}

平行数据微调（全权重）

单语数据微调完成后，可以继续使用全权重方式对平行数据进行微调。请执行以下命令：

bash runs/parallel_ft.sh ${your_output_dir} $training_pairs$

其中 training_pairs 是您选择的翻译方向。默认为所有 10 个方向：de-en,cs-en,is-en,zh-en,ru-en,en-de,en-cs,en-is,en-zh,en-ru。

平行数据微调（LoRA）

在阶段 2 中，还可以选择使用 LoRA 方法对平行数据进行微调。为此，请执行以下命令：

bash runs/parallel_ft_lora.sh ${your_output_dir} $training_pairs$

常见问题 ❓

ALMA 和 ALMA-R 支持哪些语言方向？

目前，ALMA 支持 10 个方向：英语↔德语、英语↔捷克语、英语↔冰岛语、英语↔中文、英语↔俄语。不过，它也可能在其他方向上带来惊喜 :)

X-ALMA 支持哪些语言方向？

X-ALMA 支持 50 种语言和 98 个方向（包括以英语为源或目标的语言）：da,nl,de,is,no,sv,af,ca,ro,gl,it,pt,es,bg,mk,sr,uk,ru,id,ms,th,vi,mg,fr,hu,el,cs,pl,lt,lv,ka,zh,ja,ko,fi,et,gu,hi,mr,ne,ur,az,kk,ky,tr,uz,ar,he,fa。

我应该在阶段 1 的什么时候停止微调？

我们的 7B 和 13B 模型分别在 200 亿和 120 亿个标记上进行了预训练。然而，正如论文中所述，微调 10 亿个标记就能显著提升性能。完成 10 亿标记所需的步骤也取决于您的批量大小。在我们的案例中，批量大小计算如下：16 张 GPU × 4（每张 GPU 的批量大小）× 4（梯度累积步数）= 256。对于 512 的序列长度，我们需要大约 8,000 步来训练 10 亿个标记，计算公式为 10^9 / (256*512) ≈8000 步。不过，您也可以选择微调更多步数以获得更好的效果。

如何确定阶段 1 的混合概率？

有关阶段 1 混合概率选择的原因，请参阅论文附录 D.1！

参考文献

有关 ALMA 模型的更多详细信息，请参阅我们的论文或论文的摘要。

@inproceedings{
    xu2024a,
    title={机器翻译的范式转变：提升大型语言模型的翻译性能},
    author={Haoran Xu、Young Jin Kim、Amr Sharaf 和 Hany Hassan Awadalla},
    booktitle={第十二届国际表示学习会议},
    year={2024},
    url={https://openreview.net/forum?id=farT6XXntP}
}

此外，有关经过对比偏好优化的 ALMA-R 模型的更详细信息，请参阅论文。

@inproceedings{
    xu2024contrastive,
    title={对比偏好优化：推动大型语言模型在机器翻译中的性能边界},
    author={Haoran Xu、Amr Sharaf、Yunmo Chen、Weiting Tan、Lingfeng Shen、Benjamin Van Durme、Kenton Murray 和 Young Jin Kim},
    booktitle={第四十一届国际机器学习会议},
    year={2024},
    url={https://openreview.net/forum?id=51iwkioZpn}
}

有关 X-ALMA 的详细信息，请参阅最新的论文。

@inproceedings{
xu2025xalma,
title={X-{ALMA}：即插即用模块与自适应拒绝机制，实现大规模高质量翻译},
author={Haoran Xu、Kenton Murray、Philipp Koehn、Hieu Hoang、Akiko Eriguchi 和 Huda Khayrallah},
booktitle={第十三届国际表示学习会议},
year={2025},
url={https://openreview.net/forum?id=csbf1p8xUq}
}

ALMA / X-ALMA 快速上手指南

ALMA 系列是基于大语言模型（LLM）的先进翻译工具，包含三代模型：ALMA (第一代)、ALMA-R (第二代) 和 X-ALMA (第三代，支持 50 种语言)。本指南重点介绍最新的 X-ALMA 及其前代模型的快速部署与使用。

环境准备

系统要求

操作系统: Linux (推荐), macOS, Windows (需配置相应 CUDA/ROCm 环境)
GPU: 支持 NVIDIA (CUDA) 或 AMD (ROCm) 显卡
Python: 3.11 及以上版本
显存建议:
- 运行 7B 模型：建议 16GB+ 显存
- 运行 13B 模型：建议 24GB+ 显存
- 若使用 MoE 模式加载所有语言模块，需更大显存

前置依赖

确保已安装 conda 包管理器。若使用 AMD GPU，请先安装支持 ROCm 的 PyTorch 版本。

安装步骤

创建并激活虚拟环境

conda create -n xalma python=3.11
conda activate xalma

安装项目依赖 克隆仓库后，运行官方提供的安装脚本：
```
bash install_alma.sh
```
注：若国内网络下载依赖较慢，可手动配置 pip 镜像源（如清华源）后再运行脚本，或在脚本内替换 pip install 命令为 pip install -i https://pypi.tuna.tsinghua.edu.cn/simple ...。

基本使用

X-ALMA 采用“即插即用”架构，由基座模型和特定语言模块组成。以下展示如何使用 X-ALMA-13B 将中文翻译成英文。

代码示例

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer
from peft import PeftModel

# 定义语言组映射 (X-ALMA 将 50 种语言分为 8 个组)
GROUP2LANG = {
    1: ["da", "nl", "de", "is", "no", "sv", "af"],
    2: ["ca", "ro", "gl", "it", "pt", "es"],
    3: ["bg", "mk", "sr", "uk", "ru"],
    4: ["id", "ms", "th", "vi", "mg", "fr"],
    5: ["hu", "el", "cs", "pl", "lt", "lv"],
    6: ["ka", "zh", "ja", "ko", "fi", "et"],
    7: ["gu", "hi", "mr", "ne", "ur"],
    8: ["az", "kk", "ky", "tr", "uz", "ar", "he", "fa"],
}
LANG2GROUP = {lang: str(group) for group, langs in GROUP2LANG.items() for lang in langs}

# 获取中文所属的组 ID
group_id = LANG2GROUP["zh"]

# 方式一：加载已合并语言模块的模型（推荐，推理速度最快）
model = AutoModelForCausalLM.from_pretrained(
    f"haoranxu/X-ALMA-13B-Group{group_id}", 
    torch_dtype=torch.float16, 
    device_map="auto"
)
tokenizer = AutoTokenizer.from_pretrained(
    f"haoranxu/X-ALMA-13B-Group{group_id}", 
    padding_side='left'
)

# 构建提示词 (X-ALMA 需要使用 Chat Template)
prompt_text = "Translate this from Chinese to English:\nChinese: 我爱机器翻译。\nEnglish:"
chat_style_prompt = [{"role": "user", "content": prompt_text}]
prompt = tokenizer.apply_chat_template(chat_style_prompt, tokenize=False, add_generation_prompt=True)

# 编码输入
input_ids = tokenizer(prompt, return_tensors="pt", padding=True, max_length=40, truncation=True).input_ids.cuda()

# 生成翻译
with torch.no_grad():
    generated_ids = model.generate(
        input_ids=input_ids, 
        num_beams=5, 
        max_new_tokens=20, 
        do_sample=True, 
        temperature=0.6, 
        top_p=0.9
    )

outputs = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)
print(outputs)

提示词格式说明

不同代际的模型提示词格式略有不同，请注意区分：

ALMA / ALMA-R:

Translate this from <源语言名> into <目标语言名>:
<源语言名>: <源句子>
<目标语言名>:

X-ALMA (必须包含 [INST] 标记):

<s>[INST] Translate this from <源语言名> into <目标语言名>:
<源语言名>: <源句子>
<目标语言名>: [/INST]

其他加载方式

若希望动态切换语言模块而不重新加载模型，可使用 方式二（基座 + LoRA 适配器）：

# 加载基座
model = AutoModelForCausalLM.from_pretrained("haoranxu/X-ALMA-13B-Pretrain", torch_dtype=torch.float16, device_map="auto")
# 动态挂载特定语言组模块
model = PeftModel.from_pretrained(model, f"haoranxu/X-ALMA-13B-Group{group_id}")
tokenizer = AutoTokenizer.from_pretrained(f"haoranxu/X-ALMA-13B-Group{group_id}", padding_side='left')

常见问题

如何控制德语翻译中的敬语（Sie）和非敬语（Du）形式？

在单语数据集上预训练 LLaMA-2 时遇到 'Current loss scale already at minimum' 溢出错误怎么办？

复现论文结果时，COMET 和 BLEU 分数低于预期，可能的原因是什么？

将 ALMA 风格微调应用到其他基础模型（如 Falcon）需要多少计算资源？

应该使用英文提示词还是德语提示词进行翻译？

为什么我得到的翻译结果与官方演示或其他用户的結果不一致？

相似工具推荐

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 150k|★★☆☆☆|今天

开发框架Agent语言模型

LLMs-from-scratch

LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目，旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型（LLM）。它不仅是同名技术著作的官方代码库，更提供了一套完整的实践方案，涵盖模型开发、预训练及微调的全过程。该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型，却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码，用户能够透彻掌握 Transformer 架构、注意力机制等关键原理，从而真正理解大模型是如何“思考”的。此外，项目还包含了加载大型预训练权重进行微调的代码，帮助用户将理论知识延伸至实际应用。 LLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API，而是渴望探究模型构建细节的技术人员而言，这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计：将复杂的系统工程拆解为清晰的步骤，配合详细的图表与示例，让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础，还是为未来研发更大规模的模型做准备

★ 90.1k|★★★☆☆|4天前

语言模型图像Agent

NextChat

NextChat 是一款轻量且极速的 AI 助手，旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性，以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发，NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言，它也提供了便捷的自托管方案，支持一键部署到 Vercel 或 Zeabur 等平台。 NextChat 的核心亮点在于其广泛的模型兼容性，原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型，让用户在一个界面即可自由切换不同 AI 能力。此外，它还率先支持 MCP（Model Context Protocol）协议，增强了上下文处理能力。针对企业用户，NextChat 提供专业版解决方案，具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能，满足公司对数据隐私和个性化管理的高标准要求。

★ 87.6k|★★☆☆☆|6天前

开发框架语言模型

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。

★ 85.1k|★★☆☆☆|今天

图像数据工具视频

funNLP

funNLP 是一个专为中文自然语言处理（NLP）打造的超级资源库，被誉为"NLP 民工的乐园”。它并非单一的软件工具，而是一个汇集了海量开源项目、数据集、预训练模型和实用代码的综合性平台。面对中文 NLP 领域资源分散、入门门槛高以及特定场景数据匮乏的痛点，funNLP 提供了“一站式”解决方案。这里不仅涵盖了分词、命名实体识别、情感分析、文本摘要等基础任务的标准工具，还独特地收录了丰富的垂直领域资源，如法律、医疗、金融行业的专用词库与数据集，甚至包含古诗词生成、歌词创作等趣味应用。其核心亮点在于极高的全面性与实用性，从基础的字典词典到前沿的 BERT、GPT-2 模型代码，再到高质量的标注数据和竞赛方案，应有尽有。无论是刚刚踏入 NLP 领域的学生、需要快速验证想法的算法工程师，还是从事人工智能研究的学者，都能在这里找到急需的“武器弹药”。对于开发者而言，它能大幅减少寻找数据和复现模型的时间；对于研究者，它提供了丰富的基准测试资源和前沿技术参考。funNLP 以开放共享的精神，极大地降低了中文自然语言处理的开发与研究成本，是中文 AI 社区不可或缺的宝藏仓库。

★ 79.9k|★☆☆☆☆|2天前

语言模型数据工具其他

ragflow

RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。

★ 77.1k|★★★☆☆|1周前

Agent图像开发框架