Chinese-Mixtral

610 42 中等 2 次阅读 2天前Apache-2.0开发框架语言模型

AI 解读由 AI 自动生成，仅供参考

Chinese-Mixtral 是一款专为中文场景优化的开源大语言模型，基于 Mistral AI 发布的 Mixtral-8x7B 架构，通过大规模中文无标注数据增量训练与指令精调而成。它有效解决了原生 Mixtral 模型在中文理解、长文本处理及本土化任务中表现不足的问题，能够流畅处理长达 32K（实测可达 128K）的上下文，并在数学推理与代码生成方面展现出显著优势。

该项目不仅提供了开箱即用的基座模型（Chinese-Mixtral）和对话模型（Chinese-Mixtral-Instruct），还完整开源了预训练与微调代码，极大降低了二次开发门槛。其独特的技术亮点在于采用了稀疏混合专家（Sparse MoE）架构，在保持高性能的同时大幅降低资源消耗，使用 llama.cpp 量化后仅需 16G 内存即可在个人电脑上运行。

Chinese-Mixtral 非常适合研究人员探索大模型语言适配机制，也适合开发者快速构建中文 AI 应用或进行私有化部署。得益于其对 Transformers、vLLM、LangChain 等主流生态的全面支持，无论是希望深入算法优化的专业人士，还是想要在本地体验高性能中文大模型的爱好者，都能从中获得高效、灵活的解决方案。

使用场景

某法律科技团队需要构建一个能处理长篇中文合同并提取关键条款的智能审核系统。

没有 Chinese-Mixtral 时

长文本处理能力弱：通用模型上下文窗口有限，面对超过 2 万字的复杂合同时经常丢失首尾信息，导致关键风险条款漏检。
中文法律语义理解偏差：直接使用未经中文深度优化的国外基座模型，对“不可抗力”、“连带责任”等专业术语的理解生硬，容易产生幻觉或错误解读。
部署成本高昂：原有大模型方案对显存要求极高，普通开发机无法运行，必须依赖昂贵的多卡服务器集群，推高了研发门槛。
推理响应缓慢：在处理长文档问答时，生成速度慢且延迟高，无法满足律师实时交互审核的需求。

使用 Chinese-Mixtral 后

超长上下文精准覆盖：利用原生支持的 32K（实测可达 128K）上下文窗口，Chinese-Mixtral 能一次性完整读入整份合同，确保从前言到附录的所有细节均被纳入分析。
专业领域理解升级：基于大规模中文无标注数据增量训练及指令精调，Chinese-Mixtral 对中文法律语境理解深刻，能准确识别并解释复杂的权责条款。
本地化低成本部署：借助 llama.cpp 量化技术，Chinese-Mixtral 最低仅需 16G 内存即可在个人电脑或单卡设备上流畅运行，大幅降低了硬件投入。
高效实时交互：稀疏混合专家（MoE）架构结合量化加速，显著提升了长文本下的推理速度，让律师能在秒级内获得精准的条款修订建议。

Chinese-Mixtral 通过卓越的长文本处理能力和深度的中文语义优化，让高精度法律智能审核在低成本硬件上成为现实。

运行环境要求

操作系统

Linux
macOS
Windows

GPU

非必需
支持 CPU 推理（llama.cpp 最低需 16GB 内存/显存）
若使用 GPU 加速，推荐 NVIDIA 显卡以支持 CUDA 或 Metal (macOS)

内存

最低 16GB（量化后），完整版模型建议 32GB+ 系统内存或相应显存

依赖

notes1. 模型基于 Mixtral-8x7B 架构，实际激活参数约 13B，总参数 46.7B。2. 原生支持 32K 上下文，实测可达 128K。3. 提供多种部署方式：llama.cpp（适合个人电脑 CPU/GPU 量化部署）、Transformers、vLLM、text-generation-webui 等。4. 若网络带宽不足，可下载 LoRA 版模型并与原版 Mixtral-8x7B-v0.1 合并使用。5. 量化推理（如 GGUF 格式）在个人电脑上最低仅需 16GB 内存即可运行。

python未说明

transformers

llama.cpp

torch

accelerate

bitsandbytes

快速开始

GitHub GitHub release (latest by date) GitHub top language

本项目基于Mistral.ai发布的Mixtral模型进行开发，该模型使用了稀疏混合专家模型（Sparse MoE）架构。本项目利用大规模中文无标注数据进行了中文增量训练，得到了中文Mixtral基础模型，并且进一步通过指令精调，得到了中文Mixtral-Instruct指令模型。该模型原生支持32K上下文（实测可达128K），能够有效地处理长文本，同时在数学推理、代码生成等方面获得了显著性能提升。使用llama.cpp进行量化推理时，最低只需16G内存（或显存）。

技术报告：[Cui and Yao, 2024] Rethinking LLM Language Adaptation: A Case Study on Chinese Mixtral [论文解读]

本项目主要内容

🚀 开源中文Mixtral基础模型，该模型在Mixtral-8x7B-v0.1的基础上进行了中文增量训练
🚀 开源中文Mixtral-Instruct指令模型，该模型在中文Mixtral的基础上进一步进行了指令精调
🚀 开源了预训练脚本、指令精调脚本，用户可根据需要进一步训练或微调模型
🚀 提供了利用个人电脑CPU/GPU快速在本地进行大模型量化和部署的教程
🚀 支持🤗transformers, llama.cpp, text-generation-webui, LangChain, privateGPT, vLLM等Mixtral生态

新闻

[2024/04/30] Chinese-LLaMA-Alpaca-3 已正式发布，开源基于Llama-3的Llama-3-Chinese-8B和Llama-3-Chinese-8B-Instruct，请参阅：https://github.com/ymcui/Chinese-LLaMA-Alpaca-3

[2024/03/27] 添加1-bit/2-bit/3-bit量化版GGUF模型：[🤗HF]；同时，本项目已入驻机器之心SOTA!模型平台，欢迎关注：https://sota.jiqizhixin.com/project/chinese-mixtral

[2024/03/26] 添加仿OpenAI API部署模式。详情查看：📚v1.2版本发布日志

[2024/03/05] 开源模型训练和精调代码，发布技术报告。详情查看：📚v1.1版本发布日志

[2024/01/29] 🚀 正式发布Chinese-Mixtral（基座模型），Chinese-Mixtral-Instruct（指令/chat模型）。详情查看：📚v1.0版本发布日志

内容导引

章节	描述
💁🏻‍♂️模型简介	简要介绍本项目相关模型的技术特点
⏬模型下载	中文Mixtral大模型下载地址
💻推理与部署	介绍了如何对模型进行量化并使用个人电脑部署并体验大模型
💯模型效果	介绍了模型在部分任务上的效果
📝训练与精调	介绍了如何训练和精调中文Mixtral大模型
❓常见问题	一些常见问题的回复

模型简介

本项目开源了基于Mixtral模型开发的中文Mixtral、中文Mixtral-Instruct模型，其主要特点如下：

📖 稀疏混合专家模型

Mixtral是一个稀疏混合专家模型。该模型与以往的LLaMA等主流大模型结构具有显著差异，主要体现在以下几点：

每个FFN层包含8个不同的"专家"（全连接层），根据门控值选取最优的2个进行激活
输入序列中的每个token都会独立地选取专家，而不是整个序列对应一组专家
实际参数量约为46.7B，在推理时激活的参数量约为13B

以下是Mixtral论文中的结构示意图：

🚄 原生支持32K上下文（实测支持128K）

与Chinese-LLaMA-Alpaca以及Chinese-LLaMA-Alpaca-2项目不同，Mixtral模型原生支持32K上下文（实测可达128K）。用户可使用单一模型来解决不同长度的各类任务。

模型下载

模型选择指引

以下是本项目的模型对比以及建议使用场景。如需聊天交互，请选择Instruct版。

对比项	中文Mixtral	中文Mixtral-Instruct
模型类型	基座模型	指令/Chat模型（类ChatGPT）
模型大小	8x7B（实际激活约13B）	8x7B（实际激活约13B）
专家数量	8个（实际激活2个）	8个（实际激活2个）
训练类型	Causal-LM (CLM)	指令精调
训练方式	QLoRA + 全量emb/lm-head	QLoRA + 全量emb/lm-head
基于什么模型训练	原版Mixtral-8x7B-v0.1	中文Mixtral
训练语料	无标注通用语料	有标注指令数据
词表大小	原版词表，32000	原版词表，32000
支持上下文长度	32K（实测可达128K）	32K（实测可达128K）
输入模板	不需要	需要套用Mixtral-Instruct模板
适用场景	文本续写：给定上文，让模型生成下文	指令理解：问答、写作、聊天、交互等

下载地址

以下提供了3种不同类型的模型：

完整版模型：直接下载即可使用，无需其他合并步骤，推荐网络带宽充足的用户；
LoRA版模型：无法单独使用，必须与原版Mixtral-8x7B-v0.1合并才能转为完整版模型，推荐网络带宽不足且手头有原版Mixtral的用户。合并方法请参阅：💻 模型合并步骤
GGUF版模型：兼容llama.cpp等工具的GGUF量化版模型，推荐只需要做推理部署的用户下载。

模型名称	类型	规格	完整版（87 GB）	LoRA版（2.4 GB）	GGUF版
Chinese-Mixtral	基座模型	8x7B	[Baidu] [🤗HF] [🤖ModelScope]	[Baidu] [🤗HF] [🤖ModelScope]	[🤗HF]
Chinese-Mixtral-Instruct	指令模型	8x7B	[Baidu] [🤗HF] [🤖ModelScope]	[Baidu] [🤗HF] [🤖ModelScope]	[🤗HF]

[!NOTE] 若无法访问HF，可考虑一些镜像站点（如hf-mirror.com），具体方法请自行查找解决。

推理与部署

本项目中的相关模型主要支持以下量化、推理和部署方式，具体内容请参考对应教程。

工具	特点	CPU	GPU	量化	GUI	API	vLLM	教程
llama.cpp	丰富的量化选项和高效本地推理	✅	✅	✅	❌	✅	❌	[link]
🤗Transformers	原生transformers推理接口	✅	✅	✅	✅	❌	✅	[link]
仿OpenAI API调用	仿OpenAI API接口的服务器Demo	✅	✅	✅	❌	✅	✅	[link]
text-generation-webui	前端Web UI界面的部署方式	✅	✅	✅	✅	✅	❌	[link]
LangChain	适合二次开发的大模型应用开源框架	✅	✅	✅	❌	❌	❌	[link]
privateGPT	多文档本地问答框架	✅	✅	✅	❌	❌	❌	[link]
LM Studio	多平台聊天软件（带界面）	✅	✅	✅	✅	✅	❌	[link]

模型效果

为了评测相关模型的效果，本项目分别进行了生成效果评测和客观效果评测（NLU类），从不同角度对大模型进行评估。推荐用户在自己关注的任务上进行测试，选择适配相关任务的模型。

生成效果评测

本项目仿照Fastchat Chatbot Arena推出了模型在线对战平台，可浏览和评测模型回复质量。对战平台提供了胜率、Elo评分等评测指标，并且可以查看两两模型的对战胜率等结果。⚔️ 模型竞技场：http://llm-arena.ymcui.com
examples目录中提供了Chinese-Mixtral-Instruct与Chinese-Alpaca-2-13B的输出样例，并通过GPT-4进行了打分对比，Chinese-Mixtral-Instruct平均得分为8.20、Chinese-Alpaca-2-13B平均得分为7.05。📄 输出样例对比：examples

客观效果评测

C-Eval

C-Eval是一个全面的中文基础模型评估套件，其中验证集和测试集分别包含1.3K和12.3K个选择题，涵盖52个学科。C-Eval推理代码请参考本项目：📖GitHub Wiki

Models	类型	Valid (0-shot)	Valid (5-shot)	Test (0-shot)	Test (5-shot)
Chinese-Mixtral-Instruct	指令	51.7	55.0	50.0	51.5
Chinese-Mixtral	基座	45.8	54.2	43.1	49.1
Mixtral-8x7B-Instruct-v0.1	指令	51.6	54.0	48.7	50.7
Mixtral-8x7B-v0.1	基座	47.3	54.6	46.1	50.3
Chinese-Alpaca-2-13B	指令	44.3	45.9	42.6	44.0
Chinese-LLaMA-2-13B	基座	40.6	42.7	38.0	41.6

CMMLU

CMMLU是另一个综合性中文评测数据集，专门用于评估语言模型在中文语境下的知识和推理能力，涵盖了从基础学科到高级专业水平的67个主题，共计11.5K个选择题。CMMLU推理代码请参考本项目：📖GitHub Wiki

Models	类型	Test (0-shot)	Test (5-shot)
Chinese-Mixtral-Instruct	指令	50.0	53.0
Chinese-Mixtral	基座	42.5	51.0
Mixtral-8x7B-Instruct-v0.1	指令	48.2	51.6
Mixtral-8x7B-v0.1	基座	44.3	51.6
Chinese-Alpaca-2-13B	指令	43.2	45.5
Chinese-LLaMA-2-13B	基座	38.9	42.5

MMLU

MMLU是一个用于评测自然语言理解能力的英文评测数据集，是当今用于评测大模型能力的主要数据集之一，其中验证集和测试集分别包含1.5K和14.1K个选择题，涵盖57个学科。MMLU推理代码请参考本项目：📖GitHub Wiki

Models	类型	Valid (0-shot)	Valid (5-shot)	Test (0-shot)	Test (5-shot)
Chinese-Mixtral-Instruct	指令	65.1	69.6	67.5	69.8
Chinese-Mixtral	基座	63.2	67.1	65.5	68.3
Mixtral-8x7B-Instruct-v0.1	指令	68.5	70.4	68.2	70.2
Mixtral-8x7B-v0.1	基座	64.9	69.0	67.0	69.5
Chinese-Alpaca-2-13B	指令	49.6	53.2	50.9	53.5
Chinese-LLaMA-2-13B	基座	46.8	50.0	46.6	51.8

LongBench

LongBench是一个大模型长文本理解能力的评测基准，由6大类、20个不同的任务组成，多数任务的平均长度在5K-15K之间，共包含约4.75K条测试数据。以下是本项目模型在该中文任务（含代码任务）上的评测效果。LongBench推理代码请参考本项目：📖GitHub Wiki

Models	单文档QA	多文档QA	摘要	FS学习	代码补全	合成任务	平均
Chinese-Mixtral-Instruct	50.3	34.2	16.4	42.0	56.1	89.5	48.1
Chinese-Mixtral	32.0	23.7	0.4	42.5	27.4	14.0	23.3
Mixtral-8x7B-Instruct-v0.1	56.5	35.7	15.4	46.0	63.6	98.0	52.5
Mixtral-8x7B-v0.1	35.5	9.5	16.4	46.5	57.2	83.5	41.4
Chinese-Alpaca-2-13B-16K	47.9	26.7	13.0	22.3	46.6	21.5	29.7
Chinese-LLaMA-2-13B-16K	36.7	17.7	3.1	29.8	13.8	3.0	17.3
Chinese-Alpaca-2-7B-64K	44.7	28.1	14.4	39.0	44.6	5.0	29.3
Chinese-LLaMA-2-7B-64K	27.2	16.4	6.5	33.0	7.8	5.0	16.0

量化效果评测

在llama.cpp下，测试了Chinese-Mixtral量化版模型的性能，如下表所示。

	F16	Q8_0	Q6_K	Q5_K	Q5_0	Q4_K	Q4_0	Q3_K	IQ3_XXS	Q2_K	IQ2_XS	IQ2_XXS
Size (GB)	87.0	46.2	35.7	30.0	30.0	24.6	24.6	19.0	17.1	16.1	12.7	11.4
BPW	16.0	8.50	6.57	5.69	5.52	4.87	4.53	3.86	3.14	2.96	2.34	2.10
PPL	-	4.4076	4.4092	4.4192	4.4224	4.4488	4.4917	4.5545	4.5990	5.1846	6.9784	8.5981
M3 Max Speed	-	-	36.0	36.9	35.7	31.2	27.8	37.6	-	29.1	-	-
A100 Speed	-	-	29.9	22.6	20.5	21.7	17.1	21.7	20.6	20.3	23.7	22.5

[!NOTE]

模型大小：单位GB

BPW（Bits-Per-Weight）：单位参数比特，例如Q6_K实际平均精度为6.57

PPL（困惑度）：以4K上下文测量，数值越低越好

生成速度：提供了Apple M3 Max（Metal）以及NVIDIA A100（40G）的生成速度（单位ms/token），数值越低越好

以Chinese-Mixtral-Q4_0为例，下图展示了不同上下文长度下的PPL变化趋势，选取了2组不同的纯文本数据。实验结果表明Mixtral模型支持的上下文长度已超过标称的32K，在64K+上下文下仍然具有较好的表现（实测可达128K）。

训练与精调

预训练

在原版Mixtral的基础上，利用大规模无标注数据进行增量训练，得到Chinese-Mixtral基座模型
训练数据采用Chinese-LLaMA-Alpaca项目中与基础版模型一致的数据，其总量约20G纯文本文件
训练代码及使用教程：📖预训练脚本Wiki

指令精调

在Chinese-Mixtral的基础上，利用有标注指令数据进行进一步精调，得到Chinese-Mixtral-Instruct指令模型
训练数据采用了Chinese-LLaMA-Alpaca-2项目中使用的指令数据，其总量约500万条指令数据
训练代码及使用教程：📖指令精调脚本Wiki

指令模板：

<s> [INST] Instruction [/INST] Model answer</s> [INST] Follow-up instruction [/INST]

注意：<s>和</s>是表示序列开始和结束的特殊token，而[INST]和[/INST]则是普通字符串。

常见问题

请在提Issue前务必先查看FAQ中是否已存在解决方案。具体问题和解答请参考本项目 📖GitHub Wiki

问题1：后续会不会用更多数据进行训练？会不会做RLHF/DPO对齐？
问题2：为什么本次的模型没有做中文词表扩展？
问题3：是否支持Mixtral的下游生态？

引用

@article{chinese-mixtral,
      title={Rethinking LLM Language Adaptation: A Case Study on Chinese Mixtral}, 
      author={Cui, Yiming and Yao, Xin},
      journal={arXiv preprint arXiv:2403.01851},
      url={https://arxiv.org/abs/2403.01851},
      year={2024}
}

免责声明

本项目基于由Mistral.ai发布的Mixtral模型进行开发，使用过程中请严格遵守Mixtral的开源许可协议。如果涉及使用第三方代码，请务必遵从相关的开源许可协议。模型生成的内容可能会因为计算方法、随机因素以及量化精度损失等影响其准确性，因此，本项目不对模型输出的准确性提供任何保证，也不会对任何因使用相关资源和输出结果产生的损失承担责任。如果将本项目的相关模型用于商业用途，开发者应遵守当地的法律法规，确保模型输出内容的合规性，本项目不对任何由此衍生的产品或服务承担责任。

问题反馈

如有疑问，请在GitHub Issue中提交。礼貌地提出问题，构建和谐的讨论社区。

在提交问题之前，请先查看FAQ能否解决问题，同时建议查阅以往的issue是否能解决你的问题。
提交问题请使用本项目设置的Issue模板，以帮助快速定位具体问题。
重复以及与本项目无关的issue会被stable-bot处理，敬请谅解。

Chinese-Mixtral 快速上手指南

Chinese-Mixtral 是基于 Mistral AI 发布的 Mixtral-8x7B 模型，利用大规模中文无标注数据进行增量训练得到的中文大语言模型。该模型采用稀疏混合专家（Sparse MoE）架构，原生支持 32K 上下文（实测可达 128K），在数学推理和代码生成方面表现优异。

环境准备

系统要求

操作系统：Linux (推荐), macOS, Windows (WSL2)
内存/显存：
- 全量推理：建议 80GB+ 显存或多卡环境
- 量化推理 (llama.cpp)：最低 16GB 内存或显存即可运行
Python 版本：3.8 及以上

前置依赖

确保已安装以下基础工具：

git
python3
pip
cuda (如需 GPU 加速，建议版本 11.8+)

安装步骤

1. 克隆项目代码

git clone https://github.com/ymcui/Chinese-Mixtral.git
cd Chinese-Mixtral

2. 安装 Python 依赖

推荐使用国内镜像源加速安装：

pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

注：若需使用 transformers 原生推理，请确保安装最新版：

pip install --upgrade transformers accelerate sentencepiece protobuf -i https://pypi.tuna.tsinghua.edu.cn/simple

3. 获取模型权重

本项目提供完整版、LoRA 版和 GGUF 量化版。对于快速上手，推荐直接下载 GGUF 版（适合本地低资源部署）或 完整版（适合开发调试）。

方案 A：下载 GGUF 量化版（推荐个人电脑用户）

通过 Hugging Face 或镜像站下载 chinese-mixtral-instruct-gguf。

# 示例：使用 huggingface-cli 下载 (需安装 huggingface_hub)
# 如果访问 HF 困难，可使用 hf-mirror.com 替换 huggingface.co
pip install huggingface_hub
huggingface-cli download hfl/chinese-mixtral-instruct-gguf --local-dir ./models/gguf

国内加速提示：若无法访问 Hugging Face，可设置环境变量 export HF_ENDPOINT=https://hf-mirror.com 后重试上述命令。

方案 B：下载完整版模型（Hugging Face / ModelScope / 百度网盘）

Hugging Face: hfl/chinese-mixtral-instruct
ModelScope (魔搭): ChineseAlpacaGroup/chinese-mixtral-instruct (国内推荐)
百度网盘: 见项目 README 表格链接

若使用 ModelScope 下载：

pip install modelscope
modelscope download ChineseAlpacaGroup/chinese-mixtral-instruct --local_dir ./models/full

基本使用

方式一：使用 llama.cpp 进行本地量化推理（最轻量）

适用于 CPU 或单张消费级显卡，内存占用低。

编译 llama.cpp

git clone https://github.com/ggerganov/llama.cpp.git
cd llama.cpp
make

运行模型 假设已下载 chinese-mixtral-instruct-q4_k_m.gguf 到当前目录：
```
./main -m ../chinese-mixtral-instruct-q4_k_m.gguf \
       -p "你好，请介绍一下你自己。" \
       -n 512 \
       --color
```
注：Mixtral-Instruct 模型通常不需要特殊的 Prompt 模板即可在 llama.cpp 中获得较好效果，但为了最佳指令遵循，建议在 prompt 中明确指令。

方式二：使用 🤗 Transformers 进行推理（开发友好）

适用于拥有较大显存（或多卡）的开发者，便于集成到现有 Python 项目中。

from transformers import AutoTokenizer, AutoModelForCausalLM
import torch

# 加载模型和分词器
# 请将路径替换为你实际下载的模型路径，或使用 "hfl/chinese-mixtral-instruct"
model_path = "./models/full" 

tokenizer = AutoTokenizer.from_pretrained(model_path, trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained(
    model_path, 
    torch_dtype=torch.float16, 
    device_map="auto",
    trust_remote_code=True
)

# 构建输入 (Mixtral-Instruct 建议配合指令模板，此处为简化示例)
prompt = "你好，请介绍一下你自己。"
inputs = tokenizer(prompt, return_tensors="pt").to(model.device)

# 生成回复
outputs = model.generate(
    **inputs, 
    max_new_tokens=512, 
    do_sample=True, 
    temperature=0.7, 
    top_p=0.9
)

response = tokenizer.decode(outputs[0], skip_special_tokens=True)
print(response)

方式三：启动仿 OpenAI API 服务

项目支持启动兼容 OpenAI 格式的 API 服务，方便对接 LangChain 或其他应用。

# 确保已安装相关依赖 (fastapi, uvicorn, sse-starlette 等)
python api_server.py --model_path ./models/full --port 8000

启动后，可通过 http://localhost:8000/v1/chat/completions 接口调用模型。

版本历史

v1.22024/03/26

v1.12024/03/05

v1.02024/01/29

常见问题

Chinese-Mixtral 模型是否提供了官方的训练脚本？如果没有，如何进行微调？

使用 Ollama 运行 Chinese-Mixtral GGUF 模型时遇到 'missing tensor' 错误怎么办？

从 Hugging Face 或百度网盘下载模型速度太慢，有什么加速方法？

LoRA 微调时，load_in_kbits 设置为 8 或 16 报错，只有 4bit 能正常运行，原因是什么？

SFT 微调保存 checkpoint 后中断，尝试从 checkpoint 继续训练时报错，如何解决？

在使用 Alpaca 指令数据进行微调时，指令模板（Prompt Template）是如何设计的？

相似工具推荐

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|今天

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 139k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 107.7k|★★☆☆☆|2天前

开发框架图像Agent

NextChat

NextChat 是一款轻量且极速的 AI 助手，旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性，以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发，NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言，它也提供了便捷的自托管方案，支持一键部署到 Vercel 或 Zeabur 等平台。 NextChat 的核心亮点在于其广泛的模型兼容性，原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型，让用户在一个界面即可自由切换不同 AI 能力。此外，它还率先支持 MCP（Model Context Protocol）协议，增强了上下文处理能力。针对企业用户，NextChat 提供专业版解决方案，具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能，满足公司对数据隐私和个性化管理的高标准要求。

★ 87.6k|★★☆☆☆|今天

开发框架语言模型

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。

★ 85k|★★☆☆☆|今天

图像数据工具视频

ragflow

RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。

★ 77.1k|★★★☆☆|2天前

Agent图像开发框架