GenossGPT

752 63 较难 1 次阅读 4天前语言模型插件图像Agent数据工具开发框架

AI 解读由 AI 自动生成，仅供参考

GenossGPT 是一款专为开发者设计的开源工具，旨在让应用程序能够轻松接入各类大语言模型（LLM），无论是公开的 GPT-3.5/4、Anthropic，还是私有的 Llama V2、GPT4ALL 等。它核心解决了开发者在切换不同模型时面临的高成本适配难题：只需修改一行代码，即可将原本依赖 OpenAI 接口的应用无缝迁移至其他开源或私有模型，同时保持原有的参数结构和响应格式不变。

这一特性极大地降低了试错成本和部署门槛，特别适合希望摆脱单一供应商锁定、追求数据隐私安全或需要本地化部署的软件开发者和技术研究人员。通过 GenossGPT，用户可以灵活调用如 GPT4ALL 等开源模型进行聊天补全和向量嵌入任务，而无需重构现有业务逻辑。其独特的“一行替换”机制兼容 OpenAI API 标准，并提供了清晰的本地文档界面，方便快速调试与集成。虽然目前主要支持 GPT4ALL 模型，但项目规划了更广泛的模型兼容性。对于想要构建灵活、可控且低成本 AI 应用的技术团队而言，GenossGPT 提供了一个高效且友好的基础设施选择。

使用场景

某初创团队正在开发一款内部知识库问答助手，需要在大语言模型选型上兼顾数据隐私与开发效率。

没有 GenossGPT 时

代码耦合度高：团队最初基于 OpenAI API 开发，若要切换为本地部署的 GPT4ALL 以保护敏感数据，需重构大量网络请求和响应解析代码。
多模型适配繁琐：尝试接入 Llama V2 或 HuggingFace 等其他开源模型时，必须为每个模型编写独立的适配层，维护成本极高。
私有化部署困难：由于缺乏统一接口标准，将服务从云端迁移至内网服务器时，面临复杂的依赖配置和环境兼容性问题。
开发迭代缓慢：每次更换模型都需要重新测试整个链路，导致功能上线周期被大幅拉长。

使用 GenossGPT 后

一行代码替换：只需将 API 端点指向 GenossGPT 服务，即可无缝将后端从 GPT-4 切换为本地运行的 GPT4ALL，无需修改业务逻辑。
统一模型接口：无论是 Anthropic、Llama V2 还是 Vertex AI，GenossGPT 均提供标准化的 One API，消除了多模型适配的重复工作。
轻松实现私有化：通过启动本地 genoss-server，团队迅速在内网构建了完全可控的推理服务，确保数据不出域。
敏捷迭代升级：新增模型支持仅需更新服务端配置，前端应用无感知，显著缩短了从模型验证到生产部署的时间。

GenossGPT 通过“一行代码替换”的统一接口策略，让开发者在享受开源模型自由度的同时，保留了商业级 API 的开发体验。

运行环境要求

操作系统

未说明

GPU

未说明 (基于 GPT4ALL，通常支持 CPU 运行，具体 GPU 加速需求取决于底层 llmodel 构建)

内存

未说明

依赖

notes1. 该项目目前主要支持 GPT4ALL 模型。2. 若需从源码安装 GPT4ALL 后端，需要安装 cmake 并进行编译。3. 需手动下载模型文件 (ggml-gpt4all-j-v1.3-groovy.bin) 并放置于 local_models 目录。4. 开发环境推荐使用 poetry 管理依赖。5. 服务默认运行在 4321 端口。

python3.11+

genoss

gpt4all

uvicorn

poetry

streamlit

cmake

快速开始

Genoss GPT

一款由开源模型驱动、可替代 OpenAI ChatGPT 及 Embeddings 的单行代码解决方案

Genoss 是一项开创性的开源项目，旨在利用 GPT4ALL 等开源模型，为 OpenAI 的 GPT 3.5 和 4 等模型提供无缝替代方案。

该项目基于 Sicarator 自主开发。

功能特性

开源：Genoss 基于 GPT4ALL 等开源模型构建。
单行替换：Genoss 可以作为 OpenAI ChatGPT API 的单行替换方案。

演示

使用 GPT4ALL 进行聊天补全与嵌入

https://github.com/OpenGenenerativeAI/GenossGPT/assets/19614572/9cfd4f69-6396-4883-b94d-e94dd76663dc

支持的模型

GPT4ALL 模型及嵌入
更多模型即将推出！

快速入门

在开始之前，请确保您的机器上已安装 Python 3.11 或更高版本。

安装服务器

使用 pip（推荐）

:warning: 目前我们正处于预发布阶段。

pip install genoss

从本仓库安装最新版本

pip install git+https://github.com/OpenGenerativeAI/GenossGPT.git@main\#egg\=genoss

启动服务器

genoss-server
# 查看更多帮助信息
genoss-server --help

可通过 http://localhost:4321/docs 访问 API 文档。

模型安装

安装 GPT4ALL 模型

第一步是安装 GPT4ALL，这是目前唯一支持的模型。您可以按照以下步骤进行操作：

克隆仓库：

git clone --recurse-submodules git@github.com:nomic-ai/gpt4all.git

cd gpt4all/gpt4all-backend/

mkdir build && cd build

使用 cmake 配置并构建项目：

cmake ..
cmake --build . --parallel

确认 gpt4all-backend/build 中存在 libllmodel.* 文件。
返回根目录并安装 Python 包：

cd ../../gpt4all-bindings/python
pip3 install -e .

从这里下载模型文件，并将其放置到 local_models 目录下，命名为 local_models/ggml-gpt4all-j-v1.3-groovy.bin。

运行应用

您需要安装 poetry 和有效的 Python 版本（3.11*）。

poetry install

如需完整的开发环境安装说明，请参阅 CONTRIBUTING.md。如果您只想启动服务器，可以使用相应的 poetry 组进行安装：

poetry install --only main,llms

Python 包安装完成后，即可运行应用。您可以使用 Uvicorn ASGI 服务器来运行应用程序：

uvicorn main:app --host 0.0.0.0 --port 4321

此命令将在您机器的 4321 端口上启动 Genoss 应用程序。

运行 Web 应用演示

在 demo/ 目录下：

cp .env.example .env

替换其中的值后，执行：

PYTHONPATH=. streamlit run demo/main.py

Genoss API 使用

Genoss API 是 OpenAI ChatGPT API 的单行替换方案。它支持相同的参数，并返回与 OpenAI API 相同的响应格式。

只需将 OpenAI API 的端点替换为 Genoss API 的端点，即可开始使用！

同时，请将模型配置调整为支持的模型列表，即可顺利运行！

API 文档可在 /docs 或 /redoc 页面查看。

API 文档截图

未来规划

尽管目前仅支持 GPT4ALL 模型，但我们计划在未来添加更多模型。敬请期待更多精彩更新！

愿景目标：

支持本地运行 LLM 模型
支持通过 HuggingFace 在本地运行 LLM
支持在 HuggingFace 上运行 LLM，并仅作为推理 API 的封装层
实现 LLM 模型的便捷本地安装
允许用户使用 GCP、AWS、Azure 等云服务提供商的解决方案
提供 API 密钥管理功能
提供各类模型供使用（文本到文本、文本到图像、文本到音频、音频到文本等）
对兼容 OpenAI API 的模型实现与 OpenAI API 的兼容性

愿景示意图

历史沿革

Genoss 的灵感来源于 Stan Girard，当时他在开发 Quivr 的某个功能时，发现该功能过于庞大且复杂，难以维护。

于是他萌生了创建一个简单 API 的想法，使任何模型都能使用与 OpenAI ChatGPT API 相同的接口。

随后，@mattzcarey、@MaximeThoonsen、@Wirg 和 @StanGirard 共同参与开发，最终使这一设想成为现实。

贡献

我们非常欢迎您的贡献！欢迎提交任何问题或拉取请求。

特别感谢以下各位：

赞助商 ❤️

没有赞助商的支持，本项目将无法实现。感谢您的支持！

许可证

Genoss 采用 Apache2 许可证授权。更多详情请参阅 LICENSE 文件。

GenossGPT 快速上手指南

GenossGPT 是一个开源项目，旨在提供 OpenAI ChatGPT 和 Embeddings API 的无缝替代方案。它允许你使用本地运行的开源模型（如 GPT4ALL），并通过兼容 OpenAI 的 API 接口进行调用，只需修改一行代码即可切换后端。

环境准备

在开始之前，请确保你的开发环境满足以下要求：

操作系统：Linux, macOS 或 Windows
Python 版本：Python 3.11 或更高版本（必须）
构建工具（如需从源码编译模型后端）：cmake, git
包管理工具：pip (推荐) 或 poetry (用于开发)

提示：国内用户建议在安装 Python 依赖时使用清华或阿里镜像源加速下载： pip install -i https://pypi.tuna.tsinghua.edu.cn/simple <package_name>

安装步骤

1. 安装 Genoss 服务端

目前项目处于预发布阶段，推荐使用 pip 安装：

pip install genoss

或者安装最新的仓库版本：

pip install git+https://github.com/OpenGenerativeAI/GenossGPT.git@main#egg=genoss

2. 安装模型后端 (GPT4ALL)

GenossGPT 目前主要支持 GPT4ALL 模型。你需要手动编译并安装其 Python 绑定：

克隆仓库：

git clone --recurse-submodules git@github.com:nomic-ai/gpt4all.git

编译后端库：

cd gpt4all/gpt4all-backend/
mkdir build && cd build
cmake ..
cmake --build . --parallel

确认 gpt4all-backend/build 目录下存在 libllmodel.* 文件。

安装 Python 包：

cd ../../gpt4all-bindings/python
pip3 install -e .

下载模型文件：从官方链接下载模型文件，并将其重命名为 ggml-gpt4all-j-v1.3-groovy.bin 放入项目根目录下的 local_models 文件夹中。

基本使用

启动服务

安装完成后，直接在终端运行以下命令启动服务器：

genoss-server

服务默认运行在 http://localhost:4321。你可以访问 http://localhost:4321/docs 查看完整的 API 文档。

(开发者模式也可通过 uvicorn 启动：uvicorn main:app --host 0.0.0.0 --port 4321)

代码调用示例

GenossGPT 完全兼容 OpenAI Python SDK。你只需将 base_url 指向本地服务，并将 model 名称改为支持的开源模型名称即可。

from openai import OpenAI

# 初始化客户端，指向本地 Genoss 服务
client = OpenAI(
    base_url="http://localhost:4321/v1",
    api_key="not-needed" # 本地运行通常不需要真实的 API Key
)

# 调用聊天完成接口
response = client.chat.completions.create(
    model="gpt4all-j", # 使用已安装的本地模型名称
    messages=[
        {"role": "system", "content": "你是一个有用的助手。"},
        {"role": "user", "content": "你好，请介绍一下 GenossGPT。"}
    ]
)

print(response.choices[0].message.content)

通过以上步骤，你即可在本地私有环境中运行大语言模型，并享受与 OpenAI API 相同的开发体验。

版本历史

v0.0.12023/08/01

相似工具推荐

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|今天

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 139k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 107.7k|★★☆☆☆|2天前

开发框架图像Agent

NextChat

NextChat 是一款轻量且极速的 AI 助手，旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性，以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发，NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言，它也提供了便捷的自托管方案，支持一键部署到 Vercel 或 Zeabur 等平台。 NextChat 的核心亮点在于其广泛的模型兼容性，原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型，让用户在一个界面即可自由切换不同 AI 能力。此外，它还率先支持 MCP（Model Context Protocol）协议，增强了上下文处理能力。针对企业用户，NextChat 提供专业版解决方案，具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能，满足公司对数据隐私和个性化管理的高标准要求。

★ 87.6k|★★☆☆☆|今天

开发框架语言模型

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。

★ 85k|★★☆☆☆|今天

图像数据工具视频

ragflow

RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。

★ 77.1k|★★★☆☆|昨天

Agent图像开发框架