codefuse-chatbot

1.3k 143 较难 1 次阅读 6天前NOASSERTION开发框架语言模型数据工具Agent

AI 解读由 AI 自动生成，仅供参考

CodeFuse-ChatBot 是由蚂蚁集团 CodeFuse 团队打造的开源 AI 智能助手，旨在覆盖软件开发生命周期的全过程。它不仅仅是一个问答机器人，更是一位能理解代码、文档及运维流程的“虚拟队友”，协助用户完成从设计、编码、测试到部署运维的复杂任务。

传统开发运维往往需要在分散的平台和海量资料间频繁切换，效率受限。CodeFuse-ChatBot 通过检索增强生成（RAG）技术，让大模型能够深入理解整个代码仓库和项目文档，从而提供精准的上下文感知回答。它解决了大模型在垂直领域“幻觉”严重、无法操作实际开发工具等痛点，将碎片化的操作流程转化为自然的对话交互。

这款工具特别适合软件开发者、DevOps 工程师以及技术研究人员使用。无论是需要快速梳理遗留代码逻辑，还是希望自动化执行编译、测试等运维动作，它都能提供强力支持。

其核心技术亮点在于独特的“多智能体（Multi-Agent）协同调度框架”。该框架能像指挥官一样调度多个专用智能体，结合沙盒环境安全地执行代码，并联动各类 DevOps 工具链。此外，它还支持私有化部署，兼容多种开源大模型，确保企业数据在本地闭环处理，兼顾了智能化与安全性。

使用场景

某金融科技公司后端团队在紧急重构一个遗留的微服务支付模块时，面临代码逻辑复杂、文档缺失且需快速上线的巨大压力。

没有 codefuse-chatbot 时

知识检索低效：开发人员需在分散的 Wiki、旧邮件和海量代码文件中手动翻阅，耗时数小时才能理清某个支付接口的历史变更逻辑。
跨工具操作繁琐：编写完代码后，需切换至不同平台手动执行单元测试、构建镜像及部署脚本，流程断裂且容易出错。
上下文理解困难：新加入的成员难以快速掌握项目全貌，面对仓库级的大规模代码库，往往只能“盲人摸象”式地修改代码。
环境安全隐患：直接在本地或生产环境尝试运行不确定的生成代码，缺乏隔离机制，极易引发服务崩溃或数据污染。

使用 codefuse-chatbot 后

私有知识即时问答：通过 RAG 技术导入内部文档与代码库，开发者直接提问即可获取精准的代码片段解释和历史变更依据，检索时间从小时级缩短至分钟级。
多智能体自动编排：利用 Multi-Agent 框架，只需一条指令即可调度代码编写、自动测试、容器构建及部署流程，实现 DevOps 全链路自动化闭环。
仓库级深度洞察：codefuse-chatbot 能对整个代码仓库进行语义分析，为新成员生成清晰的项目架构图谱和关键逻辑说明，大幅降低上手门槛。
安全沙盒验证：所有生成的代码先在隔离沙盒环境中编译运行，确认无误后再合并，有效规避了潜在的运行风险和安全漏洞。

codefuse-chatbot 通过将私有知识库与多智能体协作深度融合，将原本割裂的开发运维流程转变为流畅的智能化对话体验，显著提升了交付效率与系统稳定性。

运行环境要求

操作系统

Windows
macOS (X86 架构)
macOS (Apple Silicon/M 系列芯片，需额外安装 qpdf)

GPU

私有化部署大模型时需要 NVIDIA GPU（如运行 codellama-34b-int4 需 20GB 显存），测试环境为 CUDA 11.7
若仅调用 OpenAI API 则非必需

内存

未说明

依赖

notes1. Apple Silicon (M 系列) 用户需先执行 'brew install qpdf'。2. 项目已在 Python 3.9.18 和 CUDA 11.7 环境下完成测试。3. 支持通过 FastChat 接入开源私有化大模型或调用 OpenAI API。4. 建议使用 conda 管理 Python 环境。5. 需自行安装 NVIDIA 驱动程序。

python3.9.18

codefuse-muagent

requirements.txt 中列出的依赖包

快速开始

中文｜ English

CodeFuse-ChatBot: 基于私有知识增强的开发

License

CodeFuse-ChatBot是由蚂蚁CodeFuse团队开发的开源AI智能助手，致力于简化和优化软件开发生命周期中的各个环节。该项目结合了Multi-Agent的协同调度机制，并集成了丰富的工具库、代码库、知识库和沙盒环境，使得LLM模型能够在DevOps领域内有效执行和处理复杂任务。

🔔 更新

[2024.01.29] 开放可配置化的multi-agent框架：codefuse-muAgent，详情见使用说明
[2023.12.26] 基于FastChat接入开源私有化大模型和大模型接口的能力开放
[2023.12.14] 量子位公众号专题报道：文章链接
[2023.12.01] Multi-Agent和代码库检索功能开放
[2023.11.15] 增加基于本地代码库的问答增强模式
[2023.09.15] 本地/隔离环境的沙盒功能开放，基于爬虫实现指定url知识检索

🤝 介绍

💡 本项目旨在通过检索增强生成（Retrieval Augmented Generation，RAG）、工具学习（Tool Learning）和沙盒环境来构建软件开发全生命周期的AI智能助手，涵盖设计、编码、测试、部署和运维等阶段。逐渐从各处资料查询、独立分散平台操作的传统开发运维模式转变到大模型问答的智能化开发运维模式，改变人们的开发运维习惯。

本项目核心差异技术、功能点：

🧠 智能调度核心： 构建了体系链路完善的调度核心，支持多模式一键配置，简化操作流程。使用说明
💻 代码整库分析： 实现了仓库级的代码深入理解，以及项目文件级的代码编写与生成，提升了开发效率。
📄 文档分析增强： 融合了文档知识库与知识图谱，通过检索和推理增强，为文档分析提供了更深层次的支持。
🔧 垂类专属知识： 为DevOps领域定制的专属知识库，支持垂类知识库的自助一键构建，便捷实用。
🤖 垂类模型兼容： 针对DevOps领域的小型模型，保证了与DevOps相关平台的兼容性，促进了技术生态的整合。

🌍 依托于开源的 LLM 与 Embedding 模型，本项目可实现基于开源模型的离线私有部署。此外，本项目也支持 OpenAI API 的调用。接入Demo

👥 核心研发团队长期专注于 AIOps + NLP 领域的研究。我们发起了 Codefuse-ai 项目，希望大家广泛贡献高质量的开发和运维文档，共同完善这套解决方案，以实现“让天下没有难做的开发”的目标。

🎥 演示视频

为了帮助您更直观地了解 Codefuse-ChatBot 的功能和使用方法，我们录制了一系列演示视频。您可以通过观看这些视频，快速了解本项目的主要特性和操作流程。

知识库导入和问答：演示视频
本地代码库导入和问答：演示视频

🧭 技术路线

🧠 Multi-Agent Schedule Core: 多智能体调度核心，简易配置即可打造交互式智能体。
🕷️ Multi Source Web Crawl: 多源网络爬虫，提供对指定 URL 的爬取功能，以搜集所需信息。
🗂️ Data Processor: 数据处理器，轻松完成文档载入、数据清洗，及文本切分，整合不同来源的数据。
🔤 Text Embedding & Index:：文本嵌入索引，用户可以轻松上传文件进行文档检索，优化文档分析过程。
🗄️ Vector Database & Graph Database: 向量与图数据库，提供灵活强大的数据管理解决方案。
📝 Prompt Control & Management:：Prompt 控制与管理，精确定义智能体的上下文环境。
🚧 SandBox:：沙盒环境，安全地执行代码编译和动作。
💬 LLM:：智能体大脑，支持多种开源模型和 LLM 接口。
🛠️ API Management: API 管理工具，实现对开源组件和运维平台的快速集成。

具体实现明细见：技术路线明细项目计划跟进见：Projects

🌐 模型接入

如果您需要集成特定的模型，请通过提交issue来告知我们您的需求。

model_name	model_size	gpu_memory	quantize	HFhub	ModelScope
chatgpt	-	-	-	-	-
codellama-34b-int4	34b	20g	int4	coming soon	link

🚀 快速使用

muagent-py

完整文档见：CodeFuse-muAgent

pip install codefuse-muagent

使用ChatBot

请自行安装 nvidia 驱动程序，本项目已在 Python 3.9.18，CUDA 11.7 环境下，Windows、X86 架构的 macOS 系统中完成测试。

Docker安装、私有化LLM接入及相关启动问题见：快速使用明细

对于 Apple Silicon（苹果M系列芯片），您可能需要首先通过brew install qpdf。

1、python 环境准备

推荐采用 conda 对 python 环境进行管理（可选）

# 准备 conda 环境
conda create --name devopsgpt python=3.9
conda activate devopsgpt

安装相关依赖

cd codefuse-chatbot
# python=3.9，notebook用最新即可，python=3.8用notebook=6.5.6
pip install -r requirements.txt

2、启动服务

# 完成server_config.py配置后，可一键启动
cd examples
bash start.sh
# 开始在页面进行相关配置，然后打开`启动对话服务`即可

或者通过start.py进行启动老版启动方式更多LLM接入方法见更多细节...

贡献指南

非常感谢您对 Codefuse 项目感兴趣，我们非常欢迎您对 Codefuse 项目的各种建议、意见（包括批评）、评论和贡献。

您对 Codefuse 的各种建议、意见、评论可以直接通过 GitHub 的 Issues 提出。

参与 Codefuse 项目并为其作出贡献的方法有很多：代码实现、测试编写、流程工具改进、文档完善等等。任何贡献我们都会非常欢迎，并将您加入贡献者列表。详见Contribution Guide...

🤗 致谢

本项目基于langchain-chatchat和codebox-api，在此深深感谢他们的开源贡献！

🗂 其他

📱 联系我们

✨ 点赞历史

CodeFuse-ChatBot 快速上手指南

CodeFuse-ChatBot 是由蚂蚁 CodeFuse 团队开发的开源 AI 智能助手，专为软件开发生命周期（DevOps）设计。它结合了 Multi-Agent 协同调度、代码库检索、知识库增强及沙盒执行环境，旨在通过大模型实现智能化的设计、编码、测试、部署和运维。

1. 环境准备

在开始之前，请确保您的系统满足以下要求：

操作系统：Windows、Linux 或 macOS (X86 架构)。
- 注意：Apple Silicon (M 系列芯片) 用户需先执行 brew install qpdf。
Python 版本：推荐 Python 3.9.18。
GPU 驱动：如需本地部署大模型，请自行安装 NVIDIA 驱动程序（项目已在 CUDA 11.7 环境下测试）。
包管理工具：推荐使用 conda 管理 Python 环境。

2. 安装步骤

2.1 创建并激活虚拟环境

建议使用 conda 创建独立的开发环境：

# 创建名为 devopsgpt 的环境，指定 Python 3.9
conda create --name devopsgpt python=3.9
# 激活环境
conda activate devopsgpt

2.2 克隆项目并安装依赖

获取源代码并安装所需依赖包：

# 克隆仓库 (如果尚未克隆)
git clone https://github.com/codefuse-ai/codefuse-chatbot.git
cd codefuse-chatbot

# 安装依赖
# 注意：若使用 Python 3.8，notebook 版本需指定为 6.5.6；Python 3.9 使用最新即可
pip install -r requirements.txt

2.3 安装 Multi-Agent 框架 (可选但推荐)

该项目核心调度能力依赖于 codefuse-muagent：

pip install codefuse-muagent

3. 基本使用

3.1 配置服务

在启动前，请根据您的需求修改 server_config.py 配置文件（如模型路径、API Key 等）。

3.2 启动服务

进入示例目录并运行启动脚本，这将开启 WebUI 配置页面及服务：

cd examples
bash start.sh

3.3 开始对话

脚本运行后，浏览器会自动打开或显示访问地址。
在 WebUI 页面完成相关模型和知识库配置。
点击 “启动对话服务” 即可开始使用。

提示：如果您更习惯使用命令行或需要自定义启动流程，也可以直接运行 start.py。详细的私有化大模型接入（如 FastChat）及 Docker 部署方案，请参考官方文档中的“快速使用明细”。

常见问题

在 Windows 上启动项目时遇到 N 卡驱动安装失败或配置报错怎么办？

在 Windows CMD 下启动程序报错或连续对话无法输出内容，如何解决？

运行时报错 'cannot import name NoValue from streamlit.runtime.state' 怎么办？

MacOS 下启动脚本报错 'nohup: python: No such file or directory' 如何解决？

新建知识库没反应、构建代码知识库报错或出现数据库记录偏差怎么办？

该项目如何处理代码数据的 Embedding？普通的文本模型效果不好怎么办？

数据处理器、知识图谱等功能目前上线了吗？

相似工具推荐

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|今天

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 139k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 107.7k|★★☆☆☆|2天前

开发框架图像Agent

NextChat

NextChat 是一款轻量且极速的 AI 助手，旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性，以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发，NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言，它也提供了便捷的自托管方案，支持一键部署到 Vercel 或 Zeabur 等平台。 NextChat 的核心亮点在于其广泛的模型兼容性，原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型，让用户在一个界面即可自由切换不同 AI 能力。此外，它还率先支持 MCP（Model Context Protocol）协议，增强了上下文处理能力。针对企业用户，NextChat 提供专业版解决方案，具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能，满足公司对数据隐私和个性化管理的高标准要求。

★ 87.6k|★★☆☆☆|今天

开发框架语言模型

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。

★ 85k|★★☆☆☆|今天

图像数据工具视频

ragflow

RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。

★ 77.1k|★★★☆☆|2天前

Agent图像开发框架