chroma-mcp

534 106 简单 1 次阅读 4天前Apache-2.0开发框架数据工具

AI 解读由 AI 自动生成，仅供参考

chroma-mcp 是一个基于模型上下文协议（MCP）构建的服务器，旨在为大型语言模型（LLM）提供强大的向量数据库能力。它让 AI 应用能够轻松连接 Chroma 数据库，实现数据的持久化存储、语义搜索及元数据过滤，有效解决了大模型缺乏长期记忆和难以检索外部私有数据的痛点。

这款工具特别适合开发者使用，尤其是那些希望为 Python 或 JavaScript LLM 应用添加“记忆”功能的技术人员。无论是进行本地原型开发，还是部署生产级的自托管服务，chroma-mcp 都能灵活适配。其独特亮点在于支持多种客户端模式：既包含便于测试的内存模式，也支持基于文件的持久化存储，还能直接对接自托管实例或 Chroma 云服务。此外，它内置了丰富的管理工具，涵盖集合创建、文档增删改查及高级语义查询，并兼容 OpenAI、Cohere、Jina 等多种主流嵌入函数。通过标准化的 MCP 接口，chroma-mcp 让开发者无需编写复杂的集成代码，即可让 AI 智能体高效地存取和利用结构化知识。

使用场景

某初创团队正在开发一款基于大模型的企业内部知识库助手，需要让 AI 能够准确回答关于公司历史项目文档和技术规范的问题。

没有 chroma-mcp 时

开发者需手动编写复杂的 Python 代码来连接 Chroma 数据库，处理向量嵌入生成、存储和检索逻辑，开发周期长且容易出错。
AI 模型无法直接访问外部文档数据，每次查询都需要通过硬编码的 API 接口中转，导致上下文丢失，回答缺乏针对性。
难以动态管理数据集合，新增或更新文档时往往需要重启服务或手动干预数据库，无法实现实时的知识迭代。
缺乏统一的元数据过滤机制，当用户询问特定部门或时间的文档时，系统只能返回模糊匹配结果，准确率低下。

使用 chroma-mcp 后

借助 chroma-mcp 的标准 MCP 协议，AI 模型可直接调用 chroma_add_documents 和 chroma_query_documents 等工具，无需编写底层集成代码，即刻拥有记忆能力。
模型能自主执行语义搜索，根据用户问题自动从 Chroma 中检索最相关的文档片段作为上下文，显著提升了回答的精准度和专业度。
利用 chroma_modify_collection 和 chroma_update_documents 工具，系统可实时增删改查知识库内容，确保 AI 掌握的信息始终最新。
通过内置的元数据过滤功能，AI 能在查询时精确锁定特定项目或日期的文档，彻底解决了信息过载和匹配不准的问题。

chroma-mcp 将繁琐的向量数据库操作转化为 AI 原生的工具调用，让构建具备长期记忆的智能应用变得像对话一样简单。

运行环境要求

操作系统

Linux
macOS
Windows

GPU

未说明

内存

未说明

依赖

notes该工具是一个 MCP 服务器，主要通过 'uvx' 命令运行，无需手动配置复杂的 Python 环境。支持四种客户端模式：临时（内存）、持久化（本地文件）、HTTP（自托管 Chroma 实例）和 Cloud（Chroma 云服务）。若使用外部嵌入模型（如 Cohere, OpenAI 等），需配置相应的 API Key 环境变量。持久化模式需指定数据目录路径。

python未说明 (通过 uvx 运行)

chroma-mcp

uvx

快速开始

Chroma - 开源嵌入数据库.
使用记忆构建 Python 或 JavaScript LLM 应用的最快方式！

| | 文档 | 主页

Chroma MCP 服务器

模型上下文协议（MCP）是一种开放协议，旨在实现 LLM 应用程序与外部数据源或工具之间的无缝集成，提供标准化框架，使 LLM 能够轻松获取所需的上下文信息。

该服务器基于 Chroma 提供数据检索功能，支持 AI 模型对生成数据和用户输入创建集合，并通过向量搜索、全文搜索、元数据过滤等方式检索这些数据。

这是一个用于自托管 Chroma 访问权限的 MCP 服务器。如果您正在寻找 Package Search，可以在此处找到其仓库：https://github.com/chroma-core/package-search。

功能

灵活的客户端类型
- 短暂型（内存中）：用于测试和开发
- 持久型：基于文件存储
- HTTP 客户端：用于自托管的 Chroma 实例
- 云客户端：用于 Chroma Cloud 集成（自动连接到 api.trychroma.com）
集合管理
- 创建、修改和删除集合
- 分页列出所有集合
- 获取集合信息和统计信息
- 配置 HNSW 参数以优化向量搜索
- 在创建集合时选择嵌入函数
文档操作
- 添加带有可选元数据和自定义 ID 的文档
- 使用语义搜索查询文档
- 基于元数据和文档内容进行高级过滤
- 根据 ID 或过滤条件检索文档
- 全文搜索功能

支持的工具

chroma_list_collections - 分页列出所有集合
chroma_create_collection - 创建新集合，可选 HNSW 配置
chroma_peek_collection - 查看集合中的样本文档
chroma_get_collection_info - 获取集合的详细信息
chroma_get_collection_count - 获取集合中的文档数量
chroma_modify_collection - 更新集合名称或元数据
chroma_delete_collection - 删除集合
chroma_add_documents - 添加文档，可选元数据和自定义 ID
chroma_query_documents - 使用语义搜索结合高级过滤查询文档
chroma_get_documents - 根据 ID 或过滤条件分页检索文档
chroma_update_documents - 更新现有文档的内容、元数据或嵌入向量
chroma_delete_documents - 从集合中删除特定文档

嵌入函数

Chroma MCP 支持多种嵌入函数：default、cohere、openai、jina、voyageai 和 roboflow。

嵌入函数会利用 Chroma 的集合配置，该配置会持久化集合所选的嵌入函数以便后续检索。一旦使用集合配置创建了集合，在未来的查询和插入操作中，将始终使用相同的嵌入函数，无需再次指定。嵌入函数的持久化功能是在 Chroma 1.0.0 版本中引入的，因此如果您使用版本 ≤0.6.3 创建了集合，则不支持此功能。

当使用依赖外部 API 的嵌入函数时，请务必按照正确的格式添加 API 密钥的环境变量，具体请参阅嵌入函数环境变量。

与 Claude Desktop 的使用方法

若要添加短暂型客户端，请在 claude_desktop_config.json 文件中添加以下内容：

"chroma": {
    "command": "uvx",
    "args": [
        "chroma-mcp"
    ]
}

若要添加持久型客户端，请在 claude_desktop_config.json 文件中添加以下内容：

"chroma": {
    "command": "uvx",
    "args": [
        "chroma-mcp",
        "--client-type",
        "persistent",
        "--data-dir",
        "/full/path/to/your/data/directory"
    ]
}

这将创建一个持久型客户端，并使用指定的数据目录。

若要连接到 Chroma Cloud，请在 claude_desktop_config.json 文件中添加以下内容：

"chroma": {
    "command": "uvx",
    "args": [
        "chroma-mcp",
        "--client-type",
        "cloud",
        "--tenant",
        "your-tenant-id",
        "--database",
        "your-database-name",
        "--api-key",
        "your-api-key"
    ]
}

这将创建一个云客户端，自动通过 SSL 连接到 api.trychroma.com。

注意：在本地设备上直接在参数中添加 API 密钥是安全的，但为了安全起见，您也可以在 args 列表中使用 --dotenv-path 参数指定自定义的环境配置文件路径，例如："args": ["chroma-mcp", "--dotenv-path", "/custom/path/.env"]。

若要连接到您自己云服务商上的自托管 Chroma 实例，请在 claude_desktop_config.json 文件中添加以下内容：

"chroma": {
    "command": "uvx",
    "args": [
      "chroma-mcp", 
      "--client-type", 
      "http", 
      "--host", 
      "your-host", 
      "--port", 
      "your-port", 
      "--custom-auth-credentials",
      "your-custom-auth-credentials",
      "--ssl",
      "true"
    ]
}

这将创建一个 HTTP 客户端，连接到您的自托管 Chroma 实例。

示例

您可以在 Chroma MCP 文档中找到参考用法，例如共享知识库以及如何将记忆添加到上下文窗口中。

使用环境变量

您还可以使用环境变量来配置客户端。服务器会自动从位于 --dotenv-path 指定路径下的 .env 文件（默认为工作目录中的 .chroma_env）或系统环境变量中加载变量。命令行参数优先于环境变量。


# 常用变量
export CHROMA_CLIENT_TYPE="http"  # 或 "cloud"、"persistent"、"ephemeral"

# 对于持久化客户端
export CHROMA_DATA_DIR="/完整/路径/到/你的/数据/目录"

# 对于云客户端（Chroma Cloud）
export CHROMA_TENANT="你的租户ID"
export CHROMA_DATABASE="你的数据库名称"
export CHROMA_API_KEY="你的API密钥"

# 对于HTTP客户端（自托管）
export CHROMA_HOST="你的主机"
export CHROMA_PORT="你的端口"
export CHROMA_CUSTOM_AUTH_CREDENTIALS="你的自定义认证凭据"
export CHROMA_SSL="true"

# 可选：指定 .env 文件路径（默认为 .chroma_env）
export CHROMA_DOTENV_PATH="/路径/到/你的/.env"

嵌入函数环境变量

当使用需要访问 API 密钥的外部嵌入函数时，请遵循命名规范 CHROMA_<>_API_KEY="<key>"。例如，要设置 Cohere 的 API 密钥，需设置环境变量 CHROMA_COHERE_API_KEY=""。建议将这些变量添加到某个 .env 文件中，并通过 CHROMA_DOTENV_PATH 环境变量或 --dotenv-path 标志来指定该文件的位置，以确保安全存储。

Chroma MCP 快速上手指南

Chroma MCP 是一个基于模型上下文协议（MCP）的服务器，旨在让大语言模型（如 Claude）能够无缝连接 Chroma 向量数据库。通过它，AI 可以创建集合、存储文档、执行语义搜索及元数据过滤，从而为应用赋予长期记忆能力。

环境准备

在开始之前，请确保您的开发环境满足以下要求：

操作系统：Linux, macOS 或 Windows (WSL2 推荐)。
Python 环境：建议安装 Python 3.9+。
UV 包管理器：本项目推荐使用 uv 来运行工具（无需手动安装 Python 依赖包）。
- 安装命令：curl -LsSf https://astral.sh/uv/install.sh | sh (Linux/macOS) 或在 PowerShell 中运行官方安装脚本。
Claude Desktop：已安装并配置好 Claude 桌面客户端。
API Keys（可选）：如果您计划使用 OpenAI、Cohere 等外部嵌入模型，需准备好相应的 API Key。

安装步骤

Chroma MCP 无需复杂的源码编译，主要通过 uvx 直接运行。核心配置在于修改 Claude Desktop 的配置文件。

1. 定位配置文件

找到 Claude Desktop 的配置文件 claude_desktop_config.json：

macOS: ~/Library/Application Support/Claude/claude_desktop_config.json
Windows: %APPDATA%\Claude\claude_desktop_config.json

2. 配置 MCP 服务器

根据您的使用场景（测试、本地持久化、云端或自建），在配置文件的 "mcpServers" 字段下添加以下任一配置块。

方案 A：临时模式（Ephemeral）

适用于快速测试和开发，数据仅保存在内存中，重启即失。

"chroma": {
    "command": "uvx",
    "args": [
        "chroma-mcp"
    ]
}

方案 B：持久化模式（Persistent）

适用于本地开发，将数据保存到指定目录。

"chroma": {
    "command": "uvx",
    "args": [
        "chroma-mcp",
        "--client-type",
        "persistent",
        "--data-dir",
        "/full/path/to/your/data/directory"
    ]
}

请将 /full/path/to/your/data/directory 替换为您本地的实际路径。

方案 C：连接 Chroma Cloud

适用于使用官方云服务。

"chroma": {
    "command": "uvx",
    "args": [
        "chroma-mcp",
        "--client-type",
        "cloud",
        "--tenant",
        "your-tenant-id",
        "--database",
        "your-database-name",
        "--api-key",
        "your-api-key"
    ]
}

方案 D：连接自建 Chroma 实例

适用于连接部署在自己服务器上的 Chroma。

"chroma": {
    "command": "uvx",
    "args": [
      "chroma-mcp", 
      "--client-type", 
      "http", 
      "--host", 
      "your-host", 
      "--port", 
      "your-port", 
      "--custom-auth-credentials",
      "your-custom-auth-credentials",
      "--ssl",
      "true"
    ]
}

安全提示：建议在项目目录下创建 .env 文件存储敏感信息（如 API Key），并在 args 中添加 "--dotenv-path", "/path/to/.env" 参数，避免将密钥硬编码在 JSON 配置中。

基本使用

配置完成后，重启 Claude Desktop。您现在可以在对话中直接使用自然语言操作向量数据库。

支持的常用操作

Chroma MCP 提供了丰富的工具供 AI 调用，包括但不限于：

chroma_create_collection：创建新的知识库集合。
chroma_add_documents：向集合中添加文档（支持自动嵌入）。
chroma_query_documents：执行语义搜索查询。
chroma_list_collections：查看现有集合列表。

使用示例

场景 1：创建知识库并添加内容 您可以直接在对话框中输入：

"请创建一个名为 'project_docs' 的集合，并将以下关于 Python 异步编程的笔记添加进去：[此处粘贴笔记内容]。"

AI 会自动调用 chroma_create_collection 和 chroma_add_documents 工具完成操作。如果未指定嵌入模型，默认使用内置函数；若需使用 OpenAI 等，请确保已在环境变量中配置 CHROMA_OPENAI_API_KEY。

场景 2：检索信息

"在 'project_docs' 集合中搜索关于 'asyncio' 的相关内容，并总结给我。"

AI 将调用 chroma_query_documents 进行向量检索，结合上下文为您提供精准答案。

场景 3：查看集合状态

"告诉我当前有哪些集合，以及 'project_docs' 里有多少个文档。"

AI 将调用 chroma_list_collections 和 chroma_get_collection_count 返回统计信息。

环境变量配置（进阶）

如果需要全局配置嵌入模型的 API Key，可以在终端导出变量或在 .env 文件中设置：

# 设置 OpenAI API Key (用于嵌入)
export CHROMA_OPENAI_API_KEY="sk-..."

# 指定 .env 文件路径
export CHROMA_DOTENV_PATH="/path/to/your/.env"

支持的嵌入模型包括：default, cohere, openai, jina, voyageai, roboflow。

版本历史

v0.2.62025/08/14

v0.2.52025/06/19

v0.2.42025/05/22

v0.2.32025/05/22

v0.2.22025/04/08

v0.2.12025/04/04

v0.2.02025/04/02

常见问题

调用 chroma_query_documents 时遇到 'Expected include to be a list, got None' 错误怎么办？

在 Docker 中运行 Chroma 时提示 'Connection refused' 或无法访问集合怎么办？

启动时出现 'Could not connect to a Chroma server' 或 SSL 相关错误如何解决？

如何正确配置 Chroma MCP 以连接到本地自托管的 HTTP 服务器？

为什么调用 list_collections 没有返回结果或提示集合不存在？

遇到工具执行错误时，如何优化错误提示以便更好地调试？

相似工具推荐

openclaw

OpenClaw 是一款专为个人打造的本地化 AI 助手，旨在让你在自己的设备上拥有完全可控的智能伙伴。它打破了传统 AI 助手局限于特定网页或应用的束缚，能够直接接入你日常使用的各类通讯渠道，包括微信、WhatsApp、Telegram、Discord、iMessage 等数十种平台。无论你在哪个聊天软件中发送消息，OpenClaw 都能即时响应，甚至支持在 macOS、iOS 和 Android 设备上进行语音交互，并提供实时的画布渲染功能供你操控。这款工具主要解决了用户对数据隐私、响应速度以及“始终在线”体验的需求。通过将 AI 部署在本地，用户无需依赖云端服务即可享受快速、私密的智能辅助，真正实现了“你的数据，你做主”。其独特的技术亮点在于强大的网关架构，将控制平面与核心助手分离，确保跨平台通信的流畅性与扩展性。 OpenClaw 非常适合希望构建个性化工作流的技术爱好者、开发者，以及注重隐私保护且不愿被单一生态绑定的普通用户。只要具备基础的终端操作能力（支持 macOS、Linux 及 Windows WSL2），即可通过简单的命令行引导完成部署。如果你渴望拥有一个懂你

★ 349.3k|★★★☆☆|1周前

Agent开发框架图像

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|1周前

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 154.3k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 108.3k|★★☆☆☆|3天前

开发框架图像Agent

gemini-cli

gemini-cli 是一款由谷歌推出的开源 AI 命令行工具，它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言，它提供了一条从输入提示词到获取模型响应的最短路径，无需切换窗口即可享受智能辅助。这款工具主要解决了开发过程中频繁上下文切换的痛点，让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用，还是执行复杂的 Git 操作，gemini-cli 都能通过自然语言指令高效处理。它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口，具备出色的逻辑推理能力；内置 Google 搜索、文件操作及 Shell 命令执行等实用工具；更独特的是，它支持 MCP（模型上下文协议），允许用户灵活扩展自定义集成，连接如图像生成等外部能力。此外，个人谷歌账号即可享受免费的额度支持，且项目基于 Apache 2.0 协议完全开源，是提升终端工作效率的理想助手。

★ 100.8k|★★☆☆☆|4天前

插件Agent图像

markitdown

MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器

★ 93.4k|★★☆☆☆|1周前

插件开发框架