cocoindex-code

1.2k 87 非常简单 1 次阅读今天Apache-2.0插件Agent

AI 解读由 AI 自动生成，仅供参考

cocoindex-code 是一款超轻量级的嵌入式代码搜索命令行工具，专为提升编程效率而生。它基于抽象语法树（AST）进行语义级代码搜索，能够精准理解代码逻辑而非仅仅匹配文本，从而帮助开发者在庞大的代码库中快速定位所需功能。

在使用 AI 编程助手（如 Claude、Cursor 等）时，cocoindex-code 能显著减少上下文传递的 Token 消耗，节省幅度高达 70%，同时大幅提升搜索与响应速度。它解决了传统关键词搜索不够智能、以及直接让 AI 阅读全量代码导致成本高昂且缓慢的痛点。

这款工具非常适合软件开发者、技术团队以及经常使用 AI 辅助编程的人员。其最大亮点在于“零配置”即可上手：安装后无需复杂初始化，内置本地嵌入模型，完全免费且保护隐私。此外，它支持通过 Skill 或 MCP 协议无缝集成到各类 Coding Agent 中，让 AI 自动调用语义搜索能力，实现更智能的代码理解与生成。底层依托高性能的 Rust 引擎 CocoIndex，确保了极速的数据处理体验。无论是日常开发调试，还是维护大型项目，cocoindex-code 都能成为你得力的智能搜索伙伴。

使用场景

某后端开发团队在维护一个拥有数十万行代码的遗留微服务系统时，急需定位一处隐蔽的用户会话（Session）验证逻辑漏洞。

没有 cocoindex-code 时

搜索精度低：使用传统文本搜索（如 grep 或 IDE 全局查找）只能匹配关键词，无法识别“校验令牌”、“验证身份”等语义相近但措辞不同的代码片段，导致大量漏检。
上下文噪音大：搜索结果往往包含大量无关的注释、变量名或测试用例，开发者需人工逐行筛选，耗费大量精力辨别有效信息。
AI 代理成本高昂：若直接将整个代码库或大量文件投喂给 Coding Agent（如 Cursor、Claude）进行询问，会消耗巨额 Token 费用，且因上下文过长导致响应速度极慢甚至超时。
配置门槛高：搭建专业的语义搜索引擎通常需要复杂的向量数据库配置和漫长的索引构建过程，难以在紧急排查中即时启用。

使用 cocoindex-code 后

语义精准命中：cocoindex-code 基于 AST（抽象语法树）进行语义理解，能直接定位到实现“会话验证”核心逻辑的函数，即使代码中未出现"session"关键字也能准确找到。
结果纯净高效：工具自动过滤无关噪音，仅返回高相关度的代码块及其调用关系，让开发者能秒级锁定问题源头。
大幅节省资源：通过预先检索关键上下文再投喂给 AI 代理，cocoindex-code 帮助团队节省了约 70% 的 Token 消耗，同时将 AI 的回答速度提升了数倍。
零配置即时启动：无需任何配置文件或手动初始化索引，安装后即刻运行，AI 代理可自动调用其技能实时保持代码索引更新，完美融入紧急修复流程。

cocoindex-code 通过轻量级的本地语义搜索，将原本耗时数小时的代码考古工作压缩至分钟级，同时显著降低了 AI 辅助编程的成本与延迟。

运行环境要求

操作系统

Linux
macOS
Windows

GPU

非必需
支持 CPU、CUDA (NVIDIA) 或 MPS (Apple Silicon)
默认使用本地模型，若需加速可配置 GPU，具体型号和显存未说明

内存

未说明

依赖

notes该工具基于 Rust 构建的高性能引擎 CocoIndex。默认使用本地嵌入模型（sentence-transformers/all-MiniLM-L6-v2），无需 API Key 且免费。支持通过 Docker 运行以避免本地环境依赖。可通过环境变量配置使用其他嵌入模型（如 Voyage AI）或调整文件过滤规则。首次运行会自动启动后台守护进程并下载模型。

python3.8+ (推断自 pipx/uv 及通用 Python 工具链要求，原文未明确指定具体版本号)

cocoindex>=1.0.0a24

sentence-transformers (默认模型：all-MiniLM-L6-v2)

pipx 或 uv (安装工具)

LiteLLM (可选，用于云嵌入模型)

快速开始

cocoindex代码

基于AST的语义代码搜索，开箱即用

effect

一款轻量级、高效的 (基于AST) 语义代码搜索工具，专为您的代码库设计。它构建于 CocoIndex 之上——一个基于Rust的超高效数据转换引擎。您可以通过CLI使用它，也可以通过 Skill 或 MCP 将其集成到Claude、Codex、Cursor等任何编码助手中。

立即节省70%的token消耗。
1分钟设置 — 安装即用，无需任何配置！

🌟 如果您喜欢这个项目，请帮忙给 CocoIndex 点个赞吧！

开始使用 — 无需配置，马上上手！

安装

使用 pipx：

pipx install cocoindex-code       # 首次安装
pipx upgrade cocoindex-code       # 升级

使用 uv：

uv tool install --upgrade cocoindex-code --prerelease explicit --with "cocoindex>=1.0.0a24"

默认嵌入模型在本地运行（sentence-transformers/all-MiniLM-L6-v2)——无需API密钥，完全免费。

接下来，设置您的编码助手集成——或者如果您更喜欢直接控制，可以直接跳到手动CLI使用。

编码助手集成

Skill（推荐）

安装 ccc 技能，这样您的编码助手会在需要时自动使用语义搜索：

npx skills add cocoindex-io/cocoindex-code

就这么简单——无需 ccc init 或 ccc index。该技能会教会助手自行完成初始化、索引和搜索。它会在您工作时自动保持索引最新。

当语义搜索有帮助时，助手会自动使用它。您也可以明确提示它——只需让它搜索代码库，例如“查找用户会话是如何管理的”，或者输入 /ccc 直接调用该技能。

适用于 Claude Code 及其他兼容技能的助手。

MCP服务器

或者，您可以使用 ccc mcp 作为MCP服务器运行：

Claude Code

claude mcp add cocoindex-code -- ccc mcp

Codex

codex mcp add cocoindex-code -- ccc mcp

OpenCode

opencode mcp add
输入MCP服务器名称：`cocoindex-code`
选择MCP服务器类型：`local`
输入要运行的命令：`ccc mcp`

或者使用 opencode.json：
```json
{
  "$schema": "https://opencode.ai/config.json",
  "mcp": {
    "cocoindex-code": {
      "type": "local",
      "command": [
        "ccc", "mcp"
      ]
    }
  }
}

一旦配置完毕，助手会自动判断何时使用语义代码搜索是有帮助的——根据描述查找代码、探索不熟悉的代码库、进行模糊或概念匹配，或者在不知道确切名称的情况下定位实现。

注意： cocoindex-code 命令（无子命令）仍然可以作为MCP服务器运行，以保持向后兼容性。首次运行时，它会根据环境变量自动创建设置。

MCP工具参考

作为MCP服务器运行时（ccc mcp），会暴露以下工具：

search — 使用语义相似度搜索代码库。

search(
    query: str,                          # 自然语言查询或代码片段
    limit: int = 5,                      # 最大结果数（1-100）
    offset: int = 0,                     # 分页偏移量
    refresh_index: bool = True,          # 查询前刷新索引
    languages: list[str] | None = None,  # 按语言过滤（例如["python", "typescript"]）
    paths: list[str] | None = None,      # 按路径glob过滤（例如["src/utils/*"]）
)

返回匹配的代码片段，包含文件路径、语言、代码内容、行号和相似度分数。

手动CLI使用

您也可以直接使用CLI——这对于手动控制、更改设置后重新索引、检查状态，或在助手之外进行搜索非常有用。

ccc init                                # 初始化项目（创建设置）
ccc index                               # 构建索引
ccc search "authentication logic"       # 搜索！

后台守护进程会在首次使用时自动启动。

提示： 如果您尚未运行 ccc init，ccc index 会自动初始化，因此您可以直接跳到索引阶段。

CLI 参考

命令	描述
`ccc init`	初始化项目 — 创建设置文件，并将 `.cocoindex_code/` 添加到 `.gitignore` 中
`ccc index`	构建或更新索引（必要时自动初始化）。显示流式进度。
`ccc search <query>`	在代码库中进行语义搜索
`ccc status`	显示索引统计信息（分块数、文件数、语言分布）
`ccc mcp`	以 stdio 模式作为 MCP 服务器运行
`ccc doctor`	运行诊断 — 检查设置、守护进程、模型、文件匹配和索引健康状况
`ccc reset`	删除索引数据库。`--all` 选项还会移除设置。`-f` 选项可跳过确认。
`ccc daemon status`	显示守护进程版本、运行时间和已加载的项目
`ccc daemon restart`	重启后台守护进程
`ccc daemon stop`	停止守护进程

搜索选项

ccc search database schema                           # 基本搜索
ccc search --lang python --lang markdown schema      # 按语言过滤
ccc search --path 'src/utils/*' query handler        # 按路径过滤
ccc search --offset 10 --limit 5 database schema     # 分页
ccc search --refresh database schema                 # 先更新索引，再进行搜索

默认情况下，ccc search 的搜索范围限定在当前工作目录内（相对于项目根目录）。可以使用 --path 参数来覆盖此行为。

Docker

对于希望拥有可复现且无依赖环境的团队，我们提供了 Docker 镜像——宿主机上无需安装 Python、uv 或其他系统依赖。

推荐的做法是使用持久化容器：只需启动一次，然后通过 docker exec 来运行 CLI 命令或连接 MCP 会话。容器内的守护进程会在会话之间保持运行状态，因此嵌入模型只需加载一次。

步骤 1 — 启动容器

docker run -d --name cocoindex-code \
  --volume "$(pwd):/workspace" \
  --volume cocoindex-db:/db \
  --volume cocoindex-model-cache:/root/.cache \
  ghcr.io/cocoindex-io/cocoindex-code:latest

/workspace — 将您的项目根目录挂载到这里
cocoindex-db — 索引数据库存储在容器内部（本地 I/O 速度快，不存在跨操作系统卷的问题）
cocoindex-model-cache — 在镜像升级时仍能保留嵌入模型

步骤 2 — 索引您的代码库

docker exec -it cocoindex-code ccc index

步骤 3 — 连接您的编码助手

Claude Code

claude mcp add cocoindex-code -- docker exec -i cocoindex-code ccc mcp

或者通过 .mcp.json：

{
  "mcpServers": {
    "cocoindex-code": {
      "type": "stdio",
      "command": "docker",
      "args": ["exec", "-i", "cocoindex-code", "ccc", "mcp"]
    }
  }
}

Codex

codex mcp add cocoindex-code -- docker exec -i cocoindex-code ccc mcp

容器内的 CLI 使用

所有 ccc 命令都可以通过 docker exec 来执行：

docker exec -it cocoindex-code ccc index
docker exec -it cocoindex-code ccc search "authentication logic"
docker exec -it cocoindex-code ccc status

您也可以在宿主机上设置别名，使其使用起来更自然：

alias ccc='docker exec -it cocoindex-code ccc'

通过环境变量配置

使用 -e 参数将配置传递给 docker run：

# 额外的文件扩展名（例如 Typesafe Config、SBT 构建文件）
-e COCOINDEX_CODE_EXTRA_EXTENSIONS="conf,sbt"

# 排除构建产物（Scala/SBT 示例）
-e COCOINDEX_CODE_EXCLUDE_PATTERNS='["**/target/**","**/.bloop/**","**/.metals/**"]'

# 替换为针对代码优化的嵌入模型
-e COCOINDEX_CODE_EMBEDDING_MODEL=voyage/voyage-code-3
-e VOYAGE_API_KEY=your-key

在本地构建镜像

docker build -t cocoindex-code:local -f docker/Dockerfile .

功能

语义代码搜索：当 grep 效果不佳时，使用自然语言查询找到相关代码，同时立即节省 token。
超高效：⚡ 基于高性能的 Rust 索引引擎构建。仅对更改的文件重新索引，实现快速更新。
多语言支持：Python、JavaScript/TypeScript、Rust、Go、Java、C/C++、C#、SQL、Shell 等。
嵌入式：便携易用，无需数据库设置！
灵活的嵌入模型：默认使用本地 SentenceTransformers（免费），也可通过 LiteLLM 调用 100 多家云服务提供商的模型。

配置

配置信息存储在两个 YAML 文件中，这两个文件都会由 ccc init 自动创建。

用户设置（`~/.cocoindex_code/global_settings.yml`）

在所有项目间共享。用于控制嵌入模型以及守护进程的环境变量。

embedding:
  provider: sentence-transformers                    # 或 "litellm"
  model: sentence-transformers/all-MiniLM-L6-v2
  device: mps                                        # 可选：cpu、cuda、mps（未指定时自动检测）

envs:                                                # 守护进程的额外环境变量
  OPENAI_API_KEY: your-key                           # 仅当您的 shell 环境中尚未设置时才需要

注意：守护进程会继承您的 shell 环境。如果某个 API 密钥（例如 OPENAI_API_KEY）已在您的 shell 环境中设置，则无需在 envs 中重复设置。envs 字段仅用于那些未包含在您环境中的值。

项目设置（`<project>/.cocoindex_code/settings.yml`）

按项目配置。用于控制要索引的文件。

include_patterns:
  - "**/*.py"
  - "**/*.js"
  - "**/*.ts"
  - "**/*.rs"
  - "**/*.go"
  # ... （针对28种以上文件类型的合理默认值）

exclude_patterns:
  - "**/.*"                # 隐藏目录
  - "**/__pycache__"
  - "**/node_modules"
  - "**/dist"
  # ...

language_overrides:
  - ext: inc               # 将 .inc 文件视为 PHP
    lang: php

chunkers:
  - ext: toml              # 对 .toml 文件使用自定义分块器
    module: example_toml_chunker:toml_chunker

.cocoindex_code/ 会在初始化时自动添加到 .gitignore 中。

当您希望在索引之前控制某种文件类型如何被分割成块时，可以使用 chunkers。

module: example_toml_chunker:toml_chunker 表示：

example_toml_chunker 是一个本地 Python 模块
toml_chunker 是该模块中的函数

实际操作中，通常意味着：

您在项目中创建一个 Python 文件，例如 example_toml_chunker.py
在该文件中添加一个函数
使用 module.path:function_name 将其指向 settings.yml

该函数应采用以下签名：

from pathlib import Path
from cocoindex_code.chunking import Chunk

def my_chunker(path: Path, content: str) -> tuple[str | None, list[Chunk]]:
    ...

path 是正在索引的文件
content 是该文件的完整文本
如果您想覆盖语言检测，请返回类似 "toml" 的字符串作为 language_override
如果您想保留检测到的语言，请将 language_override 设置为 None
返回一个包含您希望存储在索引中的分块的 list[Chunk]

有关公共类型，请参阅 src/cocoindex_code/chunking.py，完整的示例请参考 tests/example_toml_chunker.py。

嵌入模型

默认情况下，会使用本地 SentenceTransformers 模型（sentence-transformers/all-MiniLM-L6-v2），无需 API 密钥。若要使用其他模型，请编辑 ~/.cocoindex_code/global_settings.yml。

下面的 envs 条目仅在您的 shell 环境中尚未包含密钥时才需要——守护进程会自动继承您的环境变量。

Ollama（本地）

embedding:
  model: ollama/nomic-embed-text

如果您的 Ollama 服务器不在 http://localhost:11434，请在 envs: 中设置 OLLAMA_API_BASE。

OpenAI

embedding:
  model: text-embedding-3-small
envs:
  OPENAI_API_KEY: your-api-key

Azure OpenAI

embedding:
  model: azure/your-deployment-name
envs:
  AZURE_API_KEY: your-api-key
  AZURE_API_BASE: https://your-resource.openai.azure.com
  AZURE_API_VERSION: "2024-06-01"

Gemini

embedding:
  model: gemini/gemini-embedding-001
envs:
  GEMINI_API_KEY: your-api-key

Mistral

embedding:
  model: mistral/mistral-embed
envs:
  MISTRAL_API_KEY: your-api-key

Voyage（代码优化版）

embedding:
  model: voyage/voyage-code-3
envs:
  VOYAGE_API_KEY: your-api-key

Cohere

embedding:
  model: cohere/embed-v4.0
envs:
  COHERE_API_KEY: your-api-key

AWS Bedrock

embedding:
  model: bedrock/amazon.titan-embed-text-v2:0
envs:
  AWS_ACCESS_KEY_ID: your-access-key
  AWS_SECRET_ACCESS_KEY: your-secret-key
  AWS_REGION_NAME: us-east-1

Nebius

embedding:
  model: nebius/BAAI/bge-en-icl
envs:
  NEBIUS_API_KEY: your-api-key

任何 LiteLLM 支持的模型都可以使用。使用 LiteLLM 模型时，需设置 provider: litellm（或省略 provider——对于非 sentence-transformers 模型，默认为 LiteLLM）。

本地 SentenceTransformers 模型

设置 provider: sentence-transformers，并使用任何 SentenceTransformers 模型（无需 API 密钥）。

示例——通用文本模型：

embedding:
  provider: sentence-transformers
  model: nomic-ai/nomic-embed-text-v1.5

针对 GPU 优化的代码检索：

nomic-ai/CodeRankEmbed 提供的代码检索效果显著优于默认模型。该模型拥有 1.37 亿参数，需要约 1 GB 显存，并具有 8192 个标记的上下文窗口。

embedding:
  provider: sentence-transformers
  model: nomic-ai/CodeRankEmbed

注意： 更换模型需要重新索引您的代码库（ccc reset && ccc index），因为向量维度不同。

支持的语言

语言	别名	文件扩展名
c		`.c`
cpp	c++	`.cpp`, `.cc`, `.cxx`, `.h`, `.hpp`
csharp	csharp, cs	`.cs`
css		`.css`, `.scss`
dtd		`.dtd`
fortran	f, f90, f95, f03	`.f`, `.f90`, `.f95`, `.f03`
go	golang	`.go`
html		`.html`, `.htm`
java		`.java`
javascript	js	`.js`
json		`.json`
kotlin		`.kt`, `.kts`
lua		`.lua`
markdown	md	`.md`, `.mdx`
pascal	pas, dpr, delphi	`.pas`, `.dpr`
php		`.php`
python		`.py`
r		`.r`
ruby		`.rb`
rust	rs	`.rs`
scala		`.scala`
solidity		`.sol`
sql		`.sql`
swift		`.swift`
toml		`.toml`
tsx		`.tsx`
typescript	ts	`.ts`
xml		`.xml`
yaml		`.yaml`, `.yml`

自定义数据库位置

默认情况下，索引数据库（cocoindex.db 和 target_sqlite.db）与设置文件一同位于 <project>/.cocoindex_code/。在 Docker 中运行时，为了性能考虑，您可能希望将数据库放在容器的原生文件系统上（LMDB 在挂载卷上表现不佳），同时将源代码和设置文件保留在挂载卷上。

通过设置 COCOINDEX_CODE_DB_PATH_MAPPING，可以根据路径前缀重新映射数据库位置：

COCOINDEX_CODE_DB_PATH_MAPPING=/workspace=/db-files

使用此映射后，位于 /workspace/myrepo 的项目会将其数据库存储在 /db-files/myrepo/，而不是 /workspace/myrepo/.cocoindex_code/。设置文件仍保留在原始位置。

多个映射之间用逗号分隔，并按顺序解析（以第一个匹配为准）：

COCOINDEX_CODE_DB_PATH_MAPPING=/workspace=/db-files,/workspace2=/db-files2

源路径和目标路径都必须是绝对路径。如果没有匹配的映射，则使用默认位置。

故障排除

运行 ccc doctor 可诊断常见问题。它会一次性检查您的设置、守护进程状态、嵌入模型、文件匹配情况以及索引状态。

`sqlite3.Connection 对象没有属性 enable_load_extension`

某些 Python 安装（例如 macOS 上预装的版本）附带的 SQLite 库不支持扩展。

macOS 解决方案： 通过 Homebrew 安装 Python：

brew install python3

然后重新安装 cocoindex-code（安装选项请参阅入门指南）：

使用 pipx：

pipx install cocoindex-code       # 首次安装
pipx upgrade cocoindex-code       # 升级

使用 uv（安装或升级）：

uv tool install --upgrade cocoindex-code --prerelease explicit --with "cocoindex>=1.0.0a24"

遗留：环境变量

如果您之前曾通过环境变量配置 cocoindex-code，则 cocoindex-code 的 MCP 命令仍会读取这些变量，并在首次运行时自动迁移到 YAML 配置文件。对于新项目，我们建议切换到 YAML 配置。

环境变量	YAML 等效项
`COCOINDEX_CODE_EMBEDDING_MODEL`	`global_settings.yml` 中的 `embedding.model`
`COCOINDEX_CODE_DEVICE`	`global_settings.yml` 中的 `embedding.device`
`COCOINDEX_CODE_ROOT_PATH`	改为在项目根目录下运行 `ccc init`
`COCOINDEX_CODE_EXCLUDED_PATTERNS`	项目 `settings.yml` 中的 `exclude_patterns`
`COCOINDEX_CODE_EXTRA_EXTENSIONS`	项目 `settings.yml` 中的 `include_patterns` 和 `language_overrides`

大型代码库 / 企业级应用

CocoIndex 是一款超高效的索引引擎，能够处理大规模的企业级代码库。在企业场景中，当存在大量或大型代码仓库时，与团队成员共享索引将更加高效。我们还为企业用户提供了分支去重等高级功能。

如果您需要远程部署方面的帮助，请发送邮件至我们的维护者 linghua@cocoindex.io，我们将竭诚为您服务！

贡献

我们欢迎社区贡献！在开始之前，请先安装 pre-commit 钩子，以便在每次提交前自动运行代码检查、格式化、类型检查和测试：

pip install pre-commit
pre-commit install

这将帮助您在代码进入 CI 流水线之前，及时发现常见的问题，例如尾随空格、代码风格错误（Ruff）、类型错误（mypy）以及测试失败。

更多详细信息，请参阅我们的贡献指南。

许可证

Apache-2.0

cocoindex-code 快速上手指南

cocoindex-code 是一款基于抽象语法树（AST）的轻量级语义代码搜索工具。它能帮助你在大型代码库中通过自然语言快速定位代码，显著减少 AI 编程助手的 Token 消耗（最高节省 70%）。无需复杂配置，安装即可使用。

环境准备

操作系统：Linux、macOS 或 Windows (WSL)
运行时依赖：
- 推荐安装 pipx 用于隔离安装 Python 应用。
- 或者使用 uv 进行更快速的包管理。
网络要求：首次运行时会自动下载默认的本地嵌入模型 (sentence-transformers/all-MiniLM-L6-v2)，请确保网络畅通。如需使用国内加速，可配置 Hugging Face 镜像环境变量。

安装步骤

你可以选择以下任意一种方式进行安装：

方式一：使用 pipx（推荐）

pipx install cocoindex-code       # 首次安装
pipx upgrade cocoindex-code       # 升级版本

方式二：使用 uv

uv tool install --upgrade cocoindex-code --prerelease explicit --with "cocoindex>=1.0.0a24"

提示：默认使用本地运行的嵌入模型，无需 API Key，完全免费。

基本使用

安装完成后，你可以通过命令行直接使用，或将其集成到 Claude Code、Cursor 等 AI 编程助手之中。

1. 命令行直接使用 (CLI)

这是最基础的使用方式，适用于手动搜索或脚本调用。

初始化与索引构建 进入你的项目根目录，运行以下命令。ccc index 会自动检测并创建必要的配置文件，若未初始化会自动执行初始化流程。

ccc index                               # 构建或更新代码索引（显示实时进度）

执行语义搜索 使用自然语言描述你要查找的功能，而非精确的关键字。

ccc search "用户会话是如何管理的"       # 搜索中文描述
ccc search "authentication logic"       # 搜索英文描述

常用搜索选项

# 按编程语言过滤
ccc search --lang python --lang markdown "数据库连接池"

# 按文件路径过滤
ccc search --path 'src/utils/*' "错误处理逻辑"

# 查看索引状态
ccc status

后台守护进程会在首次使用时自动启动，无需手动管理。

2. 集成到 AI 编程助手 (推荐)

让 AI 助手自动调用语义搜索，提升回答准确率并节省 Token。

方案 A：使用 Skill 模式 (最简单)

适用于支持 Skill 的 Agent（如 Claude Code）。只需运行一次，Agent 即可自动学会何时调用搜索。

npx skills add cocoindex-io/cocoindex-code

使用方法：在对话中直接询问 "查找项目中处理用户登录的代码"，或输入 /ccc 强制触发搜索。

方案 B：使用 MCP 服务器模式

适用于需要显式配置 MCP 的工具（如 Cursor, Codex, OpenCode）。

Claude Code 配置示例：

claude mcp add cocoindex-code -- ccc mcp

Cursor / 通用 MCP 配置： 在工具的 MCP 设置中添加以下配置：

Command: ccc
Args: mcp

配置完成后，AI 助手将自动决定何时进行语义搜索，以理解代码库结构或查找具体实现。

3. 高级用法：Docker 部署

如果你希望环境完全隔离且可复现，可以使用 Docker。

启动容器：

docker run -d --name cocoindex-code \
  --volume "$(pwd):/workspace" \
  --volume cocoindex-db:/db \
  --volume cocoindex-model-cache:/root/.cache \
  ghcr.io/cocoindex-io/cocoindex-code:latest

在容器内构建索引和搜索：

docker exec -it cocoindex-code ccc index
docker exec -it cocoindex-code ccc search "核心业务逻辑"

配置别名以便像本地命令一样使用：

alias ccc='docker exec -it cocoindex-code ccc'

版本历史

v0.2.102026/03/24

v0.2.92026/03/24

v0.2.82026/03/22

v0.2.72026/03/21

v0.2.62026/03/21

v0.2.52026/03/20

v0.2.42026/03/19

v0.2.32026/03/17

v0.2.22026/03/17

v0.2.12026/03/17

v0.2.02026/03/16

v0.1.142026/03/13

v0.1.132026/03/12

v0.1.122026/03/11

v0.1.112026/03/10

v0.1.102026/03/08

v0.1.92026/03/05

v0.1.82026/03/04

v0.1.72026/03/03

v0.1.62026/02/26

常见问题

为什么在 Windows 上执行搜索操作时会超时？

如何避免使用包含安全漏洞（凭证窃取）的 litellm 依赖版本？

运行索引命令时进程卡住或内存占用过高怎么办？

如何配置以排除特定文件夹或文件（如 .gitignore 中的内容）不被索引？

索引过程极其缓慢甚至长时间无响应，如何解决？

如何使用自定义本地嵌入模型（例如 nomic-embed-text）？

相似工具推荐

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面，旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点，将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师，还是想要深入探索模型潜力的开发者与研究人员，都能从中获益。其核心亮点在于极高的功能丰富度：不仅支持文生图、图生图、局部重绘（Inpainting）和外绘（Outpainting）等基础模式，还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外，它内置了 GFPGAN 和 CodeFormer 等人脸修复工具，支持多种神经网络放大算法，并允许用户通过插件系统无限扩展能力。即使是显存有限的设备，stable-diffusion-webui 也提供了相应的优化选项，让高质量的 AI 艺术创作变得触手可及。

★ 162.1k|★★★☆☆|今天

开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 139k|★★☆☆☆|今天

开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎，专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式，采用直观的节点式流程图界面，让用户通过连接不同的功能模块即可构建个性化的生成管线。这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景，也能自由组合模型、调整参数并实时预览效果，轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性，不仅支持 Windows、macOS 和 Linux 全平台，还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构，并率先支持 SDXL、Flux、SD3 等前沿模型。无论是希望深入探索算法潜力的研究人员和开发者，还是追求极致创作自由度的设计师与资深 AI 绘画爱好者，ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能，使其成为当前最灵活、生态最丰富的开源扩散模型工具之一，帮助用户将创意高效转化为现实。

★ 107.7k|★★☆☆☆|2天前

开发框架图像Agent

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。

★ 85k|★★☆☆☆|今天

图像数据工具视频

ragflow

RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。

★ 77.1k|★★★☆☆|2天前

Agent图像开发框架

OpenHands

OpenHands 是一个专注于 AI 驱动开发的开源平台，旨在让智能体（Agent）像人类开发者一样理解、编写和调试代码。它解决了传统编程中重复性劳动多、环境配置复杂以及人机协作效率低等痛点，通过自动化流程显著提升开发速度。无论是希望提升编码效率的软件工程师、探索智能体技术的研究人员，还是需要快速原型验证的技术团队，都能从中受益。OpenHands 提供了灵活多样的使用方式：既可以通过命令行（CLI）或本地图形界面在个人电脑上轻松上手，体验类似 Devin 的流畅交互；也能利用其强大的 Python SDK 自定义智能体逻辑，甚至在云端大规模部署上千个智能体并行工作。其核心技术亮点在于模块化的软件智能体 SDK，这不仅构成了平台的引擎，还支持高度可组合的开发模式。此外，OpenHands 在 SWE-bench 基准测试中取得了 77.6% 的优异成绩，证明了其解决真实世界软件工程问题的能力。平台还具备完善的企业级功能，支持与 Slack、Jira 等工具集成，并提供细粒度的权限管理，适合从个人开发者到大型企业的各类用户场景。

★ 70.6k|★★★☆☆|今天

语言模型Agent开发框架

使用场景

没有 cocoindex-code 时

使用 cocoindex-code 后

运行环境要求

快速开始

基于AST的语义代码搜索，开箱即用

开始使用 — 无需配置，马上上手！

安装

编码助手集成

Skill（推荐）

MCP服务器

手动CLI使用

CLI 参考

搜索选项

Docker

步骤 1 — 启动容器

步骤 2 — 索引您的代码库

步骤 3 — 连接您的编码助手

容器内的 CLI 使用

通过环境变量配置

在本地构建镜像

功能

配置

用户设置（~/.cocoindex_code/global_settings.yml）

项目设置（<project>/.cocoindex_code/settings.yml）

嵌入模型

本地 SentenceTransformers 模型

支持的语言

自定义数据库位置

故障排除

sqlite3.Connection 对象没有属性 enable_load_extension

遗留：环境变量

大型代码库 / 企业级应用

贡献

许可证

cocoindex-code 快速上手指南

环境准备

安装步骤

方式一：使用 pipx（推荐）

方式二：使用 uv

基本使用

1. 命令行直接使用 (CLI)

2. 集成到 AI 编程助手 (推荐)

方案 A：使用 Skill 模式 (最简单)

方案 B：使用 MCP 服务器模式

3. 高级用法：Docker 部署

版本历史

常见问题

相似工具推荐

stable-diffusion-webui

everything-claude-code

ComfyUI

ML-For-Beginners

ragflow

OpenHands

用户设置（`~/.cocoindex_code/global_settings.yml`）

项目设置（`<project>/.cocoindex_code/settings.yml`）

`sqlite3.Connection 对象没有属性 enable_load_extension`