claude-code-proxy

2.4k 331 简单 1 次阅读今天MIT语言模型插件

AI 解读由 AI 自动生成，仅供参考

claude-code-proxy 是一款轻量级代理服务器，旨在打通 Claude Code 命令行工具与各类 OpenAI 兼容 API 之间的壁垒。它核心解决了用户希望在使用官方 Claude Code 界面时，能够灵活调用 OpenAI、Azure、Ollama 本地模型或其他第三方大模型服务的需求，无需修改原始客户端代码。

通过智能协议转换，该工具能将 Claude 特有的 API 请求实时映射为标准的 OpenAI 格式，完美支持流式输出、函数调用（Tool Use）以及图片输入等高级特性。其独特的“智能模型映射”功能允许用户通过环境变量自由指定不同规模的模型（如将 Claude Opus 请求指向 GPT-4o），并支持自动注入自定义 HTTP 头以满足特定鉴权或追踪需求。

这款工具特别适合开发者、技术研究人员及热衷于本地部署大模型的极客用户。如果你希望在不放弃 Claude Code 优秀交互体验的前提下，低成本地测试不同模型效果或利用本地算力，claude-code-proxy 提供了一个配置灵活、开箱即用的桥梁方案，让模型切换变得简单高效。

使用场景

某初创团队希望利用功能强大的 Claude Code CLI 进行自动化代码重构，但受限于预算无法承担 Anthropic 官方 API 的高昂费用，只能使用自建的本地 Ollama 模型或低价的 OpenAI 兼容接口。

没有 claude-code-proxy 时

工具链断裂：Claude Code CLI 强制绑定 Anthropic 官方接口，无法直接连接团队已有的本地大模型或第三方低成本 API。
开发流程受阻：工程师被迫放弃熟悉的命令行工作流，转而使用功能残缺的网页版或其他不支持复杂工具调用的客户端。
成本与性能两难：若要维持原有工作流必须购买昂贵的官方 Token，若改用其他模型则需重新编写大量适配脚本，维护成本极高。
功能缺失：本地模型虽免费，但因缺乏标准的函数调用（Function Calling）转换层，无法执行文件读写等核心自动化任务。

使用 claude-code-proxy 后

无缝接入多源模型：通过简单的环境变量配置，将 BIG_MODEL 映射为本地 Ollama 运行的 Qwen2.5-Coder，让 Claude Code 直接“以为”在调用官方服务。
保留完整工作流：团队无需更改任何操作习惯，继续在终端中使用 claude 命令，即可享受流式输出和实时交互体验。
大幅降低运营成本：利用开源模型替代商业 API，将单次重构任务的 Token 成本从数美元降至几乎为零，同时支持自定义 Header 对接企业内部鉴权。
激活高级能力：proxy 自动处理协议转换，使本地模型也能完美支持工具调用（Tool Use），成功执行批量代码修复和单元测试生成。

claude-code-proxy 的核心价值在于打破了专有客户端与模型供应商的强绑定，让开发者能以最低成本自由组合最合适的算力资源与最高效的开发工具。

运行环境要求

操作系统

Linux
macOS
Windows

GPU

未说明

内存

未说明

依赖

notes该工具是一个代理服务器，用于将 Claude API 请求转换为 OpenAI 兼容的 API 调用，本身不运行大型模型，因此对 GPU 和内存无特殊高要求。推荐使用 UV 管理依赖。支持通过 Docker Compose 部署。主要配置通过 .env 文件完成，需设置目标提供商的 API Key。

python未说明 (需支持 uv 或 pip)

uv (推荐)

pip

python-dotenv

httpx

black

isort

mypy

快速开始

Claude Code 代理

一个代理服务器，使 Claude Code 能够与兼容 OpenAI 的 API 提供商协同工作。它会将 Claude API 请求转换为 OpenAI API 调用，从而允许您通过 Claude Code CLI 使用各种 LLM 提供商。

Claude Code 代理

功能特性

完全兼容 Claude API：完整支持 /v1/messages 端点
多提供商支持：OpenAI、Azure OpenAI、本地模型（Ollama）以及任何兼容 OpenAI 的 API
智能模型映射：通过环境变量配置 BIG 和 SMALL 模型
函数调用：完整支持工具使用，并进行正确转换
流式响应：实时 SSE 流式传输支持
图像支持：Base64 编码的图像输入
自定义头部：自动注入用于 API 请求的自定义 HTTP 头部
错误处理：全面的错误处理和日志记录

快速开始

1. 安装依赖

# 使用 UV（推荐）
uv sync

# 或者使用 pip
pip install -r requirements.txt

2. 配置

cp .env.example .env
# 编辑 .env 文件并添加您的 API 配置
# 注意：环境变量会自动从 .env 文件加载

3. 启动服务器

# 直接运行
python start_proxy.py

# 或者使用 UV
uv run claude-code-proxy

# 或者使用 Docker Compose
docker compose up -d

4. 与 Claude Code 一起使用

# 如果代理中未设置 ANTHROPIC_API_KEY：
ANTHROPIC_BASE_URL=http://localhost:8082 ANTHROPIC_API_KEY="any-value" claude

# 如果代理中设置了 ANTHROPIC_API_KEY：
ANTHROPIC_BASE_URL=http://localhost:8082 ANTHROPIC_API_KEY="exact-matching-key" claude

配置说明

应用程序会使用 python-dotenv 自动从项目根目录下的 .env 文件加载环境变量。您也可以直接在 shell 中设置环境变量。

环境变量

必填项：

OPENAI_API_KEY - 您的目标提供商的 API 密钥

安全性：

ANTHROPIC_API_KEY - 用于客户端验证的预期 Anthropic API 密钥
- 如果已设置，客户端必须提供此确切的 API 密钥才能访问代理
- 如果未设置，任何 API 密钥都将被接受

模型配置：

BIG_MODEL - 用于 Claude opus 请求的模型（默认：gpt-4o）
MIDDLE_MODEL - 用于 Claude opus 请求的模型（默认：gpt-4o）
SMALL_MODEL - 用于 Claude haiku 请求的模型（默认：gpt-4o-mini）

API 配置：

OPENAI_BASE_URL - API 基础 URL（默认：https://api.openai.com/v1）

服务器设置：

HOST - 服务器主机（默认：0.0.0.0）
PORT - 服务器端口（默认：8082）
LOG_LEVEL - 日志级别（默认：WARNING）

性能：

MAX_TOKENS_LIMIT - 令牌限制（默认：4096）
REQUEST_TIMEOUT - 请求超时时间，单位为秒（默认：90）

自定义头部：

CUSTOM_HEADER_* - 用于 API 请求的自定义头部（例如：CUSTOM_HEADER_ACCEPT、CUSTOM_HEADER_AUTHORIZATION）
- 在 .env 文件中取消注释以启用自定义头部

自定义头部配置

通过设置以 CUSTOM_HEADER_ 为前缀的环境变量，您可以为 API 请求添加自定义头部：

# 取消注释以启用自定义头部
# CUSTOM_HEADER_ACCEPT="application/jsonstream"
# CUSTOM_HEADER_CONTENT_TYPE="application/json"
# CUSTOM_HEADER_USER_AGENT="your-app/1.0.0"
# CUSTOM_HEADER_AUTHORIZATION="Bearer your-token"
# CUSTOM_HEADER_X_API_KEY="your-api-key"
# CUSTOM_HEADER_X_CLIENT_ID="your-client-id"
# CUSTOM_HEADER_X_CLIENT_VERSION="1.0.0"
# CUSTOM_HEADER_X_REQUEST_ID="unique-request-id"
# CUSTOM_HEADER_X_TRACE_ID="trace-123"
# CUSTOM_HEADER_X_SESSION_ID="session-456"

头部转换规则

以 CUSTOM_HEADER_ 为前缀的环境变量会自动转换为 HTTP 头部：

环境变量：CUSTOM_HEADER_ACCEPT
HTTP 头部：ACCEPT
环境变量：CUSTOM_HEADER_X_API_KEY
HTTP 头部：X-API-KEY
环境变量：CUSTOM_HEADER_AUTHORIZATION
HTTP 头部：AUTHORIZATION

支持的头部类型

内容类型：ACCEPT、CONTENT-TYPE
认证：AUTHORIZATION、X-API-KEY
客户端标识：USER-AGENT、X-CLIENT-ID、X-CLIENT-VERSION
追踪：X-REQUEST-ID、X-TRACE-ID、X-SESSION-ID

使用示例

# 基本配置
OPENAI_API_KEY="sk-your-openai-api-key-here"
OPENAI_BASE_URL="https://api.openai.com/v1"

# 启用自定义头部（根据需要取消注释）
CUSTOM_HEADER_ACCEPT="application/jsonstream"
CUSTOM_HEADER_CONTENT_TYPE="application/json"
CUSTOM_HEADER_USER_AGENT="my-app/1.0.0"
CUSTOM_HEADER_AUTHORIZATION="Bearer my-token"

代理会自动将这些头部包含在所有针对目标 LLM 提供商的 API 请求中。

模型映射

代理会将 Claude 模型请求映射到您配置的模型：

Claude 请求	映射到	环境变量
包含 "haiku" 的模型	`SMALL_MODEL`	默认：`gpt-4o-mini`
包含 "sonnet" 的模型	`MIDDLE_MODEL`	默认：`BIG_MODEL`
包含 "opus" 的模型	`BIG_MODEL`	默认：`gpt-4o`

提供商示例

OpenAI

OPENAI_API_KEY="sk-your-openai-key"
OPENAI_BASE_URL="https://api.openai.com/v1"
BIG_MODEL="gpt-4o"
MIDDLE_MODEL="gpt-4o"
SMALL_MODEL="gpt-4o-mini"

Azure OpenAI

OPENAI_API_KEY="your-azure-key"
OPENAI_BASE_URL="https://your-resource.openai.azure.com/openai/deployments/your-deployment"
BIG_MODEL="gpt-4"
MIDDLE_MODEL="gpt-4"
SMALL_MODEL="gpt-35-turbo"

本地模型（Ollama）

OPENAI_API_KEY="dummy-key"  # 必需，但可以是假的
OPENAI_BASE_URL="http://localhost:11434/v1"
BIG_MODEL="llama3.1:70b"
MIDDLE_MODEL="llama3.1:70b"
SMALL_MODEL="llama3.1:8b"

其他提供商

只需设置相应的 OPENAI_BASE_URL，即可使用任何兼容 OpenAI 的 API。

使用示例

基本聊天

import httpx

response = httpx.post(
    "http://localhost:8082/v1/messages",
    json={
        "model": "claude-3-5-sonnet-20241022",  # 映射到 MIDDLE_MODEL
        "max_tokens": 100,
        "messages": [
            {"role": "user", "content": "Hello!"}
        ]
    }
)

与 Claude Code 的集成

该代理专为与 Claude Code CLI 无缝协作而设计：

# 启动代理
python start_proxy.py

# 使用 Claude Code 并连接代理
ANTHROPIC_BASE_URL=http://localhost:8082 claude

# 或者永久设置
export ANTHROPIC_BASE_URL=http://localhost:8082
claude

测试

测试代理功能：

# 运行全面测试
python src/test_claude_to_openai.py

开发

使用 UV

# 安装依赖
uv sync

# 运行服务器
uv run claude-code-proxy

# 格式化代码
uv run black src/
uv run isort src/

# 类型检查
uv run mypy src/

项目结构

claude-code-proxy/
├── src/
│   ├── main.py                     # 主服务器
│   ├── test_claude_to_openai.py    # 测试脚本
│   └── [其他模块...]
├── start_proxy.py                  # 启动脚本
├── .env.example                    # 配置模板
└── README.md                       # 本文档

性能

使用 async/await 实现高并发
采用 连接池 提升效率
支持 流式传输，实现实时响应
可配置的超时和 重试机制
具备 智能错误处理 并记录详细日志

许可证

MIT 许可证

Claude Code Proxy 快速上手指南

环境准备

在开始之前，请确保您的开发环境满足以下要求：

操作系统：Linux, macOS 或 Windows (WSL 推荐)
Python 版本：Python 3.8+
包管理工具：推荐使用 uv (速度更快)，也可使用 pip
API Key：拥有一个 OpenAI 兼容的 API Key（如 OpenAI 官方、Azure OpenAI、Ollama 本地模型等）

安装步骤

1. 克隆项目并安装依赖

推荐使用 uv 进行依赖管理，以获得更快的安装速度。

# 使用 UV (推荐)
git clone <repository-url>
cd claude-code-proxy
uv sync

# 或者使用 pip
pip install -r requirements.txt

2. 配置环境变量

复制示例配置文件并根据您的需求进行修改。

cp .env.example .env

编辑 .env 文件，填入必要的配置信息：

# .env 文件示例内容

# [必填] 目标提供商的 API Key
OPENAI_API_KEY="sk-your-api-key-here"

# [可选] 目标提供商的基础 URL (默认为 OpenAI 官方)
# OpenAI: https://api.openai.com/v1
# Azure: https://your-resource.openai.azure.com/openai/deployments/your-deployment
# Ollama: http://localhost:11434/v1
OPENAI_BASE_URL="https://api.openai.com/v1"

# [可选] 模型映射配置 (将 Claude 模型映射到实际可用的模型)
BIG_MODEL="gpt-4o"        # 对应 Claude Opus/Sonnet 请求
MIDDLE_MODEL="gpt-4o"     # 对应 Claude Sonnet 请求
SMALL_MODEL="gpt-4o-mini" # 对应 Claude Haiku 请求

# [可选] 客户端验证密钥 (若设置，调用代理时必须提供此密钥)
# ANTHROPIC_API_KEY="any-secret-key"

基本使用

1. 启动代理服务

您可以选择直接运行 Python 脚本或使用 uv 启动。

# 方式一：直接运行
python start_proxy.py

# 方式二：使用 UV
uv run claude-code-proxy

# 方式三：使用 Docker Compose (如果已安装 Docker)
docker compose up -d

默认情况下，服务将运行在 http://0.0.0.0:8082。

2. 配合 Claude Code CLI 使用

启动代理后，通过设置环境变量将 claude 命令指向本地代理服务。

场景 A：未在 .env 中设置 ANTHROPIC_API_KEY 此时代理接受任意 Key，只需指定 Base URL：

ANTHROPIC_BASE_URL=http://localhost:8082 ANTHROPIC_API_KEY="any-value" claude

场景 B：已在 .env 中设置了 ANTHROPIC_API_KEY 此时必须提供完全匹配的 Key 才能通过验证：

ANTHROPIC_BASE_URL=http://localhost:8082 ANTHROPIC_API_KEY="exact-matching-key" claude

3. 验证功能

您也可以通过简单的 HTTP 请求测试代理是否正常工作（需安装 httpx 或使用 curl）：

import httpx

response = httpx.post(
    "http://localhost:8082/v1/messages",
    json={
        "model": "claude-3-5-sonnet-20241022",  # 会自动映射为配置的 MIDDLE_MODEL
        "max_tokens": 100,
        "messages": [
            {"role": "user", "content": "Hello!"}
        ]
    }
)
print(response.json())

现在，您可以像使用原生 Claude 一样，通过该代理调用各种 OpenAI 兼容的大模型服务了。

常见问题

为什么 Gemini 模型（如 gemini-2.5-flash）无法成功调用工具（tool calling），只能进行纯对话？

运行项目时遇到 ImportError 提示缺少 'socksio' 包，或者在使用 SOCKS 代理时报错怎么办？

如何在部署到云端（如 render.com）时为代理服务添加访问令牌（AUTH_KEY）保护，防止接口被公开滥用？

程序突然无法工作，启动后调用 claude-code 没有响应或报错，但之前是正常的，该如何解决？

这个项目与 "Claude Code Router" 有什么区别？

相似工具推荐

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手（如 Claude Code、Codex、Cursor 等）打造的高性能优化系统。它不仅仅是一组配置文件，而是一个经过长期实战打磨的完整框架，旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能，everything-claude-code 能显著提升 AI 在复杂任务中的表现，帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略，使得模型响应更快、成本更低，同时有效防御潜在的攻击向量。这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库，还是需要 AI 协助进行安全审计与自动化测试，everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目，它融合了多语言支持与丰富的实战钩子（hooks），让 AI 真正成长为懂上

★ 144.7k|★★☆☆☆|今天

开发框架Agent语言模型

markitdown

MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具，专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片（含 OCR）、音频（含语音转录）、HTML 乃至 YouTube 链接等多种格式的解析，能够精准提取文档中的标题、列表、表格和链接等关键结构信息。在人工智能应用日益普及的今天，大语言模型（LLM）虽擅长处理文本，却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点，它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式，成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外，它还提供了 MCP（模型上下文协议）服务器，可无缝集成到 Claude Desktop 等 LLM 应用中。这款工具特别适合开发者、数据科学家及 AI 研究人员使用，尤其是那些需要构建文档检索增强生成（RAG）系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性，但其核心优势在于为机器

★ 93.4k|★★☆☆☆|昨天

插件开发框架

LLMs-from-scratch

LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目，旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型（LLM）。它不仅是同名技术著作的官方代码库，更提供了一套完整的实践方案，涵盖模型开发、预训练及微调的全过程。该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型，却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码，用户能够透彻掌握 Transformer 架构、注意力机制等关键原理，从而真正理解大模型是如何“思考”的。此外，项目还包含了加载大型预训练权重进行微调的代码，帮助用户将理论知识延伸至实际应用。 LLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API，而是渴望探究模型构建细节的技术人员而言，这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计：将复杂的系统工程拆解为清晰的步骤，配合详细的图表与示例，让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础，还是为未来研发更大规模的模型做准备

★ 90.1k|★★★☆☆|2天前

语言模型图像Agent

NextChat

NextChat 是一款轻量且极速的 AI 助手，旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性，以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发，NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言，它也提供了便捷的自托管方案，支持一键部署到 Vercel 或 Zeabur 等平台。 NextChat 的核心亮点在于其广泛的模型兼容性，原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型，让用户在一个界面即可自由切换不同 AI 能力。此外，它还率先支持 MCP（Model Context Protocol）协议，增强了上下文处理能力。针对企业用户，NextChat 提供专业版解决方案，具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能，满足公司对数据隐私和个性化管理的高标准要求。

★ 87.6k|★★☆☆☆|3天前

开发框架语言模型

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。

★ 85k|★★☆☆☆|2天前

图像数据工具视频

ragflow

RAGFlow 是一款领先的开源检索增强生成（RAG）引擎，旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体（Agent）能力相结合，不仅支持从各类文档中高效提取知识，还能让模型基于这些知识进行逻辑推理和任务执行。在大模型应用中，幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构（如表格、图表及混合排版），显著提升了信息检索的准确度，从而有效减少模型“胡编乱造”的现象，确保回答既有据可依又具备时效性。其内置的智能体机制更进一步，使系统不仅能回答问题，还能自主规划步骤解决复杂问题。这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统，还是致力于探索大模型在垂直领域落地的创新者，都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口，既降低了非算法背景用户的上手门槛，也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目，它正成为连接通用大模型与行业专有知识之间的重要桥梁。

★ 77.1k|★★★☆☆|4天前

Agent图像开发框架