geminicli2api
geminicli2api 是一个基于 FastAPI 构建的代理服务器,旨在将 Google 的 Gemini CLI 工具转化为标准的 API 接口。它主要解决了开发者希望利用 Google 免费 Gemini 配额,却又需要兼容现有 OpenAI 接口或直接调用原生 Gemini 服务的痛点。通过该工具,用户可以无缝切换,既能在不修改代码的情况下使用熟悉的 OpenAI 格式,也能直接访问 Gemini 的原生功能。
这款工具特别适合软件开发者和 AI 研究人员使用,尤其是那些正在构建多模态应用或需要灵活调度不同大模型资源的团队。其技术亮点在于全面支持流式响应、文本与图像的多模态输入,并集成了 Google 搜索 grounding 功能以提供基于实时信息的回答。此外,它还允许用户精细控制模型的“思考”过程(如启用或限制推理步骤)。geminicli2api 原生支持 Docker 容器化部署,并针对 Hugging Face Spaces 进行了优化配置,配合多种灵活的认证方式,让本地测试或云端快速搭建变得简单高效。
使用场景
某初创团队正在开发一款多模态客服机器人,急需低成本接入具备谷歌搜索增强能力的大模型,但现有代码库完全基于 OpenAI 接口构建。
没有 geminicli2api 时
- 重构成本高昂:为了调用免费的 Google Gemini API,开发人员必须重写所有聊天接口代码,将原本适配 OpenAI 格式的请求逻辑全部推翻。
- 功能集成困难:难以直接利用 Gemini 特有的“谷歌搜索接地(Grounding)”和“思维链控制”功能,因为这些特性在原生 CLI 中才容易配置,API 层缺乏统一入口。
- 部署流程繁琐:团队需要在本地管理复杂的 Google OAuth 凭证文件,且无法通过标准的 Docker 容器快速在不同环境间迁移服务。
- 流式响应缺失:自行搭建代理时往往忽略 Streaming 支持,导致用户等待回复时界面卡顿,体验远不如实时生成的流畅感。
使用 geminicli2api 后
- 零代码迁移:只需将 OpenAI 客户端的
base_url指向 geminicli2api 的服务地址,原有业务代码无需任何修改即可无缝切换至 Gemini 后端。 - 高级特性即开即用:通过简单的模型名称后缀(如
-search或-nothinking),即可在标准 API 调用中直接激活谷歌搜索验证和思维深度控制。 - 容器化一键部署:利用内置的 Docker 镜像和 Hugging Face Spaces 支持,团队几分钟内即可完成包含身份认证和环境变量的服务上线。
- 完美流式体验:geminicli2api 原生支持双格式流式传输,确保前端能实时接收并渲染每一个生成的字符,大幅提升交互流畅度。
geminicli2api 成功打破了模型厂商间的接口壁垒,让开发者能以最低成本免费享用谷歌最强模型的全部高级特性。
运行环境要求
- Linux
- macOS
- Windows
未说明
未说明

快速开始
title: Gemini CLI 到 API 代理 emoji: 🤖 colorFrom: blue colorTo: purple sdk: docker pinned: false license: mit app_port: 7860
Gemini CLI 到 API 代理 (geminicli2api)
一个基于 FastAPI 的代理服务器,可将 Gemini CLI 工具转换为兼容 OpenAI 的接口以及原生的 Gemini API 接口。这使您能够通过熟悉的 OpenAI API 接口或直接调用 Gemini API,来利用 Google 提供的免费 Gemini API 配额。
🚀 功能
- 兼容 OpenAI 的 API:可无缝替代 OpenAI 的聊天完成 API。
- 原生 Gemini API:直接代理 Google 的 Gemini API。
- 流式支持:两种 API 格式均支持实时流式响应。
- 多模态支持:支持文本和图像输入。
- 认证方式:多种认证方法(Bearer、Basic、API 密钥)。
- Google 搜索增强:启用
-search模型以实现基于 Google 搜索的增强响应。 - 思考/推理控制:通过
-nothinking和-maxthinking模型控制 Gemini 的思考过程。 - Docker 支持:容器化部署,方便快捷。
- Hugging Face Spaces:可直接部署到 Hugging Face 平台。
🔧 环境变量
必需
GEMINI_AUTH_PASSWORD:用于 API 访问的认证密码。
可选凭证来源(任选其一)
GEMINI_CREDENTIALS:包含 Google OAuth 凭证的 JSON 字符串。GOOGLE_APPLICATION_CREDENTIALS:Google OAuth 凭证文件的路径。GOOGLE_CLOUD_PROJECT:Google Cloud 项目 ID。GEMINI_PROJECT_ID:备用项目 ID 变量。
凭证 JSON 示例
{
"client_id": "your-client-id",
"client_secret": "your-client-secret",
"token": "your-access-token",
"refresh_token": "your-refresh-token",
"scopes": ["https://www.googleapis.com/auth/cloud-platform"],
"token_uri": "https://oauth2.googleapis.com/token"
}
📡 API 端点
兰兼容 OpenAI 的端点
POST /v1/chat/completions- 聊天完成(流式与非流式)GET /v1/models- 列出可用模型
原生 Gemini 端点
GET /v1beta/models- 列出 Gemini 模型POST /v1beta/models/{model}:generateContent- 生成内容POST /v1beta/models/{model}:streamGenerateContent- 流式生成内容- 所有其他 Gemini API 端点均被代理转发。
实用端点
GET /health- 用于容器编排的健康检查
🔐 认证
API 支持多种认证方式:
- Bearer Token:
Authorization: Bearer YOUR_PASSWORD - Basic Auth:
Authorization: Basic base64(username:YOUR_PASSWORD) - 查询参数:
?key=YOUR_PASSWORD - Google Header:
x-goog-api-key: YOUR_PASSWORD
🐳 Docker 使用
# 构建镜像
docker build -t geminicli2api .
# 在默认端口 8888 上运行(兼容性)
docker run -p 8888:8888 \
-e GEMINI_AUTH_PASSWORD=your_password \
-e GEMINI_CREDENTIALS='{"client_id":"...","token":"..."}' \
-e PORT=8888 \
geminicli2api
# 在端口 7860 上运行(兼容 Hugging Face)
docker run -p 7860:7860 \
-e GEMINI_AUTH_PASSWORD=your_password \
-e GEMINI_CREDENTIALS='{"client_id":"...","token":"..."}' \
-e PORT=7860 \
geminicli2api
Docker Compose
# 默认设置(端口 8888)
docker-compose up -d
# Hugging Face 设置(端口 7860)
docker-compose --profile hf up -d geminicli2api-hf
🤗 Hugging Face Spaces
本项目已配置为可在 Hugging Face Spaces 上部署:
- 分叉此仓库。
- 在 Hugging Face 上创建一个新的 Space。
- 连接您的仓库。
- 在 Space 设置中配置所需的环境变量:
GEMINI_AUTH_PASSWORDGEMINI_CREDENTIALS(或其他凭证来源)。
Space 将自动使用包含的 Dockerfile 进行构建和部署。
📝 OpenAI API 示例
import openai
# 配置客户端以使用您的代理
client = openai.OpenAI(
base_url="http://localhost:8888/v1", # 或 7860 用于 HF
api_key="your_password" # 您的 GEMINI_AUTH_PASSWORD
)
# 像使用普通 OpenAI API 一样使用
response = client.chat.completions.create(
model="gemini-2.5-pro-maxthinking",
messages=[
{"role": "user", "content": "用简单的话解释相对论。"}
],
stream=True
)
# 将推理过程与最终答案分开
for chunk in response:
if chunk.choices[0].delta.reasoning_content:
print(f"思考中:{chunk.choices[0].delta.reasoning_content}")
if chunk.choices[0].delta.content:
print(chunk.choices[0].delta.content, end="")
🔧 原生 Gemini API 示例
import requests
headers = {
"Authorization": "Bearer your_password",
"Content-Type": "application/json"
}
data = {
"contents": [
{
"role": "user",
"parts": [{"text": "用简单的话解释相对论。"}]
}
],
"thinkingConfig": {
"thinkingBudget": 32768,
"includeThoughts": True
}
}
response = requests.post(
"http://localhost:8888/v1beta/models/gemini-2.5-pro:generateContent", # 或 7860 用于 HF
headers=headers,
json=data
)
print(response.json())
🎯 支持的模型
基础模型
gemini-2.5-progemini-2.5-flashgemini-1.5-progemini-1.5-flashgemini-1.0-pro
模型变体
代理会自动为 gemini-2.5-pro 和 gemini-2.5-flash 模型创建变体:
-search:在模型名称后添加-search以启用 Google 搜索增强。- 示例:
gemini-2.5-pro-search
- 示例:
-nothinking:在模型名称后添加-nothinking以减少推理步骤。- 示例:
gemini-2.5-flash-nothinking
- 示例:
-maxthinking:在模型名称后添加-maxthinking以最大化推理预算。- 示例:
gemini-2.5-pro-maxthinking
- 示例:
📄 许可证
MIT 许可证 - 详情请参阅 LICENSE 文件。
🤝 贡献
欢迎贡献!请随时提交 Pull Request。
常见问题
相似工具推荐
everything-claude-code
everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上
gemini-cli
gemini-cli 是一款由谷歌推出的开源 AI 命令行工具,它将强大的 Gemini 大模型能力直接集成到用户的终端环境中。对于习惯在命令行工作的开发者而言,它提供了一条从输入提示词到获取模型响应的最短路径,无需切换窗口即可享受智能辅助。 这款工具主要解决了开发过程中频繁上下文切换的痛点,让用户能在熟悉的终端界面内直接完成代码理解、生成、调试以及自动化运维任务。无论是查询大型代码库、根据草图生成应用,还是执行复杂的 Git 操作,gemini-cli 都能通过自然语言指令高效处理。 它特别适合广大软件工程师、DevOps 人员及技术研究人员使用。其核心亮点包括支持高达 100 万 token 的超长上下文窗口,具备出色的逻辑推理能力;内置 Google 搜索、文件操作及 Shell 命令执行等实用工具;更独特的是,它支持 MCP(模型上下文协议),允许用户灵活扩展自定义集成,连接如图像生成等外部能力。此外,个人谷歌账号即可享受免费的额度支持,且项目基于 Apache 2.0 协议完全开源,是提升终端工作效率的理想助手。
markitdown
MarkItDown 是一款由微软 AutoGen 团队打造的轻量级 Python 工具,专为将各类文件高效转换为 Markdown 格式而设计。它支持 PDF、Word、Excel、PPT、图片(含 OCR)、音频(含语音转录)、HTML 乃至 YouTube 链接等多种格式的解析,能够精准提取文档中的标题、列表、表格和链接等关键结构信息。 在人工智能应用日益普及的今天,大语言模型(LLM)虽擅长处理文本,却难以直接读取复杂的二进制办公文档。MarkItDown 恰好解决了这一痛点,它将非结构化或半结构化的文件转化为模型“原生理解”且 Token 效率极高的 Markdown 格式,成为连接本地文件与 AI 分析 pipeline 的理想桥梁。此外,它还提供了 MCP(模型上下文协议)服务器,可无缝集成到 Claude Desktop 等 LLM 应用中。 这款工具特别适合开发者、数据科学家及 AI 研究人员使用,尤其是那些需要构建文档检索增强生成(RAG)系统、进行批量文本分析或希望让 AI 助手直接“阅读”本地文件的用户。虽然生成的内容也具备一定可读性,但其核心优势在于为机器
LLMs-from-scratch
LLMs-from-scratch 是一个基于 PyTorch 的开源教育项目,旨在引导用户从零开始一步步构建一个类似 ChatGPT 的大型语言模型(LLM)。它不仅是同名技术著作的官方代码库,更提供了一套完整的实践方案,涵盖模型开发、预训练及微调的全过程。 该项目主要解决了大模型领域“黑盒化”的学习痛点。许多开发者虽能调用现成模型,却难以深入理解其内部架构与训练机制。通过亲手编写每一行核心代码,用户能够透彻掌握 Transformer 架构、注意力机制等关键原理,从而真正理解大模型是如何“思考”的。此外,项目还包含了加载大型预训练权重进行微调的代码,帮助用户将理论知识延伸至实际应用。 LLMs-from-scratch 特别适合希望深入底层原理的 AI 开发者、研究人员以及计算机专业的学生。对于不满足于仅使用 API,而是渴望探究模型构建细节的技术人员而言,这是极佳的学习资源。其独特的技术亮点在于“循序渐进”的教学设计:将复杂的系统工程拆解为清晰的步骤,配合详细的图表与示例,让构建一个虽小但功能完备的大模型变得触手可及。无论你是想夯实理论基础,还是为未来研发更大规模的模型做准备
NextChat
NextChat 是一款轻量且极速的 AI 助手,旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性,以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发,NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。 这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言,它也提供了便捷的自托管方案,支持一键部署到 Vercel 或 Zeabur 等平台。 NextChat 的核心亮点在于其广泛的模型兼容性,原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型,让用户在一个界面即可自由切换不同 AI 能力。此外,它还率先支持 MCP(Model Context Protocol)协议,增强了上下文处理能力。针对企业用户,NextChat 提供专业版解决方案,具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能,满足公司对数据隐私和个性化管理的高标准要求。
ML-For-Beginners
ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程,旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周,包含 26 节精炼课程和 52 道配套测验,内容涵盖从基础概念到实际应用的完整流程,有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。 无论是希望转型的开发者、需要补充算法背景的研究人员,还是对人工智能充满好奇的普通爱好者,都能从中受益。课程不仅提供了清晰的理论讲解,还强调动手实践,让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持,通过自动化机制提供了包括简体中文在内的 50 多种语言版本,极大地降低了全球不同背景用户的学习门槛。此外,项目采用开源协作模式,社区活跃且内容持续更新,确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路,ML-For-Beginners 将是理想的起点。