AIstudioProxyAPI
AIstudioProxyAPI 是一款巧妙的中间层代理服务,旨在将 Google AI Studio 的网页界面转化为标准的 OpenAI 兼容 API。它通过 Camoufox 和 Playwright 技术驱动浏览器自动化,在后台模拟真实用户操作访问 Google AI Studio,并将接收到的请求转发处理,最终以开发者熟悉的 OpenAI 格式返回结果。
这一工具主要解决了无法直接通过 API 密钥调用 Google 最新模型(如 Gemini 系列)或受限于官方 API 配额的问题,让用户能够利用现有的 OpenAI 生态工具链无缝接入 Google 的先进能力。无论是需要快速集成多模型能力的开发者、进行对比实验的研究人员,还是希望在本地的 Open WebUI 等界面中直接使用 Gemini 模型的普通用户,都能从中受益。
其技术亮点在于支持三种灵活的函数调用模式(auto/native/emulated)并具备失败自动回退机制,确保调用的稳定性。此外,它还内置了认证配置文件自动轮转与 Cookie 周期刷新功能,有效维持会话长期可用。项目自带现代化的 Web UI 管理面板,提供直观的状态监控、日志查看及配置调整能力,配合无头模式启动选项,非常适合部署在服务器环境中作为稳定的后端服务使用。
使用场景
某初创团队希望将 Google 最新的 Gemini 2.5 Pro 模型集成到现有的 Open WebUI 知识库系统中,以利用其强大的长上下文处理能力,但团队缺乏官方 API 配额且现有代码库仅兼容 OpenAI 接口标准。
没有 AIstudioProxyAPI 时
- 接口协议不兼容:开发者需要重写大量后端代码来适配 Google 特有的 REST 格式,无法直接复用基于 OpenAI SDK 构建的应用逻辑。
- 人工操作繁琐:每次会话需手动打开浏览器登录 Google AI Studio 网页复制响应,无法实现自动化批量处理或流式输出。
- 连接稳定性差:单一账号高频访问极易触发风控导致 IP 封禁,缺乏自动化的 Cookie 刷新与多账号轮转机制,服务经常中断。
- 调试黑盒:遇到请求失败时,难以直观查看浏览器内部的自动化执行状态和实时日志,排查问题耗时耗力。
使用 AIstudioProxyAPI 后
- 无缝平滑迁移:通过启动本地代理服务,直接将 API Base URL 指向
http://127.0.0.1:2048/v1,原有 OpenAI 客户端代码零修改即可调用 Gemini 模型。 - 全自动化运行:利用 Camoufox + Playwright 后台自动维持浏览器会话,支持无头模式部署在服务器,实现 7x24 小时稳定的流式对话服务。
- 高可用账号管理:内置认证轮转与 Cookie 周期刷新功能,自动切换多个 Profile 分摊请求压力,显著降低被封号风险并确保持续在线。
- 可视化运维监控:通过内置的 Web UI 面板实时查看健康状态、日志流及调试信息,快速定位并解决自动化过程中的异常。
AIstudioProxyAPI 成功打破了私有网页模型与标准化开发框架之间的壁垒,让开发者能以最低成本免费、稳定地享用顶尖大模型能力。
运行环境要求
- Linux
- macOS
- Windows
未说明
最低 2GB,推荐 4GB+

快速开始
AI Studio 代理 API
将 Google AI Studio 网页界面转换为 OpenAI 兼容 API 的代理服务。通过 Camoufox + Playwright 自动化,提供稳定可控的 API 访问。
主要特性
- OpenAI 兼容 API:支持
/v1/chat/completions、/v1/models - 函数调用三模式:
auto/native/emulated,支持失败回退 - 认证轮转与 Cookie 刷新:支持 profile 自动轮转、周期刷新与关停保存
- 启动链路完整:CLI 启动器、内置 Web UI、桌面 GUI 启动器
- 现代化前端:内置设置页、状态检查与日志能力
- CI/CD 工作流:PR 检查、Release、Upstream Sync
系统要求
| 组件 | 要求 | 推荐 |
|---|---|---|
| Python | >=3.9, <4.0 | 3.10+ / 3.11+ |
| 依赖管理 | Poetry | 最新版本 |
| Node.js | 前端构建需要 | LTS |
| 内存 | >=2GB | >=4GB |
🚀 快速开始
1. 克隆并安装
git clone https://github.com/CJackHwang/AIstudioProxyAPI.git
cd AIstudioProxyAPI
poetry install --with dev
2. 配置环境
cp .env.example .env
建议先确认:PORT、STREAM_PORT、UNIFIED_PROXY_CONFIG、LAUNCH_MODE、FUNCTION_CALLING_MODE。
3. 首次认证并启动
# 首次建议 debug,完成登录并保存 auth
poetry run python launch_camoufox.py --debug
# 日常建议 headless
poetry run python launch_camoufox.py --headless
快速测试
# 健康检查
curl http://127.0.0.1:2048/health
# 模型列表
curl http://127.0.0.1:2048/v1/models
# 聊天请求
curl -X POST http://127.0.0.1:2048/v1/chat/completions \
-H "Content-Type: application/json" \
-d '{"model":"gemini-2.5-pro","messages":[{"role":"user","content":"你好"}]}'
访问 http://127.0.0.1:2048/ 使用内置 Web UI。
系统架构
graph TD
subgraph "用户端"
User["用户"]
WebUI["Web UI"]
APIClient["API 客户端"]
end
subgraph "启动与配置"
Launcher["launch_camoufox.py"]
Env[".env 配置"]
end
subgraph "核心服务"
FastAPI["FastAPI 应用<br/>api_utils/"]
BrowserOps["页面控制与自动化<br/>browser_utils/"]
StreamProxy["流式代理<br/>stream/"]
end
subgraph "外部依赖"
Camoufox["Camoufox 浏览器"]
AIStudio["Google AI Studio"]
end
User --> Launcher
Launcher --> Env
WebUI --> FastAPI
APIClient --> FastAPI
FastAPI --> BrowserOps
FastAPI --> StreamProxy
BrowserOps --> Camoufox --> AIStudio
StreamProxy --> AIStudio
运行模式
| 命令 | 说明 | 场景 |
|---|---|---|
python launch_camoufox.py --headless |
无头模式 | 日常使用、服务器 |
python launch_camoufox.py --debug |
调试模式 | 首次认证、故障排查 |
python launch_camoufox.py --virtual-display |
虚拟显示 | Linux 无 GUI 环境 |
⚙️ 配置
项目使用 .env 统一配置管理:
cp .env.example .env
核心配置示例:
| 配置 | 默认值 | 说明 |
|---|---|---|
PORT |
2048 |
主 API 端口 |
STREAM_PORT |
3120 |
流式代理端口(0 关闭) |
UNIFIED_PROXY_CONFIG |
空 | HTTP/HTTPS 代理 |
AUTO_ROTATE_AUTH_PROFILE |
true |
认证自动轮转 |
FUNCTION_CALLING_MODE |
auto |
函数调用模式 |
详细项见:配置参考
说明:配置默认值以
.env.example为准;少数配置存在代码兜底默认值,详见配置参考中的说明。
📚 文档
客户端配置示例
以 Open WebUI 为例:
- 进入设置 -> 连接
- API Base URL 填
http://127.0.0.1:2048/v1 - 若你未配置 API Keys,可留空或填任意字符;若已配置,请填写有效 Key
- 保存后即可对话
开发检查
poetry run ruff check .
poetry run pyright
poetry run pytest
前端构建:
cd static/frontend
npm ci
npm run build
致谢
- 项目发起与主要开发: @CJackHwang
- 核心维护(架构重构、测试体系): @NikkeTryHard
- 功能完善、页面操作优化: @ayuayue
- 实时流式功能优化: @luispater
- 项目重构贡献: @yattin(Holt)
- 下游维护分支致谢作者: @MasuRii
- 社区支持: Linux.do 社区
License
支持作者
如果本项目对你有帮助,欢迎支持作者持续开发:

版本历史
nightly2026/03/29v4.1.0_py2026/02/28v4.0.6_py2026/02/08v4.0.5_py2026/02/08v4.0.4_py2026/01/27v4.0.3_py2025/12/20v4.0.2_py2025/12/15v4.0.1_py2025/12/03v4.0.0_py2025/11/30v3.7.6_py2025/11/21v3.7.5_py2025/11/20v3.7.4_py2025/11/19v3.7.3_py2025/11/05v3.7.3_py_Beta2025/11/02v3.7.2_py2025/10/27v3.7.1_py2025/10/26v3.7.0_py2025/10/19v3.6.21_py2025/09/21v3.6.17_py2025/09/09v3.6.16_py2025/09/05常见问题
相似工具推荐
ML-For-Beginners
ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程,旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周,包含 26 节精炼课程和 52 道配套测验,内容涵盖从基础概念到实际应用的完整流程,有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。 无论是希望转型的开发者、需要补充算法背景的研究人员,还是对人工智能充满好奇的普通爱好者,都能从中受益。课程不仅提供了清晰的理论讲解,还强调动手实践,让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持,通过自动化机制提供了包括简体中文在内的 50 多种语言版本,极大地降低了全球不同背景用户的学习门槛。此外,项目采用开源协作模式,社区活跃且内容持续更新,确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路,ML-For-Beginners 将是理想的起点。
OpenHands
OpenHands 是一个专注于 AI 驱动开发的开源平台,旨在让智能体(Agent)像人类开发者一样理解、编写和调试代码。它解决了传统编程中重复性劳动多、环境配置复杂以及人机协作效率低等痛点,通过自动化流程显著提升开发速度。 无论是希望提升编码效率的软件工程师、探索智能体技术的研究人员,还是需要快速原型验证的技术团队,都能从中受益。OpenHands 提供了灵活多样的使用方式:既可以通过命令行(CLI)或本地图形界面在个人电脑上轻松上手,体验类似 Devin 的流畅交互;也能利用其强大的 Python SDK 自定义智能体逻辑,甚至在云端大规模部署上千个智能体并行工作。 其核心技术亮点在于模块化的软件智能体 SDK,这不仅构成了平台的引擎,还支持高度可组合的开发模式。此外,OpenHands 在 SWE-bench 基准测试中取得了 77.6% 的优异成绩,证明了其解决真实世界软件工程问题的能力。平台还具备完善的企业级功能,支持与 Slack、Jira 等工具集成,并提供细粒度的权限管理,适合从个人开发者到大型企业的各类用户场景。
gpt4free
gpt4free 是一个由社区驱动的开源项目,旨在聚合多种可访问的大型语言模型(LLM)和媒体生成接口,让用户能更灵活、便捷地使用前沿 AI 能力。它解决了直接调用各类模型时面临的接口分散、门槛高或成本昂贵等痛点,通过统一的标准将不同提供商的资源整合在一起。 无论是希望快速集成 AI 功能的开发者、需要多模型对比测试的研究人员,还是想免费体验最新技术的普通用户,都能从中受益。gpt4free 提供了丰富的使用方式:既包含易于上手的 Python 和 JavaScript 客户端库,也支持部署本地图形界面(GUI),更提供了兼容 OpenAI 标准的 REST API,方便无缝替换现有应用后端。 其技术亮点在于强大的多提供商支持架构,能够动态调度包括 Opus、Gemini、DeepSeek 等多种主流模型资源,并支持 Docker 一键部署及本地推理。项目秉持社区优先原则,在降低使用门槛的同时,也为贡献者提供了扩展新接口的便利框架,是探索和利用多样化 AI 资源的实用工具。
gstack
gstack 是 Y Combinator CEO Garry Tan 亲自开源的一套 AI 工程化配置,旨在将 Claude Code 升级为你的虚拟工程团队。面对单人开发难以兼顾产品战略、架构设计、代码审查及质量测试的挑战,gstack 提供了一套标准化解决方案,帮助开发者实现堪比二十人团队的高效产出。 这套配置特别适合希望提升交付效率的创始人、技术负责人,以及初次尝试 Claude Code 的开发者。gstack 的核心亮点在于内置了 15 个具有明确职责的 AI 角色工具,涵盖 CEO、设计师、工程经理、QA 等职能。用户只需通过简单的斜杠命令(如 `/review` 进行代码审查、`/qa` 执行测试、`/plan-ceo-review` 规划功能),即可自动化处理从需求分析到部署上线的全链路任务。 所有操作基于 Markdown 和斜杠命令,无需复杂配置,完全免费且遵循 MIT 协议。gstack 不仅是一套工具集,更是一种现代化的软件工厂实践,让单人开发者也能拥有严谨的工程流程。
meilisearch
Meilisearch 是一个开源的极速搜索服务,专为现代应用和网站打造,开箱即用。它能帮助开发者快速集成高质量的搜索功能,无需复杂的配置或额外的数据预处理。传统搜索方案往往需要大量调优才能实现准确结果,而 Meilisearch 内置了拼写容错、同义词识别、即时响应等实用特性,并支持 AI 驱动的混合搜索(结合关键词与语义理解),显著提升用户查找信息的体验。 Meilisearch 特别适合 Web 开发者、产品团队或初创公司使用,尤其适用于需要快速上线搜索功能的场景,如电商网站、内容平台或 SaaS 应用。它提供简洁的 RESTful API 和多种语言 SDK,部署简单,资源占用低,本地开发或生产环境均可轻松运行。对于希望在不依赖大型云服务的前提下,为用户提供流畅、智能搜索体验的团队来说,Meilisearch 是一个高效且友好的选择。
awesome-claude-skills
awesome-claude-skills 是一个精心整理的开源资源库,旨在帮助用户挖掘和扩展 Claude AI 的潜力。它不仅仅是一份列表,更提供了实用的“技能(Skills)”模块,让 Claude 从单纯的文本生成助手,进化为能执行复杂工作流的智能代理。 许多用户在使用 AI 时,常受限于其无法直接操作外部软件或处理特定格式文件的痛点。awesome-claude-skills 通过预设的工作流解决了这一问题:它不仅能教会 Claude 专业地处理 Word、PDF 等文档,进行代码开发与数据分析,还能借助 Composio 插件连接 Slack、邮箱及数百种常用应用,实现发送邮件、创建任务等自动化操作。这使得重复性任务变得标准化且可复用,极大提升了工作效率。 无论是希望优化日常办公流程的普通用户、需要处理复杂文档的研究人员,还是寻求将 AI 深度集成到开发管线中的开发者,都能从中找到适合的解决方案。其独特的技术亮点在于“技能”的可定制性与强大的应用连接能力,让用户无需编写复杂代码,即可通过简单的配置让 Claude 具备跨平台执行真实任务的能力。如果你希望让 Claude
