AIstudioProxyAPI

GitHub
2.2k 385 较难 1 次阅读 今天AGPL-3.0插件
AI 解读 由 AI 自动生成,仅供参考

AIstudioProxyAPI 是一款巧妙的中间层代理服务,旨在将 Google AI Studio 的网页界面转化为标准的 OpenAI 兼容 API。它通过 Camoufox 和 Playwright 技术驱动浏览器自动化,在后台模拟真实用户操作访问 Google AI Studio,并将接收到的请求转发处理,最终以开发者熟悉的 OpenAI 格式返回结果。

这一工具主要解决了无法直接通过 API 密钥调用 Google 最新模型(如 Gemini 系列)或受限于官方 API 配额的问题,让用户能够利用现有的 OpenAI 生态工具链无缝接入 Google 的先进能力。无论是需要快速集成多模型能力的开发者、进行对比实验的研究人员,还是希望在本地的 Open WebUI 等界面中直接使用 Gemini 模型的普通用户,都能从中受益。

其技术亮点在于支持三种灵活的函数调用模式(auto/native/emulated)并具备失败自动回退机制,确保调用的稳定性。此外,它还内置了认证配置文件自动轮转与 Cookie 周期刷新功能,有效维持会话长期可用。项目自带现代化的 Web UI 管理面板,提供直观的状态监控、日志查看及配置调整能力,配合无头模式启动选项,非常适合部署在服务器环境中作为稳定的后端服务使用。

使用场景

某初创团队希望将 Google 最新的 Gemini 2.5 Pro 模型集成到现有的 Open WebUI 知识库系统中,以利用其强大的长上下文处理能力,但团队缺乏官方 API 配额且现有代码库仅兼容 OpenAI 接口标准。

没有 AIstudioProxyAPI 时

  • 接口协议不兼容:开发者需要重写大量后端代码来适配 Google 特有的 REST 格式,无法直接复用基于 OpenAI SDK 构建的应用逻辑。
  • 人工操作繁琐:每次会话需手动打开浏览器登录 Google AI Studio 网页复制响应,无法实现自动化批量处理或流式输出。
  • 连接稳定性差:单一账号高频访问极易触发风控导致 IP 封禁,缺乏自动化的 Cookie 刷新与多账号轮转机制,服务经常中断。
  • 调试黑盒:遇到请求失败时,难以直观查看浏览器内部的自动化执行状态和实时日志,排查问题耗时耗力。

使用 AIstudioProxyAPI 后

  • 无缝平滑迁移:通过启动本地代理服务,直接将 API Base URL 指向 http://127.0.0.1:2048/v1,原有 OpenAI 客户端代码零修改即可调用 Gemini 模型。
  • 全自动化运行:利用 Camoufox + Playwright 后台自动维持浏览器会话,支持无头模式部署在服务器,实现 7x24 小时稳定的流式对话服务。
  • 高可用账号管理:内置认证轮转与 Cookie 周期刷新功能,自动切换多个 Profile 分摊请求压力,显著降低被封号风险并确保持续在线。
  • 可视化运维监控:通过内置的 Web UI 面板实时查看健康状态、日志流及调试信息,快速定位并解决自动化过程中的异常。

AIstudioProxyAPI 成功打破了私有网页模型与标准化开发框架之间的壁垒,让开发者能以最低成本免费、稳定地享用顶尖大模型能力。

运行环境要求

操作系统
  • Linux
  • macOS
  • Windows
GPU

未说明

内存

最低 2GB,推荐 4GB+

依赖
notes该项目是通过浏览器自动化(Camoufox + Playwright)代理 Google AI Studio 网页界面,并非本地运行大模型,因此无需 GPU。需安装 Node.js 用于构建前端,建议使用 Poetry 管理 Python 依赖。首次运行需在调试模式下完成登录认证以保存 Cookie。支持无头模式(headless)在服务器运行,Linux 无 GUI 环境可使用虚拟显示模式。
python>=3.9, <4.0 (推荐 3.10+ / 3.11+)
Poetry
Node.js (LTS)
Camoufox
Playwright
FastAPI
AIstudioProxyAPI hero image

快速开始

AI Studio 代理 API

将 Google AI Studio 网页界面转换为 OpenAI 兼容 API 的代理服务。通过 Camoufox + Playwright 自动化,提供稳定可控的 API 访问。

Star History Chart


主要特性

  • OpenAI 兼容 API:支持 /v1/chat/completions/v1/models
  • 函数调用三模式auto / native / emulated,支持失败回退
  • 认证轮转与 Cookie 刷新:支持 profile 自动轮转、周期刷新与关停保存
  • 启动链路完整:CLI 启动器、内置 Web UI、桌面 GUI 启动器
  • 现代化前端:内置设置页、状态检查与日志能力
  • CI/CD 工作流:PR 检查、Release、Upstream Sync

系统要求

组件 要求 推荐
Python >=3.9, <4.0 3.10+ / 3.11+
依赖管理 Poetry 最新版本
Node.js 前端构建需要 LTS
内存 >=2GB >=4GB

🚀 快速开始

1. 克隆并安装

git clone https://github.com/CJackHwang/AIstudioProxyAPI.git
cd AIstudioProxyAPI
poetry install --with dev

2. 配置环境

cp .env.example .env

建议先确认:PORTSTREAM_PORTUNIFIED_PROXY_CONFIGLAUNCH_MODEFUNCTION_CALLING_MODE

3. 首次认证并启动

# 首次建议 debug,完成登录并保存 auth
poetry run python launch_camoufox.py --debug

# 日常建议 headless
poetry run python launch_camoufox.py --headless

快速测试

# 健康检查
curl http://127.0.0.1:2048/health

# 模型列表
curl http://127.0.0.1:2048/v1/models

# 聊天请求
curl -X POST http://127.0.0.1:2048/v1/chat/completions \
  -H "Content-Type: application/json" \
  -d '{"model":"gemini-2.5-pro","messages":[{"role":"user","content":"你好"}]}'

访问 http://127.0.0.1:2048/ 使用内置 Web UI。


系统架构

graph TD
    subgraph "用户端"
        User["用户"]
        WebUI["Web UI"]
        APIClient["API 客户端"]
    end

    subgraph "启动与配置"
        Launcher["launch_camoufox.py"]
        Env[".env 配置"]
    end

    subgraph "核心服务"
        FastAPI["FastAPI 应用<br/>api_utils/"]
        BrowserOps["页面控制与自动化<br/>browser_utils/"]
        StreamProxy["流式代理<br/>stream/"]
    end

    subgraph "外部依赖"
        Camoufox["Camoufox 浏览器"]
        AIStudio["Google AI Studio"]
    end

    User --> Launcher
    Launcher --> Env
    WebUI --> FastAPI
    APIClient --> FastAPI
    FastAPI --> BrowserOps
    FastAPI --> StreamProxy
    BrowserOps --> Camoufox --> AIStudio
    StreamProxy --> AIStudio

运行模式

命令 说明 场景
python launch_camoufox.py --headless 无头模式 日常使用、服务器
python launch_camoufox.py --debug 调试模式 首次认证、故障排查
python launch_camoufox.py --virtual-display 虚拟显示 Linux 无 GUI 环境

⚙️ 配置

项目使用 .env 统一配置管理:

cp .env.example .env

核心配置示例:

配置 默认值 说明
PORT 2048 主 API 端口
STREAM_PORT 3120 流式代理端口(0 关闭)
UNIFIED_PROXY_CONFIG HTTP/HTTPS 代理
AUTO_ROTATE_AUTH_PROFILE true 认证自动轮转
FUNCTION_CALLING_MODE auto 函数调用模式

详细项见:配置参考

说明:配置默认值以 .env.example 为准;少数配置存在代码兜底默认值,详见配置参考中的说明。


📚 文档


客户端配置示例

以 Open WebUI 为例:

  1. 进入设置 -> 连接
  2. API Base URL 填 http://127.0.0.1:2048/v1
  3. 若你未配置 API Keys,可留空或填任意字符;若已配置,请填写有效 Key
  4. 保存后即可对话

开发检查

poetry run ruff check .
poetry run pyright
poetry run pytest

前端构建:

cd static/frontend
npm ci
npm run build

致谢

License

AGPLv3

支持作者

如果本项目对你有帮助,欢迎支持作者持续开发:

支持作者

版本历史

nightly2026/03/29
v4.1.0_py2026/02/28
v4.0.6_py2026/02/08
v4.0.5_py2026/02/08
v4.0.4_py2026/01/27
v4.0.3_py2025/12/20
v4.0.2_py2025/12/15
v4.0.1_py2025/12/03
v4.0.0_py2025/11/30
v3.7.6_py2025/11/21
v3.7.5_py2025/11/20
v3.7.4_py2025/11/19
v3.7.3_py2025/11/05
v3.7.3_py_Beta2025/11/02
v3.7.2_py2025/10/27
v3.7.1_py2025/10/26
v3.7.0_py2025/10/19
v3.6.21_py2025/09/21
v3.6.17_py2025/09/09
v3.6.16_py2025/09/05

常见问题

相似工具推荐

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程,旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周,包含 26 节精炼课程和 52 道配套测验,内容涵盖从基础概念到实际应用的完整流程,有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。 无论是希望转型的开发者、需要补充算法背景的研究人员,还是对人工智能充满好奇的普通爱好者,都能从中受益。课程不仅提供了清晰的理论讲解,还强调动手实践,让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持,通过自动化机制提供了包括简体中文在内的 50 多种语言版本,极大地降低了全球不同背景用户的学习门槛。此外,项目采用开源协作模式,社区活跃且内容持续更新,确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路,ML-For-Beginners 将是理想的起点。

85k|★★☆☆☆|今天
图像数据工具视频

OpenHands

OpenHands 是一个专注于 AI 驱动开发的开源平台,旨在让智能体(Agent)像人类开发者一样理解、编写和调试代码。它解决了传统编程中重复性劳动多、环境配置复杂以及人机协作效率低等痛点,通过自动化流程显著提升开发速度。 无论是希望提升编码效率的软件工程师、探索智能体技术的研究人员,还是需要快速原型验证的技术团队,都能从中受益。OpenHands 提供了灵活多样的使用方式:既可以通过命令行(CLI)或本地图形界面在个人电脑上轻松上手,体验类似 Devin 的流畅交互;也能利用其强大的 Python SDK 自定义智能体逻辑,甚至在云端大规模部署上千个智能体并行工作。 其核心技术亮点在于模块化的软件智能体 SDK,这不仅构成了平台的引擎,还支持高度可组合的开发模式。此外,OpenHands 在 SWE-bench 基准测试中取得了 77.6% 的优异成绩,证明了其解决真实世界软件工程问题的能力。平台还具备完善的企业级功能,支持与 Slack、Jira 等工具集成,并提供细粒度的权限管理,适合从个人开发者到大型企业的各类用户场景。

70.6k|★★★☆☆|今天
语言模型Agent开发框架

gpt4free

gpt4free 是一个由社区驱动的开源项目,旨在聚合多种可访问的大型语言模型(LLM)和媒体生成接口,让用户能更灵活、便捷地使用前沿 AI 能力。它解决了直接调用各类模型时面临的接口分散、门槛高或成本昂贵等痛点,通过统一的标准将不同提供商的资源整合在一起。 无论是希望快速集成 AI 功能的开发者、需要多模型对比测试的研究人员,还是想免费体验最新技术的普通用户,都能从中受益。gpt4free 提供了丰富的使用方式:既包含易于上手的 Python 和 JavaScript 客户端库,也支持部署本地图形界面(GUI),更提供了兼容 OpenAI 标准的 REST API,方便无缝替换现有应用后端。 其技术亮点在于强大的多提供商支持架构,能够动态调度包括 Opus、Gemini、DeepSeek 等多种主流模型资源,并支持 Docker 一键部署及本地推理。项目秉持社区优先原则,在降低使用门槛的同时,也为贡献者提供了扩展新接口的便利框架,是探索和利用多样化 AI 资源的实用工具。

66k|★★☆☆☆|2天前
插件语言模型Agent

gstack

gstack 是 Y Combinator CEO Garry Tan 亲自开源的一套 AI 工程化配置,旨在将 Claude Code 升级为你的虚拟工程团队。面对单人开发难以兼顾产品战略、架构设计、代码审查及质量测试的挑战,gstack 提供了一套标准化解决方案,帮助开发者实现堪比二十人团队的高效产出。 这套配置特别适合希望提升交付效率的创始人、技术负责人,以及初次尝试 Claude Code 的开发者。gstack 的核心亮点在于内置了 15 个具有明确职责的 AI 角色工具,涵盖 CEO、设计师、工程经理、QA 等职能。用户只需通过简单的斜杠命令(如 `/review` 进行代码审查、`/qa` 执行测试、`/plan-ceo-review` 规划功能),即可自动化处理从需求分析到部署上线的全链路任务。 所有操作基于 Markdown 和斜杠命令,无需复杂配置,完全免费且遵循 MIT 协议。gstack 不仅是一套工具集,更是一种现代化的软件工厂实践,让单人开发者也能拥有严谨的工程流程。

64.3k|★★☆☆☆|今天
Agent插件

meilisearch

Meilisearch 是一个开源的极速搜索服务,专为现代应用和网站打造,开箱即用。它能帮助开发者快速集成高质量的搜索功能,无需复杂的配置或额外的数据预处理。传统搜索方案往往需要大量调优才能实现准确结果,而 Meilisearch 内置了拼写容错、同义词识别、即时响应等实用特性,并支持 AI 驱动的混合搜索(结合关键词与语义理解),显著提升用户查找信息的体验。 Meilisearch 特别适合 Web 开发者、产品团队或初创公司使用,尤其适用于需要快速上线搜索功能的场景,如电商网站、内容平台或 SaaS 应用。它提供简洁的 RESTful API 和多种语言 SDK,部署简单,资源占用低,本地开发或生产环境均可轻松运行。对于希望在不依赖大型云服务的前提下,为用户提供流畅、智能搜索体验的团队来说,Meilisearch 是一个高效且友好的选择。

57k|★★☆☆☆|今天
图像Agent数据工具

awesome-claude-skills

awesome-claude-skills 是一个精心整理的开源资源库,旨在帮助用户挖掘和扩展 Claude AI 的潜力。它不仅仅是一份列表,更提供了实用的“技能(Skills)”模块,让 Claude 从单纯的文本生成助手,进化为能执行复杂工作流的智能代理。 许多用户在使用 AI 时,常受限于其无法直接操作外部软件或处理特定格式文件的痛点。awesome-claude-skills 通过预设的工作流解决了这一问题:它不仅能教会 Claude 专业地处理 Word、PDF 等文档,进行代码开发与数据分析,还能借助 Composio 插件连接 Slack、邮箱及数百种常用应用,实现发送邮件、创建任务等自动化操作。这使得重复性任务变得标准化且可复用,极大提升了工作效率。 无论是希望优化日常办公流程的普通用户、需要处理复杂文档的研究人员,还是寻求将 AI 深度集成到开发管线中的开发者,都能从中找到适合的解决方案。其独特的技术亮点在于“技能”的可定制性与强大的应用连接能力,让用户无需编写复杂代码,即可通过简单的配置让 Claude 具备跨平台执行真实任务的能力。如果你希望让 Claude

51.3k|★★☆☆☆|今天
Agent插件