AIstudioProxyAPI

2.2k 385 较难 1 次阅读今天AGPL-3.0插件

AI 解读由 AI 自动生成，仅供参考

AIstudioProxyAPI 是一款巧妙的中间层代理服务，旨在将 Google AI Studio 的网页界面转化为标准的 OpenAI 兼容 API。它通过 Camoufox 和 Playwright 技术驱动浏览器自动化，在后台模拟真实用户操作访问 Google AI Studio，并将接收到的请求转发处理，最终以开发者熟悉的 OpenAI 格式返回结果。

这一工具主要解决了无法直接通过 API 密钥调用 Google 最新模型（如 Gemini 系列）或受限于官方 API 配额的问题，让用户能够利用现有的 OpenAI 生态工具链无缝接入 Google 的先进能力。无论是需要快速集成多模型能力的开发者、进行对比实验的研究人员，还是希望在本地的 Open WebUI 等界面中直接使用 Gemini 模型的普通用户，都能从中受益。

其技术亮点在于支持三种灵活的函数调用模式（auto/native/emulated）并具备失败自动回退机制，确保调用的稳定性。此外，它还内置了认证配置文件自动轮转与 Cookie 周期刷新功能，有效维持会话长期可用。项目自带现代化的 Web UI 管理面板，提供直观的状态监控、日志查看及配置调整能力，配合无头模式启动选项，非常适合部署在服务器环境中作为稳定的后端服务使用。

使用场景

某初创团队希望将 Google 最新的 Gemini 2.5 Pro 模型集成到现有的 Open WebUI 知识库系统中，以利用其强大的长上下文处理能力，但团队缺乏官方 API 配额且现有代码库仅兼容 OpenAI 接口标准。

没有 AIstudioProxyAPI 时

接口协议不兼容：开发者需要重写大量后端代码来适配 Google 特有的 REST 格式，无法直接复用基于 OpenAI SDK 构建的应用逻辑。
人工操作繁琐：每次会话需手动打开浏览器登录 Google AI Studio 网页复制响应，无法实现自动化批量处理或流式输出。
连接稳定性差：单一账号高频访问极易触发风控导致 IP 封禁，缺乏自动化的 Cookie 刷新与多账号轮转机制，服务经常中断。
调试黑盒：遇到请求失败时，难以直观查看浏览器内部的自动化执行状态和实时日志，排查问题耗时耗力。

使用 AIstudioProxyAPI 后

无缝平滑迁移：通过启动本地代理服务，直接将 API Base URL 指向 http://127.0.0.1:2048/v1，原有 OpenAI 客户端代码零修改即可调用 Gemini 模型。
全自动化运行：利用 Camoufox + Playwright 后台自动维持浏览器会话，支持无头模式部署在服务器，实现 7x24 小时稳定的流式对话服务。
高可用账号管理：内置认证轮转与 Cookie 周期刷新功能，自动切换多个 Profile 分摊请求压力，显著降低被封号风险并确保持续在线。
可视化运维监控：通过内置的 Web UI 面板实时查看健康状态、日志流及调试信息，快速定位并解决自动化过程中的异常。

AIstudioProxyAPI 成功打破了私有网页模型与标准化开发框架之间的壁垒，让开发者能以最低成本免费、稳定地享用顶尖大模型能力。

运行环境要求

操作系统

Linux
macOS
Windows

GPU

未说明

内存

最低 2GB，推荐 4GB+

依赖

notes该项目是通过浏览器自动化（Camoufox + Playwright）代理 Google AI Studio 网页界面，并非本地运行大模型，因此无需 GPU。需安装 Node.js 用于构建前端，建议使用 Poetry 管理 Python 依赖。首次运行需在调试模式下完成登录认证以保存 Cookie。支持无头模式（headless）在服务器运行，Linux 无 GUI 环境可使用虚拟显示模式。

python>=3.9, <4.0 (推荐 3.10+ / 3.11+)

Poetry

Node.js (LTS)

Camoufox

Playwright

FastAPI

快速开始

AI Studio 代理 API

将 Google AI Studio 网页界面转换为 OpenAI 兼容 API 的代理服务。通过 Camoufox + Playwright 自动化，提供稳定可控的 API 访问。

主要特性

OpenAI 兼容 API：支持 /v1/chat/completions、/v1/models
函数调用三模式：auto / native / emulated，支持失败回退
认证轮转与 Cookie 刷新：支持 profile 自动轮转、周期刷新与关停保存
启动链路完整：CLI 启动器、内置 Web UI、桌面 GUI 启动器
现代化前端：内置设置页、状态检查与日志能力
CI/CD 工作流：PR 检查、Release、Upstream Sync

系统要求

组件	要求	推荐
Python	>=3.9, <4.0	3.10+ / 3.11+
依赖管理	Poetry	最新版本
Node.js	前端构建需要	LTS
内存	>=2GB	>=4GB

🚀 快速开始

1. 克隆并安装

git clone https://github.com/CJackHwang/AIstudioProxyAPI.git
cd AIstudioProxyAPI
poetry install --with dev

2. 配置环境

cp .env.example .env

建议先确认：PORT、STREAM_PORT、UNIFIED_PROXY_CONFIG、LAUNCH_MODE、FUNCTION_CALLING_MODE。

3. 首次认证并启动

# 首次建议 debug，完成登录并保存 auth
poetry run python launch_camoufox.py --debug

# 日常建议 headless
poetry run python launch_camoufox.py --headless

快速测试

# 健康检查
curl http://127.0.0.1:2048/health

# 模型列表
curl http://127.0.0.1:2048/v1/models

# 聊天请求
curl -X POST http://127.0.0.1:2048/v1/chat/completions \
  -H "Content-Type: application/json" \
  -d '{"model":"gemini-2.5-pro","messages":[{"role":"user","content":"你好"}]}'

访问 http://127.0.0.1:2048/ 使用内置 Web UI。

系统架构

graph TD
    subgraph "用户端"
        User["用户"]
        WebUI["Web UI"]
        APIClient["API 客户端"]
    end

    subgraph "启动与配置"
        Launcher["launch_camoufox.py"]
        Env[".env 配置"]
    end

    subgraph "核心服务"
        FastAPI["FastAPI 应用<br/>api_utils/"]
        BrowserOps["页面控制与自动化<br/>browser_utils/"]
        StreamProxy["流式代理<br/>stream/"]
    end

    subgraph "外部依赖"
        Camoufox["Camoufox 浏览器"]
        AIStudio["Google AI Studio"]
    end

    User --> Launcher
    Launcher --> Env
    WebUI --> FastAPI
    APIClient --> FastAPI
    FastAPI --> BrowserOps
    FastAPI --> StreamProxy
    BrowserOps --> Camoufox --> AIStudio
    StreamProxy --> AIStudio

运行模式

命令	说明	场景
`python launch_camoufox.py --headless`	无头模式	日常使用、服务器
`python launch_camoufox.py --debug`	调试模式	首次认证、故障排查
`python launch_camoufox.py --virtual-display`	虚拟显示	Linux 无 GUI 环境

⚙️ 配置

项目使用 .env 统一配置管理：

cp .env.example .env

核心配置示例：

配置	默认值	说明
`PORT`	`2048`	主 API 端口
`STREAM_PORT`	`3120`	流式代理端口（`0` 关闭）
`UNIFIED_PROXY_CONFIG`	空	HTTP/HTTPS 代理
`AUTO_ROTATE_AUTH_PROFILE`	`true`	认证自动轮转
`FUNCTION_CALLING_MODE`	`auto`	函数调用模式

详细项见：配置参考

说明：配置默认值以 .env.example 为准；少数配置存在代码兜底默认值，详见配置参考中的说明。

📚 文档

客户端配置示例

以 Open WebUI 为例：

进入设置 -> 连接
API Base URL 填 http://127.0.0.1:2048/v1
若你未配置 API Keys，可留空或填任意字符；若已配置，请填写有效 Key
保存后即可对话

开发检查

poetry run ruff check .
poetry run pyright
poetry run pytest

前端构建：

cd static/frontend
npm ci
npm run build

致谢

项目发起与主要开发: @CJackHwang
核心维护（架构重构、测试体系）: @NikkeTryHard
功能完善、页面操作优化: @ayuayue
实时流式功能优化: @luispater
项目重构贡献: @yattin（Holt）
下游维护分支致谢作者: @MasuRii
社区支持: Linux.do 社区

License

AGPLv3

支持作者

如果本项目对你有帮助，欢迎支持作者持续开发：

支持作者

AIstudioProxyAPI 快速上手指南

本指南帮助中国开发者快速部署并使用 AIstudioProxyAPI，将 Google AI Studio 网页界面转换为兼容 OpenAI 格式的 API 服务。

1. 环境准备

在开始之前，请确保您的系统满足以下要求：

操作系统：Linux, macOS 或 Windows
Python：版本 >= 3.9 (推荐 3.10 或 3.11)
依赖管理工具：Poetry (必须安装最新版)
Node.js：LTS 版本 (用于前端构建，若仅运行后端可忽略，但建议安装)
内存：至少 2GB (推荐 4GB 以上)

提示：国内用户安装 Poetry 或 Node.js 时，如遇网络缓慢，建议配置国内镜像源或使用代理加速。

2. 安装步骤

第一步：克隆项目

git clone https://github.com/CJackHwang/AIstudioProxyAPI.git
cd AIstudioProxyAPI

第二步：安装依赖

使用 Poetry 安装项目所需依赖（包含开发依赖以确保完整性）：

poetry install --with dev

国内加速提示：若 poetry install 下载缓慢，可临时配置 PyPI 国内源：
poetry config pypi-url.pypi https://pypi.tuna.tsinghua.edu.cn/simple/

第三步：配置环境变量

复制示例配置文件并生成 .env 文件：

cp .env.example .env

注：大多数情况下可直接使用默认配置启动，如需修改端口或代理，请编辑 .env 文件。

3. 基本使用

首次启动与认证

首次运行需要打开浏览器进行 Google 账号登录以获取授权。请使用 --debug 模式启动：

poetry run python launch_camoufox.py --debug

脚本会自动启动浏览器窗口。
在弹出的浏览器中登录您的 Google 账号并进入 AI Studio。
登录成功后，程序会自动保存认证信息（Cookie/Profile）。
按 Ctrl+C 停止当前进程。

日常运行

完成首次认证后，建议使用无头模式（后台运行）启动服务：

poetry run python launch_camoufox.py --headless

服务默认启动在 http://127.0.0.1:2048。

快速测试

使用 curl 命令验证服务是否正常运行：

1. 健康检查

curl http://127.0.0.1:2048/health

2. 获取模型列表

curl http://127.0.0.1:2048/v1/models

3. 发送聊天请求

curl -X POST http://127.0.0.1:2048/v1/chat/completions \
  -H "Content-Type: application/json" \
  -d '{"model":"gemini-2.5-pro","messages":[{"role":"user","content":"你好"}]}'

接入客户端

您可以将此服务作为 OpenAI 兼容接口接入任意支持该协议的客户端（如 Open WebUI, LangChain 等）：

API Base URL: http://127.0.0.1:2048/v1
API Key: 可留空或填写任意字符（除非您在 .env 中强制开启了密钥验证）
模型名称: 填写支持的 Gemini 模型，例如 gemini-2.5-pro

您也可以通过浏览器访问 http://127.0.0.1:2048/ 使用内置的 Web UI 进行调试和状态查看。

版本历史

nightly2026/03/29

v4.1.0_py2026/02/28

v4.0.6_py2026/02/08

v4.0.5_py2026/02/08

v4.0.4_py2026/01/27

v4.0.3_py2025/12/20

v4.0.2_py2025/12/15

v4.0.1_py2025/12/03

v4.0.0_py2025/11/30

v3.7.6_py2025/11/21

v3.7.5_py2025/11/20

v3.7.4_py2025/11/19

v3.7.3_py2025/11/05

v3.7.3_py_Beta2025/11/02

v3.7.2_py2025/10/27

v3.7.1_py2025/10/26

v3.7.0_py2025/10/19

v3.6.21_py2025/09/21

v3.6.17_py2025/09/09

v3.6.16_py2025/09/05

常见问题

启动时遇到 SSL 证书错误（SEC_ERROR_UNKNOWN_ISSUER）导致无法连接 aistudio.google.com 怎么办？

在 macOS 上如何关闭已启动的项目进程？

v3.1.0 版本日志卡在“等待响应”但页面已有输出，或者运行一段时间后卡死如何解决？

AI Studio 网页端有返回信息，但本地 API (http://127.0.0.1:2048/) 一直卡住无返回且提示超时怎么办？

启动失败提示“核心输入区域未在预期时间内变为可见”如何解决？

Gemini 2.5 Pro 模型在 Roo Code 中使用时反复重新开页、速度慢且效果不佳，有优化方案吗？

Ubuntu 18 上无法构建 Docker 镜像，是否有预编译的 Docker 镜像可用？

相似工具推荐

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程，旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周，包含 26 节精炼课程和 52 道配套测验，内容涵盖从基础概念到实际应用的完整流程，有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。无论是希望转型的开发者、需要补充算法背景的研究人员，还是对人工智能充满好奇的普通爱好者，都能从中受益。课程不仅提供了清晰的理论讲解，还强调动手实践，让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持，通过自动化机制提供了包括简体中文在内的 50 多种语言版本，极大地降低了全球不同背景用户的学习门槛。此外，项目采用开源协作模式，社区活跃且内容持续更新，确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路，ML-For-Beginners 将是理想的起点。

★ 85k|★★☆☆☆|今天

图像数据工具视频

OpenHands

OpenHands 是一个专注于 AI 驱动开发的开源平台，旨在让智能体（Agent）像人类开发者一样理解、编写和调试代码。它解决了传统编程中重复性劳动多、环境配置复杂以及人机协作效率低等痛点，通过自动化流程显著提升开发速度。无论是希望提升编码效率的软件工程师、探索智能体技术的研究人员，还是需要快速原型验证的技术团队，都能从中受益。OpenHands 提供了灵活多样的使用方式：既可以通过命令行（CLI）或本地图形界面在个人电脑上轻松上手，体验类似 Devin 的流畅交互；也能利用其强大的 Python SDK 自定义智能体逻辑，甚至在云端大规模部署上千个智能体并行工作。其核心技术亮点在于模块化的软件智能体 SDK，这不仅构成了平台的引擎，还支持高度可组合的开发模式。此外，OpenHands 在 SWE-bench 基准测试中取得了 77.6% 的优异成绩，证明了其解决真实世界软件工程问题的能力。平台还具备完善的企业级功能，支持与 Slack、Jira 等工具集成，并提供细粒度的权限管理，适合从个人开发者到大型企业的各类用户场景。

★ 70.6k|★★★☆☆|今天

语言模型Agent开发框架

gpt4free

gpt4free 是一个由社区驱动的开源项目，旨在聚合多种可访问的大型语言模型（LLM）和媒体生成接口，让用户能更灵活、便捷地使用前沿 AI 能力。它解决了直接调用各类模型时面临的接口分散、门槛高或成本昂贵等痛点，通过统一的标准将不同提供商的资源整合在一起。无论是希望快速集成 AI 功能的开发者、需要多模型对比测试的研究人员，还是想免费体验最新技术的普通用户，都能从中受益。gpt4free 提供了丰富的使用方式：既包含易于上手的 Python 和 JavaScript 客户端库，也支持部署本地图形界面（GUI），更提供了兼容 OpenAI 标准的 REST API，方便无缝替换现有应用后端。其技术亮点在于强大的多提供商支持架构，能够动态调度包括 Opus、Gemini、DeepSeek 等多种主流模型资源，并支持 Docker 一键部署及本地推理。项目秉持社区优先原则，在降低使用门槛的同时，也为贡献者提供了扩展新接口的便利框架，是探索和利用多样化 AI 资源的实用工具。

★ 66k|★★☆☆☆|2天前

插件语言模型Agent

gstack

gstack 是 Y Combinator CEO Garry Tan 亲自开源的一套 AI 工程化配置，旨在将 Claude Code 升级为你的虚拟工程团队。面对单人开发难以兼顾产品战略、架构设计、代码审查及质量测试的挑战，gstack 提供了一套标准化解决方案，帮助开发者实现堪比二十人团队的高效产出。这套配置特别适合希望提升交付效率的创始人、技术负责人，以及初次尝试 Claude Code 的开发者。gstack 的核心亮点在于内置了 15 个具有明确职责的 AI 角色工具，涵盖 CEO、设计师、工程经理、QA 等职能。用户只需通过简单的斜杠命令（如 `/review` 进行代码审查、`/qa` 执行测试、`/plan-ceo-review` 规划功能），即可自动化处理从需求分析到部署上线的全链路任务。所有操作基于 Markdown 和斜杠命令，无需复杂配置，完全免费且遵循 MIT 协议。gstack 不仅是一套工具集，更是一种现代化的软件工厂实践，让单人开发者也能拥有严谨的工程流程。

★ 64.3k|★★☆☆☆|今天

Agent插件

meilisearch

Meilisearch 是一个开源的极速搜索服务，专为现代应用和网站打造，开箱即用。它能帮助开发者快速集成高质量的搜索功能，无需复杂的配置或额外的数据预处理。传统搜索方案往往需要大量调优才能实现准确结果，而 Meilisearch 内置了拼写容错、同义词识别、即时响应等实用特性，并支持 AI 驱动的混合搜索（结合关键词与语义理解），显著提升用户查找信息的体验。 Meilisearch 特别适合 Web 开发者、产品团队或初创公司使用，尤其适用于需要快速上线搜索功能的场景，如电商网站、内容平台或 SaaS 应用。它提供简洁的 RESTful API 和多种语言 SDK，部署简单，资源占用低，本地开发或生产环境均可轻松运行。对于希望在不依赖大型云服务的前提下，为用户提供流畅、智能搜索体验的团队来说，Meilisearch 是一个高效且友好的选择。

★ 57k|★★☆☆☆|今天

图像Agent数据工具

awesome-claude-skills

awesome-claude-skills 是一个精心整理的开源资源库，旨在帮助用户挖掘和扩展 Claude AI 的潜力。它不仅仅是一份列表，更提供了实用的“技能（Skills）”模块，让 Claude 从单纯的文本生成助手，进化为能执行复杂工作流的智能代理。许多用户在使用 AI 时，常受限于其无法直接操作外部软件或处理特定格式文件的痛点。awesome-claude-skills 通过预设的工作流解决了这一问题：它不仅能教会 Claude 专业地处理 Word、PDF 等文档，进行代码开发与数据分析，还能借助 Composio 插件连接 Slack、邮箱及数百种常用应用，实现发送邮件、创建任务等自动化操作。这使得重复性任务变得标准化且可复用，极大提升了工作效率。无论是希望优化日常办公流程的普通用户、需要处理复杂文档的研究人员，还是寻求将 AI 深度集成到开发管线中的开发者，都能从中找到适合的解决方案。其独特的技术亮点在于“技能”的可定制性与强大的应用连接能力，让用户无需编写复杂代码，即可通过简单的配置让 Claude 具备跨平台执行真实任务的能力。如果你希望让 Claude

★ 51.3k|★★☆☆☆|今天

Agent插件